Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet je dosud nejpokročilejší model AI od Anthropic a první hybridní systém pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vykazuje významná vylepšení v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů poháněné AI.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, vytvořený společností Meta, je vícejazyčný velký jazykový model speciálně vyladěný pro úlohy založené na instrukcích a optimalizovaný pro konverzační aplikace. Je schopen zpracovávat a generovat text v několika jazycích s kontextovým oknem podporujícím až 128 000 tokenů. Uvedený na trh 6. prosince 2024, model překonává řadu open-source i proprietárních chatbotů v různých průmyslových srovnávacích testech. Využívá Grouped-Query Attention (GQA) ke zlepšení škálovatelnosti a byl natrénován na různorodé množině dat obsahující více než 15 bilionů tokenů z veřejně dostupných zdrojů. Znalosti modelu jsou aktuální k prosinci 2023.

Claude 3.7 Sonnet - Extended ThinkingLlama 3.3 70B Instruct
Webová stránka ?
Poskytovatel ?
Chat ?
Datum vydání ?
Modality ?
text ?
obrázky ?
text ?
Poskytovatelé API ?
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Fireworks, Together, DeepInfra, Hyperbolic
Datum uzávěrky znalostí ?
-
12.2024
Open Source ?
Ne
Ano
Cena za vstup ?
$3.00 na milion tokenů
$0.23 na milion tokenů
Cena za výstup ?
$15.00 na milion tokenů
$0.40 na milion tokenů
MMLU ?
Není k dispozici
86%
0-shot, CoT
Zdroj
MMLU-Pro ?
Není k dispozici
68.9%
5-shot, CoT
Zdroj
MMMU ?
75%
Zdroj
Není k dispozici
HellaSwag ?
Není k dispozici
Není k dispozici
HumanEval ?
Není k dispozici
88.4%
pass@1
Zdroj
MATH ?
96.2%
Zdroj
77%
0-shot, CoT
Zdroj
GPQA ?
84.8%
Diamond
Zdroj
50.5%
0-shot, CoT
Zdroj
IFEval ?
93.2%
Zdroj
92.1%
Zdroj
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilní aplikace
-

Porovnat LLM

Přidat komentář


10%
Naše stránky používají soubory cookie.

Zásady ochrany osobních údajů a souborů cookie: Tento web používá soubory cookie. Dalším používáním webu souhlasíte s jejich používáním.