Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet je doteraz najpokročilejší model AI od spoločnosti Anthropic a prvý hybridný systém na uvažovanie na trhu. Ponúka štandardný aj rozšírený režim myslenia, pričom druhý z nich poskytuje transparentné, krok za krokom vysvetlené uvažovanie. Model vykazuje významné vylepšenia v kódovaní a vývoji front-endu webových aplikácií, dosahuje špičkové výsledky v testoch SWE-bench Verified a TAU-bench. Dostupné cez Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový štandard pre inteligentné riešenie problémov poháňané AI.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, vytvorený spoločnosťou Meta, je viacjazyčný veľký jazykový model špeciálne doladený na úlohy založené na inštrukciách a optimalizovaný pre konverzačné aplikácie. Dokáže spracovávať a generovať text vo viacerých jazykoch, pričom jeho kontextové okno podporuje až 128 000 tokenov. Uvedený na trh 6. decembra 2024, model prekonáva mnohé open-source aj proprietárne chatboty v rôznych priemyselných benchmarkoch. Využíva Grouped-Query Attention (GQA) na zlepšenie škálovateľnosti a bol trénovaný na rôznorodej množine dát obsahujúcej viac ako 15 biliónov tokenov z verejne dostupných zdrojov. Znalosti modelu sú aktuálne k decembru 2023.

Claude 3.7 Sonnet - Extended ThinkingLlama 3.3 70B Instruct
Webová stránka ?
Poskytovateľ ?
Chat ?
Dátum vydania ?
Modality ?
text ?
obrázky ?
text ?
Poskytovatelia API ?
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Fireworks, Together, DeepInfra, Hyperbolic
Dátum zastarania vedomostí ?
-
12.2024
Open Source ?
Nie
Áno
Cena za vstup ?
$3.00 za milión tokenov
$0.23 za milión tokenov
Cena za výstup ?
$15.00 za milión tokenov
$0.40 za milión tokenov
MMLU ?
Nie je k dispozícii
86%
0-shot, CoT
Zdroj
MMLU-Pro ?
Nie je k dispozícii
68.9%
5-shot, CoT
Zdroj
MMMU ?
75%
Zdroj
Nie je k dispozícii
HellaSwag ?
Nie je k dispozícii
Nie je k dispozícii
HumanEval ?
Nie je k dispozícii
88.4%
pass@1
Zdroj
MATH ?
96.2%
Zdroj
77%
0-shot, CoT
Zdroj
GPQA ?
84.8%
Diamond
Zdroj
50.5%
0-shot, CoT
Zdroj
IFEval ?
93.2%
Zdroj
92.1%
Zdroj
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilná aplikácia
-

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.