Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.
„Llama 3.3 70B Instruct“, vytvořený společností Meta, je vícejazyčný velký jazykový model speciálně vyladěný pro úlohy založené na instrukcích a optimalizovaný pro konverzační aplikace. Je schopen zpracovávat a generovat text v několika jazycích s kontextovým oknem podporujícím až 128 000 tokenů. Uvedený na trh 6. prosince 2024, model překonává řadu open-source i proprietárních chatbotů v různých průmyslových srovnávacích testech. Využívá Grouped-Query Attention (GQA) ke zlepšení škálovatelnosti a byl natrénován na různorodé množině dat obsahující více než 15 bilionů tokenů z veřejně dostupných zdrojů. Znalosti modelu jsou aktuální k prosinci 2023.
Claude 3.7 Sonnet | Llama 3.3 70B Instruct | |
---|---|---|
Poskytovatel | ||
Webová stránka | ||
Datum vydání | Feb 24, 2025 1 měsíc ago | Dec 06, 2024 4 měsíce ago |
Modality | text obrázky | text |
Poskytovatelé API | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | Fireworks, Together, DeepInfra, Hyperbolic |
Datum uzávěrky znalostí | - | 12.2024 |
Open Source | Ne | Ano |
Cena za vstup | $3.00 na milion tokenů | $0.23 na milion tokenů |
Cena za výstup | $15.00 na milion tokenů | $0.40 na milion tokenů |
MMLU | Není k dispozici | 86% 0-shot, CoT Zdroj |
MMLU Pro | Není k dispozici | 68.9% 5-shot, CoT Zdroj |
MMMU | 71.8% Zdroj | Není k dispozici |
HellaSwag | Není k dispozici | Není k dispozici |
HumanEval | Není k dispozici | 88.4% pass@1 Zdroj |
MATH | 82.2% Zdroj | 77% 0-shot, CoT Zdroj |
GPQA | 68% Diamond Zdroj | 50.5% 0-shot, CoT Zdroj |
IFEval | 90.8% Zdroj | 92.1% Zdroj |
Mobilní aplikace | - |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2025 All Right Reserved.