Claude 3.7 Sonnet je doteraz najpokročilejší model AI od spoločnosti Anthropic a prvý hybridný systém na uvažovanie na trhu. Ponúka štandardný aj rozšírený režim myslenia, pričom druhý z nich poskytuje transparentné, krok za krokom vysvetlené uvažovanie. Model vykazuje významné vylepšenia v kódovaní a vývoji front-endu webových aplikácií, dosahuje špičkové výsledky v testoch SWE-bench Verified a TAU-bench. Dostupné cez Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový štandard pre inteligentné riešenie problémov poháňané AI.
„Llama 3.3 70B Instruct“, vytvorený spoločnosťou Meta, je viacjazyčný veľký jazykový model špeciálne doladený na úlohy založené na inštrukciách a optimalizovaný pre konverzačné aplikácie. Dokáže spracovávať a generovať text vo viacerých jazykoch, pričom jeho kontextové okno podporuje až 128 000 tokenov. Uvedený na trh 6. decembra 2024, model prekonáva mnohé open-source aj proprietárne chatboty v rôznych priemyselných benchmarkoch. Využíva Grouped-Query Attention (GQA) na zlepšenie škálovateľnosti a bol trénovaný na rôznorodej množine dát obsahujúcej viac ako 15 biliónov tokenov z verejne dostupných zdrojov. Znalosti modelu sú aktuálne k decembru 2023.
Claude 3.7 Sonnet - Extended Thinking | Llama 3.3 70B Instruct | |
---|---|---|
Poskytovateľ | ||
Webová stránka | ||
Dátum vydania | Feb 24, 2025 1 mesiac ago | Dec 06, 2024 4 mesiace ago |
Modality | text obrázky | text |
Poskytovatelia API | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | Fireworks, Together, DeepInfra, Hyperbolic |
Dátum zastarania vedomostí | - | 12.2024 |
Open Source | Nie | Áno |
Cena za vstup | $3.00 za milión tokenov | $0.23 za milión tokenov |
Cena za výstup | $15.00 za milión tokenov | $0.40 za milión tokenov |
MMLU | Nie je k dispozícii | 86% 0-shot, CoT Zdroj |
MMLU Pro | Nie je k dispozícii | 68.9% 5-shot, CoT Zdroj |
MMMU | 75% Zdroj | Nie je k dispozícii |
HellaSwag | Nie je k dispozícii | Nie je k dispozícii |
HumanEval | Nie je k dispozícii | 88.4% pass@1 Zdroj |
MATH | 96.2% Zdroj | 77% 0-shot, CoT Zdroj |
GPQA | 84.8% Diamond Zdroj | 50.5% 0-shot, CoT Zdroj |
IFEval | 93.2% Zdroj | 92.1% Zdroj |
Mobilná aplikácia | - |
Compare AI. Test. Benchmarks. Chatboty pre mobilné aplikácie, Sketch
Copyright © 2025 All Right Reserved.