




Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.
Webová stránka Webová stránka AI modelu | |
Poskytovatel Subjekt, který poskytuje tento model. | |
Chat Zadejte zprávu a začněte chatovat | - |
Datum vydání Kdy byl model poprvé vydán. | 1 rok ago Úno 24, 2025 |
Modality Typy dat, která tento model dokáže zpracovat | text obrázky |
Poskytovatelé API Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.) | Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI |
Datum uzávěrky znalostí Kdy byly poslední aktualizace znalostí modelu. | - |
Open Source Zda je kód modelu k dispozici pro veřejné použití. | Ne |
Cena za vstup Cena za zpracování tokenů ve vašich výzvách | $3.00 na milion tokenů |
Cena za výstup Cena za tokeny generované modelem | $15.00 na milion tokenů |
MMLU Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších | Není k dispozici |
MMLU-Pro Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy | Není k dispozici |
MMMU Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem | 71.8% Zdroj |
HellaSwag Náročný benchmark pro dokončení vět | Není k dispozici |
HumanEval Hodnotí schopnosti generování kódu a řešení problémů | Není k dispozici |
MATH Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti | 82.2% Zdroj |
GPQA Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost | 68% Diamond Zdroj |
IFEval Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly | 90.8% Zdroj |
SimpleQA Hodnocení přesnosti jednoduchých otázek | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Vícejazyčný programovací benchmark. | - |
LiveCodeBench v5 Benchmark pro programování v reálném čase | - |
Global MMLU (Lite) Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni. | - |
MathVista Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech | - |
Mobilní aplikace | |
VideoGameBench | |
| Celkové skóre | 0% |
| Doom II | 0% |
| Dream DX | 0% |
| Awakening DX | 0% |
| Civilization I | 0% |
| Pokemon Crystal | 0% |
| The Need for Speed | 0% |
| The Incredible Machine | 0% |
| Secret Game 1 | 0% |
| Secret Game 2 | 0% |
| Secret Game 3 | 0% |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2026 All Right Reserved.