Claude 3.7 Sonnet

Komentáře: 0
Claude 3.7 Sonnet #0
Claude 3.7 Sonnet #1
Claude 3.7 Sonnet #2
Claude 3.7 Sonnet #3

Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.

4934
979

Pozice v celkovém hodnocení k datu
Červen 2026
24
Hodnocení uživatelů
https://compare-ai.foundtt.com
4

Přehled modelu

Webová stránka
Webová stránka AI modelu
Poskytovatel
Subjekt, který poskytuje tento model.
Chat
Zadejte zprávu a začněte chatovat
-
Datum vydání
Kdy byl model poprvé vydán.
1 rok ago
Úno 24, 2025
Modality
Typy dat, která tento model dokáže zpracovat
text ?
obrázky ?
Poskytovatelé API
Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.)
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí
Kdy byly poslední aktualizace znalostí modelu.
-
Open Source
Zda je kód modelu k dispozici pro veřejné použití.
Ne
Cena za vstup
Cena za zpracování tokenů ve vašich výzvách
$3.00 na milion tokenů
Cena za výstup
Cena za tokeny generované modelem
$15.00 na milion tokenů
MMLU
Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších
Není k dispozici
MMLU-Pro
Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy
Není k dispozici
MMMU
Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem
71.8%
Zdroj
HellaSwag
Náročný benchmark pro dokončení vět
Není k dispozici
HumanEval
Hodnotí schopnosti generování kódu a řešení problémů
Není k dispozici
MATH
Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti
82.2%
Zdroj
GPQA
Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost
68%
Diamond
Zdroj
IFEval
Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly
90.8%
Zdroj
SimpleQA
Hodnocení přesnosti jednoduchých otázek
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Vícejazyčný programovací benchmark.
-
LiveCodeBench v5
Benchmark pro programování v reálném čase
-
Global MMLU (Lite)
Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni.
-
MathVista
Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech
-
Mobilní aplikace

VideoGameBench ?

Celkové skóre0%
Doom II0%
Dream DX0%
Awakening DX0%
Civilization I0%
Pokemon Crystal0%
The Need for Speed0%
The Incredible Machine0%
Secret Game 10%
Secret Game 20%
Secret Game 30%

Přidat komentář

Porovnat LLM


10%
Naše stránky používají soubory cookie.

Zásady ochrany osobních údajů a souborů cookie: Tento web používá soubory cookie. Dalším používáním webu souhlasíte s jejich používáním.