Claude 3.7 Sonnet Technické specifikace a přehled

Claude 3.7 Sonnet

Komentáře: 0

Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.

4934

979

Pozice v celkovém hodnocení k datu
Červenec 2026

Hodnocení uživatelů
https://compare-ai.foundtt.com

Přehled modelu

Webová stránka Webová stránka AI modelu	Open
Poskytovatel Subjekt, který poskytuje tento model.	Anthropic
Chat Zadejte zprávu a začněte chatovat	-
Datum vydání Kdy byl model poprvé vydán.	1 rok ago Úno 24, 2025
Modality Typy dat, která tento model dokáže zpracovat	text ? obrázky ?
Poskytovatelé API Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.)	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí Kdy byly poslední aktualizace znalostí modelu.	-
Open Source Zda je kód modelu k dispozici pro veřejné použití.	Ne
Cena za vstup Cena za zpracování tokenů ve vašich výzvách	$3.00 na milion tokenů
Cena za výstup Cena za tokeny generované modelem	$15.00 na milion tokenů
MMLU Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších	Není k dispozici
MMLU-Pro Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy	Není k dispozici
MMMU Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem	71.8% Zdroj
HellaSwag Náročný benchmark pro dokončení vět	Není k dispozici
HumanEval Hodnotí schopnosti generování kódu a řešení problémů	Není k dispozici
MATH Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti	82.2% Zdroj
GPQA Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost	68% Diamond Zdroj
IFEval Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly	90.8% Zdroj
SimpleQA Hodnocení přesnosti jednoduchých otázek	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Vícejazyčný programovací benchmark.	-
LiveCodeBench v5 Benchmark pro programování v reálném čase	-
Global MMLU (Lite) Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni.	-
MathVista Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech	-
Mobilní aplikace	Google Play Apple Apps
VideoGameBench ?
Celkové skóre	0%
Doom II	0%
Dream DX	0%
Awakening DX	0%
Civilization I	0%
Pokemon Crystal	0%
The Need for Speed	0%
The Incredible Machine	0%
Secret Game 1	0%
Secret Game 2	0%
Secret Game 3	0%

Claude 3.7 Sonnet Specifikace, recenze a porovnání

Claude 3.7 Sonnet

Přehled modelu

VideoGameBench ?

Přidat komentář

Porovnat LLM