Claude Sonnet 4 Technické specifikace a přehled

Claude Sonnet 4

Komentáře: 0

3409

961

Pozice v celkovém hodnocení k datu
Červenec 2026

Hodnocení uživatelů
https://compare-ai.foundtt.com

3.9

Přehled modelu

Webová stránka Webová stránka AI modelu	Open
Poskytovatel Subjekt, který poskytuje tento model.	Anthropic
Chat Zadejte zprávu a začněte chatovat	Open
Datum vydání Kdy byl model poprvé vydán.	1 rok ago Kvě 22, 2025
Modality Typy dat, která tento model dokáže zpracovat	text ? obrázky ?
Poskytovatelé API Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.)	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Datum uzávěrky znalostí Kdy byly poslední aktualizace znalostí modelu.	Neznámý
Open Source Zda je kód modelu k dispozici pro veřejné použití.	Ne
Cena za vstup Cena za zpracování tokenů ve vašich výzvách	$3 na milion tokenů
Cena za výstup Cena za tokeny generované modelem	$15 na milion tokenů
MMLU Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších	86.5% Zdroj
MMLU-Pro Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy	-
MMMU Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem	74.4% Zdroj
HellaSwag Náročný benchmark pro dokončení vět	-
HumanEval Hodnotí schopnosti generování kódu a řešení problémů	-
MATH Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti	-
GPQA Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost	75.4% Diamond Zdroj
IFEval Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly	-
SimpleQA Hodnocení přesnosti jednoduchých otázek	-
AIME 2024	-
AIME 2025	75.5% Zdroj
Aider Polyglot Vícejazyčný programovací benchmark.	-
LiveCodeBench v5 Benchmark pro programování v reálném čase	-
Global MMLU (Lite) Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni.	-
MathVista Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech	-
Mobilní aplikace	Google Play Apple Apps

Claude Sonnet 4 Specifikace, recenze a porovnání

Claude Sonnet 4

Přehled modelu

Přidat komentář

Porovnat LLM