Claude Sonnet 4

Komentáře: 0
Claude Sonnet 4 #0
Claude Sonnet 4 #1
3409
961

Pozice v celkovém hodnocení k datu
Červen 2026
32
Hodnocení uživatelů
https://compare-ai.foundtt.com
3.9

Přehled modelu

Webová stránka
Webová stránka AI modelu
Poskytovatel
Subjekt, který poskytuje tento model.
Chat
Zadejte zprávu a začněte chatovat
Datum vydání
Kdy byl model poprvé vydán.
1 rok ago
Kvě 22, 2025
Modality
Typy dat, která tento model dokáže zpracovat
text ?
obrázky ?
Poskytovatelé API
Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.)
Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Datum uzávěrky znalostí
Kdy byly poslední aktualizace znalostí modelu.
Neznámý
Open Source
Zda je kód modelu k dispozici pro veřejné použití.
Ne
Cena za vstup
Cena za zpracování tokenů ve vašich výzvách
$3 na milion tokenů
Cena za výstup
Cena za tokeny generované modelem
$15 na milion tokenů
MMLU
Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších
86.5%
Zdroj
MMLU-Pro
Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy
-
MMMU
Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem
74.4%
Zdroj
HellaSwag
Náročný benchmark pro dokončení vět
-
HumanEval
Hodnotí schopnosti generování kódu a řešení problémů
-
MATH
Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti
-
GPQA
Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost
75.4%
Diamond
Zdroj
IFEval
Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly
-
SimpleQA
Hodnocení přesnosti jednoduchých otázek
-
AIME 2024
-
AIME 2025
75.5%
Zdroj
Aider Polyglot
Vícejazyčný programovací benchmark.
-
LiveCodeBench v5
Benchmark pro programování v reálném čase
-
Global MMLU (Lite)
Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni.
-
MathVista
Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech
-
Mobilní aplikace

Přidat komentář

Porovnat LLM


10%
Naše stránky používají soubory cookie.

Zásady ochrany osobních údajů a souborů cookie: Tento web používá soubory cookie. Dalším používáním webu souhlasíte s jejich používáním.