Claude Sonnet 4 AI Műszaki Specifikációk és Értékelés

Claude Sonnet 4

Hozzászólások: 0

3409

961

Helyezés az összesített rangsorban dátummal Június 2026

Felhasználói értékelés https://compare-ai.foundtt.com

3.9

Modell Áttekintés

Weboldal AI Modell Weboldal	Open
Szolgáltató A modellt biztosító entitás.	Anthropic
Csevegés Írjon be egy üzenetet a csevegés megkezdéséhez	Open
Kiadási Dátum Mikor jelent meg a modell először.	1 év ago Máj 22, 2025
Modalitások A modell által feldolgozható adattípusok	szöveg ? képek ?
API Szolgáltatók A modellt kínáló szolgáltatók. (Ez nem egy teljes lista.)	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Tudás Befejezési Dátuma Utoljára mikor frissült a modell tudása.	Ismeretlen
Nyílt Forráskódú A modell kódja nyilvánosan használható-e.	Nem
Bemeneti Árazás A promptokban feldolgozott tokenek költsége	$3 millió tokenenként
Kimeneti Árazás A modell által generált tokenek költsége	$15 millió tokenenként
MMLU Massive Multitask Language Understanding – 57 tantárgyban teszteli a tudást, beleértve a matematikát, történelmet, jogot és egyebeket	86.5% Forrás
MMLU-Pro Egy robusztusabb MMLU benchmark nehezebb, gondolkodásra összpontosító kérdésekkel, nagyobb választási lehetőségekkel és csökkentett prompt érzékenységgel	-
MMMU Massive Multitask Multimodal Understanding – Teszteli a megértést szöveg, kép, hang és videó terén	74.4% Forrás
HellaSwag Egy kihívást jelentő mondatkiegészítési benchmark	-
HumanEval Értékeli a kódgenerálás és problémamegoldó képességeket	-
MATH Különböző nehézségi szinteken teszteli a matematikai problémamegoldó képességeket	-
GPQA Doktori szintű tudást tesztel kémiában, biológiában és fizikában, több választós kérdéseken keresztül, amelyek mély szakmai tudást igényelnek	75.4% Diamond Forrás
IFEval Teszteli a modell képességét, hogy pontosan kövesse az explicit formázási utasításokat, megfelelő kimeneteket generáljon, és következetesen betartsa az utasításokat különböző feladatok során	-
SimpleQA Egyszerű kérdések pontosságának értékelése	-
AIME 2024	-
AIME 2025	75.5% Forrás
Aider Polyglot Többnyelvű programozási benchmark.	-
LiveCodeBench v5 Valós idejű programozási benchmark	-
Global MMLU (Lite) A benchmark egyszerűsített verziója a modellek globális szintű univerzalitásának értékelésére.	-
MathVista Értékeli az AI modellek matematikai következtetési képességeit vizuális környezetben	-
Mobilalkalmazás	Google Play Apple Apps

Claude Sonnet 4 Specifikációk, Értékelés és Összehasonlítás

Claude Sonnet 4

Modell Áttekintés

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása