Claude Sonnet 4

Hozzászólások: 0
Claude Sonnet 4 #0
Claude Sonnet 4 #1
3409
961

Helyezés az összesített rangsorban dátummal Június 2026
32
Felhasználói értékelés https://compare-ai.foundtt.com
3.9

Modell Áttekintés

Weboldal
AI Modell Weboldal
Szolgáltató
A modellt biztosító entitás.
Csevegés
Írjon be egy üzenetet a csevegés megkezdéséhez
Kiadási Dátum
Mikor jelent meg a modell először.
1 év ago
Máj 22, 2025
Modalitások
A modell által feldolgozható adattípusok
szöveg ?
képek ?
API Szolgáltatók
A modellt kínáló szolgáltatók. (Ez nem egy teljes lista.)
Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Tudás Befejezési Dátuma
Utoljára mikor frissült a modell tudása.
Ismeretlen
Nyílt Forráskódú
A modell kódja nyilvánosan használható-e.
Nem
Bemeneti Árazás
A promptokban feldolgozott tokenek költsége
$3 millió tokenenként
Kimeneti Árazás
A modell által generált tokenek költsége
$15 millió tokenenként
MMLU
Massive Multitask Language Understanding – 57 tantárgyban teszteli a tudást, beleértve a matematikát, történelmet, jogot és egyebeket
86.5%
Forrás
MMLU-Pro
Egy robusztusabb MMLU benchmark nehezebb, gondolkodásra összpontosító kérdésekkel, nagyobb választási lehetőségekkel és csökkentett prompt érzékenységgel
-
MMMU
Massive Multitask Multimodal Understanding – Teszteli a megértést szöveg, kép, hang és videó terén
74.4%
Forrás
HellaSwag
Egy kihívást jelentő mondatkiegészítési benchmark
-
HumanEval
Értékeli a kódgenerálás és problémamegoldó képességeket
-
MATH
Különböző nehézségi szinteken teszteli a matematikai problémamegoldó képességeket
-
GPQA
Doktori szintű tudást tesztel kémiában, biológiában és fizikában, több választós kérdéseken keresztül, amelyek mély szakmai tudást igényelnek
75.4%
Diamond
Forrás
IFEval
Teszteli a modell képességét, hogy pontosan kövesse az explicit formázási utasításokat, megfelelő kimeneteket generáljon, és következetesen betartsa az utasításokat különböző feladatok során
-
SimpleQA
Egyszerű kérdések pontosságának értékelése
-
AIME 2024
-
AIME 2025
75.5%
Forrás
Aider Polyglot
Többnyelvű programozási benchmark.
-
LiveCodeBench v5
Valós idejű programozási benchmark
-
Global MMLU (Lite)
A benchmark egyszerűsített verziója a modellek globális szintű univerzalitásának értékelésére.
-
MathVista
Értékeli az AI modellek matematikai következtetési képességeit vizuális környezetben
-
Mobilalkalmazás

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.