Grok 4

Claude Sonnet 4

Grok 4Claude Sonnet 4
Site web ?
Fournisseur ?
Chat ?
Date de sortie ?
Modalités ?
texte ?
images ?
voix ?
vidéo ?
texte ?
images ?
Fournisseurs d’API ?
xAI
Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Date de mise à jour des connaissances ?
-
Inconnu
Open Source ?
Non
Non
Tarification d’entrée ?
$3.00 par million de tokens
$3 par million de tokens
Tarification de sortie ?
$15.00 par million de tokens
$15 par million de tokens
MMLU ?
-
86.5%
Source
MMLU-Pro ?
-
-
MMMU ?
-
74.4%
Source
HellaSwag ?
-
-
HumanEval ?
-
-
MATH ?
-
-
GPQA ?
87.5%
Science
Source
75.4%
Diamond
Source
IFEval ?
-
-
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
91.7%
Competition Math
Source
75.5%
Source
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
79%
Competitive Coding
Source
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Application mobile

MathArena ?

Score moyen
89%
-
AIME 2025
Test basé sur des problèmes issus du concours de mathématiques (American Invitational Mathematics Examination),destiné à évaluer les compétences mathématiques des modèles.
91%
-
HMMT February 2025
Test basé sur des problèmes du Harvard-MIT Mathematics Tournament, février 2025, destiné à évaluer les compétences mathématiques des modèles.
92%
-
BRUMO 2025
95%
-
SMT 2025
Test basé sur des problèmes du Stanford Math Tournament, 2025, destiné à évaluer les compétences mathématiques des modèles.
86%
-
CMIMC 2025
Test basé sur des problèmes de l’Olympiade mathématique canadienne, 2025, destiné à évaluer les compétences mathématiques des modèles.
83%
-

Comparer les LLMs

Ajouter un commentaire


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.