Grok 4

Mistral Large 2

Mistral Large 2, développé par Mistral, offre une fenêtre contextuelle de 128 000 tokens et est tarifé à 3,00 USD par million de tokens d'entrée et 9,00 USD par million de tokens de sortie. Publié le 24 juillet 2024, le modèle a obtenu un score de 84,0 au benchmark MMLU dans une évaluation 5-shot, démontrant de solides performances dans diverses tâches.

Grok 4Mistral Large 2
Site web ?
Fournisseur ?
Chat ?
Date de sortie ?
Modalités ?
texte ?
images ?
voix ?
vidéo ?
texte ?
Fournisseurs d’API ?
xAI
Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
Date de mise à jour des connaissances ?
-
Inconnu
Open Source ?
Non
Oui
Tarification d’entrée ?
$3.00 par million de tokens
$3.00 par million de tokens
Tarification de sortie ?
$15.00 par million de tokens
$9.00 par million de tokens
MMLU ?
-
84%
5-shot
Source
MMLU-Pro ?
-
50.69%
Source
MMMU ?
-
Non disponible
HellaSwag ?
-
Non disponible
HumanEval ?
-
Non disponible
MATH ?
-
1.13%
Source
GPQA ?
87.5%
Science
Source
24.94%
IFEval ?
-
84.01%
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
91.7%
Competition Math
Source
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
79%
Competitive Coding
Source
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Application mobile
-

MathArena ?

Score moyen
89%
-
AIME 2025
Test basé sur des problèmes issus du concours de mathématiques (American Invitational Mathematics Examination),destiné à évaluer les compétences mathématiques des modèles.
91%
-
HMMT February 2025
Test basé sur des problèmes du Harvard-MIT Mathematics Tournament, février 2025, destiné à évaluer les compétences mathématiques des modèles.
92%
-
BRUMO 2025
95%
-
SMT 2025
Test basé sur des problèmes du Stanford Math Tournament, 2025, destiné à évaluer les compétences mathématiques des modèles.
86%
-
CMIMC 2025
Test basé sur des problèmes de l’Olympiade mathématique canadienne, 2025, destiné à évaluer les compétences mathématiques des modèles.
83%
-

Comparer les LLMs

Ajouter un commentaire


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.