Gemini 2.5 Pro

Gemini 2.5 Pro est le modèle d'IA le plus avancé de Google, conçu pour un raisonnement approfondi et une génération de réponses réfléchies. Il surpasse les benchmarks clés, démontrant une logique exceptionnelle et une compétence en codage. Optimisé pour créer des applications web dynamiques, des systèmes de code autonomes et l'adaptation de code, il offre des performances de haut niveau. Avec des capacités multimodales intégrées et une fenêtre de contexte étendue, il traite efficacement de grands ensembles de données et intègre diverses sources d'information pour relever des défis complexes.

Mistral Large 2

Mistral Large 2, développé par Mistral, offre une fenêtre contextuelle de 128 000 tokens et est tarifé à 3,00 USD par million de tokens d'entrée et 9,00 USD par million de tokens de sortie. Publié le 24 juillet 2024, le modèle a obtenu un score de 84,0 au benchmark MMLU dans une évaluation 5-shot, démontrant de solides performances dans diverses tâches.

Gemini 2.5 ProMistral Large 2
Site web ?
Fournisseur ?
Chat ?
Date de sortie ?
Modalités ?
texte ?
images ?
voix ?
vidéo ?
texte ?
Fournisseurs d’API ?
Google AI Studio, Vertex AI, Gemini app
Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
Date de mise à jour des connaissances ?
-
Inconnu
Open Source ?
Non
Oui
Tarification d’entrée ?
Non disponible
$3.00 par million de tokens
Tarification de sortie ?
Non disponible
$9.00 par million de tokens
MMLU ?
Non disponible
84%
5-shot
Source
MMLU-Pro ?
Non disponible
50.69%
Source
MMMU ?
81.7%
Source
Non disponible
HellaSwag ?
Non disponible
Non disponible
HumanEval ?
Non disponible
Non disponible
MATH ?
Non disponible
1.13%
Source
GPQA ?
84.0%
Diamond Science
Source
24.94%
IFEval ?
Non disponible
84.01%
SimpleQA ?
52.9%
-
AIME 2024
92.0%
-
AIME 2025
86.7%
-
Aider Polyglot ?
74.0% / 68.6%
-
LiveCodeBench v5 ?
70.4%
-
Global MMLU (Lite) ?
89.8%
-
MathVista ?
-
-
Application mobile
-

VideoGameBench ?

Score total
0.48%
-
Doom II
0%
-
Dream DX
4.8%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

MathArena ?

Score moyen
81%
-
AIME 2025
Test basé sur des problèmes issus du concours de mathématiques (American Invitational Mathematics Examination),destiné à évaluer les compétences mathématiques des modèles.
87%
-
HMMT February 2025
Test basé sur des problèmes du Harvard-MIT Mathematics Tournament, février 2025, destiné à évaluer les compétences mathématiques des modèles.
82%
-
BRUMO 2025
90%
-
SMT 2025
Test basé sur des problèmes du Stanford Math Tournament, 2025, destiné à évaluer les compétences mathématiques des modèles.
85%
-
CMIMC 2025
Test basé sur des problèmes de l’Olympiade mathématique canadienne, 2025, destiné à évaluer les compétences mathématiques des modèles.
58%
-

Comparer les LLMs

Commentaires (1)

  1. Mazen

    11 Août 2025

    Good program

Ajouter un commentaire


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.