Gemini 2.5 Pro

Gemini 2.5 Pro est le modèle d'IA le plus avancé de Google, conçu pour un raisonnement approfondi et une génération de réponses réfléchies. Il surpasse les benchmarks clés, démontrant une logique exceptionnelle et une compétence en codage. Optimisé pour créer des applications web dynamiques, des systèmes de code autonomes et l'adaptation de code, il offre des performances de haut niveau. Avec des capacités multimodales intégrées et une fenêtre de contexte étendue, il traite efficacement de grands ensembles de données et intègre diverses sources d'information pour relever des défis complexes.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, conçu par Meta, est un grand modèle de langage multilingue spécialement affiné pour les tâches basées sur des instructions et optimisé pour les applications conversationnelles. Il peut traiter et générer du texte en plusieurs langues, avec une fenêtre contextuelle prenant en charge jusqu'à 128 000 tokens. Lancé le 6 décembre 2024, le modèle surpasse de nombreux chatbots open-source et propriétaires selon divers benchmarks industriels. Il utilise le Grouped-Query Attention (GQA) pour améliorer l'évolutivité et a été entraîné sur un ensemble de données diversifié comprenant plus de 15 billions de tokens provenant de sources publiques. Les connaissances du modèle sont à jour jusqu'en décembre 2023.

Gemini 2.5 ProLlama 3.3 70B Instruct
Site web ?
Fournisseur ?
Chat ?
Date de sortie ?
Modalités ?
texte ?
images ?
voix ?
vidéo ?
texte ?
Fournisseurs d’API ?
Google AI Studio, Vertex AI, Gemini app
Fireworks, Together, DeepInfra, Hyperbolic
Date de mise à jour des connaissances ?
-
12.2024
Open Source ?
Non
Oui
Tarification d’entrée ?
Non disponible
$0.23 par million de tokens
Tarification de sortie ?
Non disponible
$0.40 par million de tokens
MMLU ?
Non disponible
86%
0-shot, CoT
Source
MMLU-Pro ?
Non disponible
68.9%
5-shot, CoT
Source
MMMU ?
81.7%
Source
Non disponible
HellaSwag ?
Non disponible
Non disponible
HumanEval ?
Non disponible
88.4%
pass@1
Source
MATH ?
Non disponible
77%
0-shot, CoT
Source
GPQA ?
84.0%
Diamond Science
Source
50.5%
0-shot, CoT
Source
IFEval ?
Non disponible
92.1%
Source
SimpleQA ?
52.9%
-
AIME 2024
92.0%
-
AIME 2025
86.7%
-
Aider Polyglot ?
74.0% / 68.6%
-
LiveCodeBench v5 ?
70.4%
-
Global MMLU (Lite) ?
89.8%
-
MathVista ?
-
-
Application mobile
-

VideoGameBench ?

Score total
0.48%
-
Doom II
0%
-
Dream DX
4.8%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

MathArena ?

Score moyen
81%
-
AIME 2025
Test basé sur des problèmes issus du concours de mathématiques (American Invitational Mathematics Examination),destiné à évaluer les compétences mathématiques des modèles.
87%
-
HMMT February 2025
Test basé sur des problèmes du Harvard-MIT Mathematics Tournament, février 2025, destiné à évaluer les compétences mathématiques des modèles.
82%
-
BRUMO 2025
90%
-
SMT 2025
Test basé sur des problèmes du Stanford Math Tournament, 2025, destiné à évaluer les compétences mathématiques des modèles.
85%
-
CMIMC 2025
Test basé sur des problèmes de l’Olympiade mathématique canadienne, 2025, destiné à évaluer les compétences mathématiques des modèles.
58%
-

Comparer les LLMs

Commentaires (1)

  1. Mazen

    11 Août 2025

    Good program

Ajouter un commentaire


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.