Gemini 2.5 Pro

Gemini 2.5 Pro est le modèle d'IA le plus avancé de Google, conçu pour un raisonnement approfondi et une génération de réponses réfléchies. Il surpasse les benchmarks clés, démontrant une logique exceptionnelle et une compétence en codage. Optimisé pour créer des applications web dynamiques, des systèmes de code autonomes et l'adaptation de code, il offre des performances de haut niveau. Avec des capacités multimodales intégrées et une fenêtre de contexte étendue, il traite efficacement de grands ensembles de données et intègre diverses sources d'information pour relever des défis complexes.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet est le modèle d'IA le plus avancé d'Anthropic à ce jour et le premier système de raisonnement hybride sur le marché. Il propose des modes de pensée standard et étendu, ce dernier offrant un raisonnement transparent et étape par étape. Le modèle démontre des améliorations significatives en codage et en développement web front-end, obtenant des résultats de pointe sur SWE-bench Verified et TAU-bench. Disponible via Claude.ai, l'API Anthropic, Amazon Bedrock et Google Cloud Vertex AI, il établit une nouvelle référence pour la résolution intelligente de problèmes pilotée par l'IA.

Gemini 2.5 ProClaude 3.7 Sonnet - Extended Thinking
Site web ?
Fournisseur ?
Chat ?
Date de sortie ?
Modalités ?
texte ?
images ?
voix ?
vidéo ?
texte ?
images ?
Fournisseurs d’API ?
Google AI Studio, Vertex AI, Gemini app
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Date de mise à jour des connaissances ?
-
-
Open Source ?
Non
Non
Tarification d’entrée ?
Non disponible
$3.00 par million de tokens
Tarification de sortie ?
Non disponible
$15.00 par million de tokens
MMLU ?
Non disponible
Non disponible
MMLU-Pro ?
Non disponible
Non disponible
MMMU ?
81.7%
Source
75%
Source
HellaSwag ?
Non disponible
Non disponible
HumanEval ?
Non disponible
Non disponible
MATH ?
Non disponible
96.2%
Source
GPQA ?
84.0%
Diamond Science
Source
84.8%
Diamond
Source
IFEval ?
Non disponible
93.2%
Source
SimpleQA ?
52.9%
-
AIME 2024
92.0%
-
AIME 2025
86.7%
-
Aider Polyglot ?
74.0% / 68.6%
-
LiveCodeBench v5 ?
70.4%
-
Global MMLU (Lite) ?
89.8%
-
MathVista ?
-
-
Application mobile

VideoGameBench ?

Score total
0.48%
-
Doom II
0%
-
Dream DX
4.8%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

Comparer les LLMs

Ajouter un commentaire


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.