Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet est le modèle d'IA le plus avancé d'Anthropic à ce jour et le premier système de raisonnement hybride sur le marché. Il propose des modes de pensée standard et étendu, ce dernier offrant un raisonnement transparent et étape par étape. Le modèle démontre des améliorations significatives en codage et en développement web front-end, obtenant des résultats de pointe sur SWE-bench Verified et TAU-bench. Disponible via Claude.ai, l'API Anthropic, Amazon Bedrock et Google Cloud Vertex AI, il établit une nouvelle référence pour la résolution intelligente de problèmes pilotée par l'IA.

Gemini 2.0 Pro

Gemini 2.0 Pro est le modèle le plus avancé de Google à ce jour, offrant des performances exceptionnelles en programmation et gérant avec aisance des instructions complexes. Il est doté de capacités améliorées telles que l’intégration native d’outils, la génération d’images et la synthèse vocale. Conçu pour un raisonnement avancé, ce modèle prend en charge les entrées multimodales, y compris le texte, les images, la vidéo et l’audio. Disponible via Google AI Studio et Vertex AI, il offre des améliorations significatives par rapport aux versions précédentes tout en maintenant une grande efficacité.

Claude 3.7 Sonnet - Extended ThinkingGemini 2.0 Pro
Site web ?
Fournisseur ?
Chat ?
Date de sortie ?
Modalités ?
texte ?
images ?
texte ?
images ?
voix ?
vidéo ?
Fournisseurs d’API ?
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Google AI Studio, Vertex AI
Date de mise à jour des connaissances ?
-
08.2024
Open Source ?
Non
Non
Tarification d’entrée ?
$3.00 par million de tokens
$0.10 par million de tokens
Tarification de sortie ?
$15.00 par million de tokens
$0.40 par million de tokens
MMLU ?
Non disponible
Non disponible
MMLU-Pro ?
Non disponible
79.1%
Source
MMMU ?
75%
Source
72.7%
Source
HellaSwag ?
Non disponible
Non disponible
HumanEval ?
Non disponible
Non disponible
MATH ?
96.2%
Source
91.8%
Source
GPQA ?
84.8%
Diamond
Source
64.7%
Diamond
Source
IFEval ?
93.2%
Source
Non disponible
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Application mobile

Comparer les LLMs

Ajouter un commentaire


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.