Claude Opus 4.5

Commentaires: 0
Claude Opus 4.5 #0
Claude Opus 4.5 #1
Claude Opus 4.5 #2
4974
543

Position dans le classement général au
Juin 2026
2
Évaluation des utilisateurs
https://compare-ai.foundtt.com
4.4

Présentation du modèle

Site web
Page web du modèle d’IA
Fournisseur
L’entité qui fournit ce modèle.
Chat
Entrez un message pour commencer à discuter
Date de sortie
Première date de publication du modèle.
6 mois ago
Nov 24, 2025
Modalités
Types de données que ce modèle peut traiter
texte ?
images ?
Fournisseurs d’API
Les fournisseurs qui proposent ce modèle. (Cette liste n’est pas exhaustive.)
Anthropic API, Amazon Bedrock, Google Vertex AI, Claude developer platform
Date de mise à jour des connaissances
Dernière mise à jour des connaissances du modèle.
Inconnu
Open Source
Disponibilité du code du modèle pour une utilisation publique.
Non
Tarification d’entrée
Coût du traitement des tokens dans vos invites
$5 par million de tokens
Tarification de sortie
Coût des tokens générés par le modèle
$25 par million de tokens
MMLU
Massive Multitask Language Understanding - Évalue les connaissances dans 57 domaines, y compris les mathématiques, l’histoire, le droit et plus encore
90.8%
Source
MMLU-Pro
Un benchmark MMLU plus robuste avec des questions plus complexes axées sur le raisonnement, un plus grand ensemble de choix et une sensibilité réduite aux invites
-
MMMU
Massive Multitask Multimodal Understanding - Évalue la compréhension à travers le texte, les images, l’audio et la vidéo
80.7%
Validation
Source
HellaSwag
Un benchmark exigeant de complétion de phrases
-
HumanEval
Évalue la génération de code et les capacités de résolution de problèmes
-
MATH
Évalue les capacités de résolution de problèmes mathématiques à différents niveaux de difficulté
-
GPQA
Évalue les connaissances de niveau doctorat en chimie, biologie et physique via des questions à choix multiples nécessitant une expertise approfondie
87%
Diamond
Source
IFEval
Évalue la capacité du modèle à suivre avec précision des instructions de formatage explicites, à générer des sorties appropriées et à maintenir une cohérence dans l’exécution des tâches
-
SimpleQA
Évaluation de la précision des questions simples
-
AIME 2024
-
AIME 2025
92.77%
Source
Aider Polyglot
Benchmark de programmation multilingue.
-
LiveCodeBench v5
Benchmark pour la programmation en temps réel
-
Global MMLU (Lite)
Une version simplifiée du benchmark pour évaluer l’universalité des modèles au niveau mondial.
-
MathVista
Évalue les capacités de raisonnement mathématique des modèles d’IA dans des contextes visuels
-
Application mobile

Ajouter un commentaire

Comparer les LLMs


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.