Mistral Large 2

Commentaires: 0
Mistral Large 2 #0
Mistral Large 2 #1
Mistral Large 2 #2
Mistral Large 2 #3

Mistral Large 2, développé par Mistral, offre une fenêtre contextuelle de 128 000 tokens et est tarifé à 3,00 USD par million de tokens d'entrée et 9,00 USD par million de tokens de sortie. Publié le 24 juillet 2024, le modèle a obtenu un score de 84,0 au benchmark MMLU dans une évaluation 5-shot, démontrant de solides performances dans diverses tâches.

4923
871

Position dans le classement général au
Juin 2026
34
Évaluation des utilisateurs
https://compare-ai.foundtt.com
3.8

Présentation du modèle

Site web
Page web du modèle d’IA
Fournisseur
L’entité qui fournit ce modèle.
Chat
Entrez un message pour commencer à discuter
-
Date de sortie
Première date de publication du modèle.
1 an ago
Jun 24, 2024
Modalités
Types de données que ce modèle peut traiter
texte ?
Fournisseurs d’API
Les fournisseurs qui proposent ce modèle. (Cette liste n’est pas exhaustive.)
Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
Date de mise à jour des connaissances
Dernière mise à jour des connaissances du modèle.
Inconnu
Open Source
Disponibilité du code du modèle pour une utilisation publique.
Oui
Tarification d’entrée
Coût du traitement des tokens dans vos invites
$3.00 par million de tokens
Tarification de sortie
Coût des tokens générés par le modèle
$9.00 par million de tokens
MMLU
Massive Multitask Language Understanding - Évalue les connaissances dans 57 domaines, y compris les mathématiques, l’histoire, le droit et plus encore
84%
5-shot
Source
MMLU-Pro
Un benchmark MMLU plus robuste avec des questions plus complexes axées sur le raisonnement, un plus grand ensemble de choix et une sensibilité réduite aux invites
50.69%
Source
MMMU
Massive Multitask Multimodal Understanding - Évalue la compréhension à travers le texte, les images, l’audio et la vidéo
Non disponible
HellaSwag
Un benchmark exigeant de complétion de phrases
Non disponible
HumanEval
Évalue la génération de code et les capacités de résolution de problèmes
Non disponible
MATH
Évalue les capacités de résolution de problèmes mathématiques à différents niveaux de difficulté
1.13%
Source
GPQA
Évalue les connaissances de niveau doctorat en chimie, biologie et physique via des questions à choix multiples nécessitant une expertise approfondie
24.94%
IFEval
Évalue la capacité du modèle à suivre avec précision des instructions de formatage explicites, à générer des sorties appropriées et à maintenir une cohérence dans l’exécution des tâches
84.01%
SimpleQA
Évaluation de la précision des questions simples
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Benchmark de programmation multilingue.
-
LiveCodeBench v5
Benchmark pour la programmation en temps réel
-
Global MMLU (Lite)
Une version simplifiée du benchmark pour évaluer l’universalité des modèles au niveau mondial.
-
MathVista
Évalue les capacités de raisonnement mathématique des modèles d’IA dans des contextes visuels
-
Application mobile
-

Ajouter un commentaire

Comparer les LLMs


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.