Spécifications techniques et analyse de Mistral Large 2

Mistral Large 2

Commentaires: 0

Mistral Large 2, développé par Mistral, offre une fenêtre contextuelle de 128 000 tokens et est tarifé à 3,00 USD par million de tokens d'entrée et 9,00 USD par million de tokens de sortie. Publié le 24 juillet 2024, le modèle a obtenu un score de 84,0 au benchmark MMLU dans une évaluation 5-shot, démontrant de solides performances dans diverses tâches.

4923

871

Position dans le classement général au
Juillet 2026

Évaluation des utilisateurs
https://compare-ai.foundtt.com

3.8

Présentation du modèle

Site web Page web du modèle d’IA	Open
Fournisseur L’entité qui fournit ce modèle.	Mistral AI
Chat Entrez un message pour commencer à discuter	-
Date de sortie Première date de publication du modèle.	2 ans ago Jun 24, 2024
Modalités Types de données que ce modèle peut traiter	texte ?
Fournisseurs d’API Les fournisseurs qui proposent ce modèle. (Cette liste n’est pas exhaustive.)	Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
Date de mise à jour des connaissances Dernière mise à jour des connaissances du modèle.	Inconnu
Open Source Disponibilité du code du modèle pour une utilisation publique.	Oui
Tarification d’entrée Coût du traitement des tokens dans vos invites	$3.00 par million de tokens
Tarification de sortie Coût des tokens générés par le modèle	$9.00 par million de tokens
MMLU Massive Multitask Language Understanding - Évalue les connaissances dans 57 domaines, y compris les mathématiques, l’histoire, le droit et plus encore	84% 5-shot Source
MMLU-Pro Un benchmark MMLU plus robuste avec des questions plus complexes axées sur le raisonnement, un plus grand ensemble de choix et une sensibilité réduite aux invites	50.69% Source
MMMU Massive Multitask Multimodal Understanding - Évalue la compréhension à travers le texte, les images, l’audio et la vidéo	Non disponible
HellaSwag Un benchmark exigeant de complétion de phrases	Non disponible
HumanEval Évalue la génération de code et les capacités de résolution de problèmes	Non disponible
MATH Évalue les capacités de résolution de problèmes mathématiques à différents niveaux de difficulté	1.13% Source
GPQA Évalue les connaissances de niveau doctorat en chimie, biologie et physique via des questions à choix multiples nécessitant une expertise approfondie	24.94%
IFEval Évalue la capacité du modèle à suivre avec précision des instructions de formatage explicites, à générer des sorties appropriées et à maintenir une cohérence dans l’exécution des tâches	84.01%
SimpleQA Évaluation de la précision des questions simples	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Benchmark de programmation multilingue.	-
LiveCodeBench v5 Benchmark pour la programmation en temps réel	-
Global MMLU (Lite) Une version simplifiée du benchmark pour évaluer l’universalité des modèles au niveau mondial.	-
MathVista Évalue les capacités de raisonnement mathématique des modèles d’IA dans des contextes visuels	-
Application mobile	-

Spécifications, analyse et comparaison de Mistral Large 2

Mistral Large 2

Présentation du modèle

Ajouter un commentaire

Comparer les LLMs