Qwen 3

Commentaires: 0
Qwen 3 #0
Qwen 3 #1
Qwen 3 #2
4507
122

Position dans le classement général au
Juin 2026
10
Évaluation des utilisateurs
https://compare-ai.foundtt.com
4.2

Présentation du modèle

Site web
Page web du modèle d’IA
Fournisseur
L’entité qui fournit ce modèle.
Chat
Entrez un message pour commencer à discuter
Date de sortie
Première date de publication du modèle.
1 an ago
Avr 29, 2025
Modalités
Types de données que ce modèle peut traiter
-
Fournisseurs d’API
Les fournisseurs qui proposent ce modèle. (Cette liste n’est pas exhaustive.)
-
Date de mise à jour des connaissances
Dernière mise à jour des connaissances du modèle.
-
Open Source
Disponibilité du code du modèle pour une utilisation publique.
Oui (Source)
Tarification d’entrée
Coût du traitement des tokens dans vos invites
-
Tarification de sortie
Coût des tokens générés par le modèle
-
MMLU
Massive Multitask Language Understanding - Évalue les connaissances dans 57 domaines, y compris les mathématiques, l’histoire, le droit et plus encore
-
MMLU-Pro
Un benchmark MMLU plus robuste avec des questions plus complexes axées sur le raisonnement, un plus grand ensemble de choix et une sensibilité réduite aux invites
-
MMMU
Massive Multitask Multimodal Understanding - Évalue la compréhension à travers le texte, les images, l’audio et la vidéo
-
HellaSwag
Un benchmark exigeant de complétion de phrases
-
HumanEval
Évalue la génération de code et les capacités de résolution de problèmes
-
MATH
Évalue les capacités de résolution de problèmes mathématiques à différents niveaux de difficulté
-
GPQA
Évalue les connaissances de niveau doctorat en chimie, biologie et physique via des questions à choix multiples nécessitant une expertise approfondie
-
IFEval
Évalue la capacité du modèle à suivre avec précision des instructions de formatage explicites, à générer des sorties appropriées et à maintenir une cohérence dans l’exécution des tâches
-
SimpleQA
Évaluation de la précision des questions simples
-
AIME 2024
Source
AIME 2025
Source
Aider Polyglot
Benchmark de programmation multilingue.
-
LiveCodeBench v5
Benchmark pour la programmation en temps réel
-
Global MMLU (Lite)
Une version simplifiée du benchmark pour évaluer l’universalité des modèles au niveau mondial.
-
MathVista
Évalue les capacités de raisonnement mathématique des modèles d’IA dans des contextes visuels
-
Application mobile
-

Ajouter un commentaire

Comparer les LLMs


10%
Notre site utilise des cookies.

Politique de confidentialité et de cookies: ce site utilise des cookies. En continuant à utiliser le site, vous acceptez leur utilisation.