Qwen 3

Comentarios: 0
Qwen 3 #0
Qwen 3 #1
Qwen 3 #2
4507
122

Posición en el ranking general al
Junio 2026
10
Calificación de usuarios
https://compare-ai.foundtt.com
4.2

Resumen del Modelo

Sitio Web
Página Web del Modelo de IA
Proveedor
La entidad que proporciona este modelo.
Chat
Ingresa un mensaje para comenzar a chatear
Fecha de Lanzamiento
Cuándo se lanzó el modelo por primera vez.
1 año ago
Abr 29, 2025
Modalidades
Tipos de datos que este modelo puede procesar
-
Proveedores de API
Los proveedores que ofrecen este modelo. (Esta no es una lista exhaustiva).
-
Fecha de Corte de Conocimiento
Cuándo se actualizó por última vez el conocimiento del modelo.
-
Código Abierto
Si el código del modelo está disponible para uso público.
(Fuente)
Costo de Entrada
Costo por procesar tokens en tus solicitudes
-
Costo de Salida
Costo por tokens generados por el modelo
-
MMLU
Evaluación de Comprensión Multitarea Masiva - Pruebas de conocimiento en 57 disciplinas, incluyendo matemáticas, historia, derecho y más.
-
MMLU-Pro
Un criterio MMLU más avanzado con preguntas más difíciles enfocadas en el razonamiento, un mayor conjunto de opciones y menor sensibilidad a los prompts.
-
MMMU
Evaluación de Comprensión Multitarea Multimodal - Pruebas de comprensión en texto, imágenes, audio y video.
-
HellaSwag
Un exigente criterio de evaluación para completar oraciones.
-
HumanEval
Evalúa la generación de código y habilidades de resolución de problemas.
-
MATH
Pruebas de resolución de problemas matemáticos en distintos niveles de dificultad.
-
GPQA
Evalúa conocimientos a nivel de doctorado en química, biología y física mediante preguntas de opción múltiple que requieren una comprensión profunda del dominio.
-
IFEval
Evalúa la capacidad del modelo para seguir instrucciones de formato explícitas, generar respuestas adecuadas y mantener la coherencia en diversas tareas.
-
SimpleQA
Evaluación de la precisión de preguntas simples
-
AIME 2024
Fuente
AIME 2025
Fuente
Aider Polyglot
Benchmark de programación multilingüe.
-
LiveCodeBench v5
Benchmark para programación en tiempo real
-
Global MMLU (Lite)
Una versión simplificada del benchmark para evaluar la universalidad de los modelos a nivel global.
-
MathVista
Evalúa las habilidades de razonamiento matemático de los modelos de IA dentro de contextos visuales
-
Aplicación Móvil
-

Agregar un Comentario

Comparar LLMs


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.