o4-mini

OpenAI o4-mini es el modelo más reciente y ligero de la serie o, diseñado para un razonamiento eficiente y capaz en tareas tanto de texto como visuales. Optimizado para velocidad y rendimiento, destaca en generación de código y comprensión basada en imágenes, manteniendo un equilibrio entre latencia y profundidad de razonamiento. El modelo admite una ventana de contexto de 200.000 tokens con hasta 100.000 tokens de salida, lo que lo hace ideal para interacciones extensas y de alto volumen. Procesa entradas tanto de texto como de imágenes y produce salidas textuales con capacidades avanzadas de razonamiento. Gracias a su arquitectura compacta y rendimiento versátil, o4-mini es perfecto para una amplia gama de aplicaciones del mundo real que requieren inteligencia rápida y rentable.

Qwen2.5-VL-32B

Durante los cinco meses desde el lanzamiento de Qwen2-VL, los desarrolladores han construido nuevos modelos basados en él, aportando valiosos comentarios. Ahora, Qwen2.5-VL introduce capacidades mejoradas, incluyendo análisis preciso de imágenes, textos y gráficos, así como localización de objetos con salidas estructuradas en JSON. Comprende videos largos, identifica eventos clave y funciona como agente interactuando con herramientas en computadoras y teléfonos. La arquitectura del modelo presenta procesamiento dinámico de video y un codificador ViT optimizado para mayor velocidad y precisión.

o4-miniQwen2.5-VL-32B
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
texto ?
imágenes ?
video ?
Proveedores de API ?
OpenAI API
-
Fecha de Corte de Conocimiento ?
-
Desconocido
Código Abierto ?
No
(Fuente)
Costo de Entrada ?
$1.10 por millón de tokens
$0
Costo de Salida ?
$4.40 por millón de tokens
$0
MMLU ?
fort
78.4%
Fuente
MMLU-Pro ?
-
49.5%
MMMU ?
81.6%
Fuente
70%
HellaSwag ?
-
No disponible
HumanEval ?
14.28%
Fuente
No disponible
MATH ?
-
82.2%
GPQA ?
81.4%
Fuente
46.0%
Diamond
IFEval ?
-
No disponible
SimpleQA ?
-
-
AIME 2024
93.4%
Fuente
-
AIME 2025
92.7%
Fuente
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Aplicación Móvil
-

MathArena ?

Puntuación media
87%
-
AIME 2025
Prueba basada en problemas del concurso de matemáticas (American Invitational Mathematics Examination),destinada a evaluar las habilidades matemáticas de los modelos.
92%
-
HMMT February 2025
Prueba basada en problemas del Harvard-MIT Mathematics Tournament, febrero de 2025, destinada a evaluar las habilidades matemáticas de los modelos.
83%
-
BRUMO 2025
87%
-
SMT 2025
Prueba basada en problemas del Stanford Math Tournament, 2025, destinada a evaluar las habilidades matemáticas de los modelos.
89%
-
CMIMC 2025
Prueba basada en problemas de la Olimpiada Matemática Canadiense, 2025, destinada a evaluar las habilidades matemáticas de los modelos.
84%
-

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.