Durante los cinco meses desde el lanzamiento de Qwen2-VL, los desarrolladores han construido nuevos modelos basados en él, aportando valiosos comentarios. Ahora, Qwen2.5-VL introduce capacidades mejoradas, incluyendo análisis preciso de imágenes, textos y gráficos, así como localización de objetos con salidas estructuradas en JSON. Comprende videos largos, identifica eventos clave y funciona como agente interactuando con herramientas en computadoras y teléfonos. La arquitectura del modelo presenta procesamiento dinámico de video y un codificador ViT optimizado para mayor velocidad y precisión.
OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.
Qwen2.5-VL-32B | o3 | |
---|---|---|
Proveedor | ||
Sitio Web | ||
Fecha de Lanzamiento | Mar 25, 2025 1 mes ago | Apr 16, 2025 1 semana ago |
Modalidades | texto imágenes video | texto imágenes |
Proveedores de API | - | OpenAI API |
Fecha de Corte de Conocimiento | Desconocido | - |
Código Abierto | Sí (Fuente) | No |
Costo de Entrada | $0 | $10.00 por millón de tokens |
Costo de Salida | $0 | $40.00 por millón de tokens |
MMLU | 78.4% Fuente | 82.9% Fuente |
MMLU Pro | 49.5% | - |
MMMU | 70% | - |
HellaSwag | No disponible | - |
HumanEval | No disponible | - |
MATH | 82.2% | - |
GPQA | 46.0% Diamond | 83.3% Diamond, no tools Fuente |
IFEval | No disponible | - |
Aplicación Móvil | - |
Compare AI. Test. Benchmarks. Chatbots Móviles, Sketch
Copyright © 2025 All Right Reserved.