OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.
Mistral Large 2, desarrollado por Mistral, ofrece una ventana de contexto de 128 000 tokens y tiene un precio de 3,00 USD por millón de tokens de entrada y 9,00 USD por millón de tokens de salida. Lanzado el 24 de julio de 2024, el modelo obtuvo una puntuación de 84,0 en el benchmark MMLU en una evaluación de 5-shot, demostrando un fuerte rendimiento en diversas tareas.
o3 | Mistral Large 2 | |
---|---|---|
Proveedor | ||
Sitio Web | ||
Fecha de Lanzamiento | Apr 16, 2025 1 semana ago | Jun 24, 2024 10 meses ago |
Modalidades | texto imágenes | texto |
Proveedores de API | OpenAI API | Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex |
Fecha de Corte de Conocimiento | - | Desconocido |
Código Abierto | No | Sí |
Costo de Entrada | $10.00 por millón de tokens | $3.00 por millón de tokens |
Costo de Salida | $40.00 por millón de tokens | $9.00 por millón de tokens |
MMLU | 82.9% Fuente | 84% 5-shot Fuente |
MMLU Pro | - | 50.69% Fuente |
MMMU | - | No disponible |
HellaSwag | - | No disponible |
HumanEval | - | No disponible |
MATH | - | 1.13% Fuente |
GPQA | 83.3% Diamond, no tools Fuente | 24.94% |
IFEval | - | 84.01% |
Aplicación Móvil | - |
Compare AI. Test. Benchmarks. Chatbots Móviles, Sketch
Copyright © 2025 All Right Reserved.