OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.
Claude 3.5 Haiku, desarrollado por Anthropic, ofrece una ventana de contexto de 200.000 tokens. El precio está fijado en 1 $ por millón de tokens de entrada y 5 $ por millón de tokens de salida, con posibles ahorros de hasta un 90 % mediante el almacenamiento en caché de prompts y un 50 % a través de la API de Message Batches. Este modelo, lanzado el 4 de noviembre de 2024, destaca en la autocompletación de código, chatbots interactivos, extracción y etiquetado de datos, así como en la moderación de contenido en tiempo real.
o3 | Claude 3.5 Haiku | |
---|---|---|
Proveedor | ||
Sitio Web | ||
Fecha de Lanzamiento | Apr 16, 2025 1 semana ago | Nov 04, 2024 5 meses ago |
Modalidades | texto imágenes | texto |
Proveedores de API | OpenAI API | Anthropic, AWS Bedrock, Vertex AI |
Fecha de Corte de Conocimiento | - | 01.04.2024 |
Código Abierto | No | No |
Costo de Entrada | $10.00 por millón de tokens | $0.80 por millón de tokens |
Costo de Salida | $40.00 por millón de tokens | $4.00 |
MMLU | 82.9% Fuente | No disponible |
MMLU Pro | - | 65% 0-shot CoT Fuente |
MMMU | - | No disponible |
HellaSwag | - | No disponible |
HumanEval | - | 88.1% 0-shot Fuente |
MATH | - | 69.4% 0-shot CoT Fuente |
GPQA | 83.3% Diamond, no tools Fuente | No disponible |
IFEval | - | No disponible |
Aplicación Móvil |
Compare AI. Test. Benchmarks. Chatbots Móviles, Sketch
Copyright © 2025 All Right Reserved.