OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.
LLaMA 4 Scout es un modelo de 17 mil millones de parámetros que utiliza una arquitectura Mixture-of-Experts con 16 expertos activos, posicionándose como el mejor modelo multimodal en su categoría. Supera constantemente a competidores como Gemma 3, Gemini 2.0 Flash-Lite y Mistral 3.1 en una amplia gama de tareas de evaluación. A pesar de su rendimiento, LLaMA 4 Scout es increíblemente eficiente: puede ejecutarse en una sola GPU NVIDIA H100 con cuantización Int4. También cuenta con una ventana de contexto líder en la industria de 10 millones de tokens y es nativamente multimodal, lo que le permite procesar texto, imágenes y video de forma fluida para aplicaciones avanzadas del mundo real.
o3 | Llama 4 Scout | |
---|---|---|
Proveedor | ||
Sitio Web | ||
Fecha de Lanzamiento | Apr 16, 2025 1 mes ago | Apr 05, 2025 1 mes ago |
Modalidades | texto imágenes | texto imágenes video |
Proveedores de API | OpenAI API | Meta AI, Hugging Face, Fireworks, Together, DeepInfra |
Fecha de Corte de Conocimiento | - | 2025-04 |
Código Abierto | No | Sí (Fuente) |
Costo de Entrada | $10.00 por millón de tokens | No disponible |
Costo de Salida | $40.00 por millón de tokens | No disponible |
MMLU | 82.9% Fuente | No disponible |
MMLU Pro | - | 74.3% Reasoning & Knowledge Fuente |
MMMU | - | 69.4% Image Reasoning Fuente |
HellaSwag | - | No disponible |
HumanEval | - | No disponible |
MATH | - | No disponible |
GPQA | 83.3% Diamond, no tools Fuente | 57.2% Diamond Fuente |
IFEval | - | No disponible |
Array | - | - |
AIME 2024 | 91.6% Fuente | - |
AIME 2025 | 88.9% Fuente | - |
Array | - | - |
Array | - | - |
Array | - | - |
Array | - | - |
Aplicación Móvil | - |
Compare AI. Test. Benchmarks. Chatbots Móviles, Sketch
Copyright © 2025 All Right Reserved.