o3

OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.

GPT-4.5

El modelo GPT-4.5 más reciente de OpenAI, lanzado el 27 de febrero de 2025, es una IA innovadora con 12,8 billones de parámetros y una ventana de contexto de 128 000 tokens. Cuenta con conocimientos generales avanzados, inteligencia emocional mejorada, procesamiento de entradas multimodales (texto e imagen),llamadas de funciones sofisticadas y respuestas en tiempo real. Inicialmente implementado para usuarios de ChatGPT Pro, con disponibilidad posterior para suscriptores Plus y Team, ofrece respuestas a aproximadamente 37 tokens por segundo, lo que lo convierte en una excelente opción para tareas que requieren un razonamiento de alto nivel y profundidad emocional.

o3GPT-4.5
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
texto ?
imágenes ?
Proveedores de API ?
OpenAI API
OpenAI, Azure OpenAI Service
Fecha de Corte de Conocimiento ?
-
2023-10
Código Abierto ?
No
No
Costo de Entrada ?
$10.00 por millón de tokens
$75.00 por millón de tokens
Costo de Salida ?
$40.00 por millón de tokens
$150.00 por millón de tokens
MMLU ?
82.9%
Fuente
No disponible
MMLU-Pro ?
-
No disponible
MMMU ?
-
74.4%
Fuente
HellaSwag ?
-
No disponible
HumanEval ?
-
No disponible
MATH ?
-
No disponible
GPQA ?
83.3%
Diamond, no tools
Fuente
71.4%
science
Fuente
IFEval ?
-
No disponible
SimpleQA ?
-
-
AIME 2024
91.6%
Fuente
-
AIME 2025
88.9%
Fuente
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Aplicación Móvil

MathArena ?

Puntuación media
86%
-
AIME 2025
Prueba basada en problemas del concurso de matemáticas (American Invitational Mathematics Examination),destinada a evaluar las habilidades matemáticas de los modelos.
89%
-
HMMT February 2025
Prueba basada en problemas del Harvard-MIT Mathematics Tournament, febrero de 2025, destinada a evaluar las habilidades matemáticas de los modelos.
78%
-
BRUMO 2025
96%
-
SMT 2025
Prueba basada en problemas del Stanford Math Tournament, 2025, destinada a evaluar las habilidades matemáticas de los modelos.
88%
-
CMIMC 2025
Prueba basada en problemas de la Olimpiada Matemática Canadiense, 2025, destinada a evaluar las habilidades matemáticas de los modelos.
78%
-

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.