o3

OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.

Gemini 2.0 Flash

Gemini 2.0 Flash es el modelo de alto rendimiento y baja latencia de Google diseñado para impulsar experiencias agentivas avanzadas. Equipado con integración nativa de herramientas, admite entradas multimodales, incluyendo texto, imágenes, video y audio. Con mejoras significativas respecto a versiones anteriores, el modelo equilibra eficiencia, velocidad y capacidades mejoradas para interacciones en tiempo real sin interrupciones.

o3Gemini 2.0 Flash
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
texto ?
imágenes ?
voz ?
video ?
Proveedores de API ?
OpenAI API
Google AI Studio, Vertex AI
Fecha de Corte de Conocimiento ?
-
08.2024
Código Abierto ?
No
No
Costo de Entrada ?
$10.00 por millón de tokens
$0.10 por millón de tokens
Costo de Salida ?
$40.00 por millón de tokens
$0.40 por millón de tokens
MMLU ?
82.9%
Fuente
No disponible
MMLU-Pro ?
-
77.6%
Fuente
MMMU ?
-
71.7%
Fuente
HellaSwag ?
-
No disponible
HumanEval ?
-
No disponible
MATH ?
-
90.9%
Fuente
GPQA ?
83.3%
Diamond, no tools
Fuente
60.1%
Diamond
Fuente
IFEval ?
-
No disponible
SimpleQA ?
-
-
AIME 2024
91.6%
Fuente
-
AIME 2025
88.9%
Fuente
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Aplicación Móvil

VideoGameBench ?

Puntuación total
-
0%
Doom II
-
0%
Dream DX
-
0%
Awakening DX
-
0%
Civilization I
-
0%
Pokemon Crystal
-
0%
The Need for Speed
-
0%
The Incredible Machine
-
0%
Secret Game 1
-
0%
Secret Game 2
-
0%
Secret Game 3
-
0%

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.