o3

OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet es el modelo de IA más avanzado de Anthropic hasta la fecha y el primer sistema de razonamiento híbrido en el mercado. Ofrece modos de pensamiento estándar y extendido, este último proporcionando un razonamiento transparente y paso a paso. El modelo demuestra mejoras significativas en codificación y desarrollo web front-end, logrando resultados de vanguardia en SWE-bench Verified y TAU-bench. Disponible a través de Claude.ai, la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI, establece un nuevo estándar para la resolución inteligente de problemas impulsada por IA.

o3Claude 3.7 Sonnet - Extended Thinking
Proveedor
Sitio Web
Fecha de Lanzamiento
Apr 16, 2025
1 semana ago
Feb 24, 2025
1 mes ago
Modalidades
texto ?
imágenes ?
texto ?
imágenes ?
Proveedores de API
OpenAI API
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Fecha de Corte de Conocimiento
-
-
Código Abierto
No
No
Costo de Entrada
$10.00 por millón de tokens
$3.00 por millón de tokens
Costo de Salida
$40.00 por millón de tokens
$15.00 por millón de tokens
MMLU
82.9%
Fuente
No disponible
MMLU Pro
-
No disponible
MMMU
-
75%
Fuente
HellaSwag
-
No disponible
HumanEval
-
No disponible
MATH
-
96.2%
Fuente
GPQA
83.3%
Diamond, no tools
Fuente
84.8%
Diamond
Fuente
IFEval
-
93.2%
Fuente
Aplicación Móvil

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.