o3 vs Claude 3.7 Sonnet - Comparar LLMs

o3

OpenAI o3 es el modelo de razonamiento más avanzado de OpenAI, creado específicamente para manejar tareas complejas de alta cognición. Lanzado en abril de 2025, ofrece un rendimiento excepcional en ingeniería de software, matemáticas y resolución de problemas científicos. El modelo introduce tres niveles de esfuerzo de razonamiento —bajo, medio y alto—, permitiendo a los usuarios equilibrar latencia y profundidad según la complejidad de la tarea. o3 incluye herramientas esenciales para desarrolladores, como llamadas a funciones, salidas estructuradas y mensajes a nivel de sistema. Con capacidades visuales integradas, o3 puede interpretar y analizar imágenes, siendo apto para aplicaciones multimodales. Está disponible mediante Chat Completions API, Assistants API y Batch API para una integración flexible en flujos de trabajo empresariales y de investigación.

Claude 3.7 Sonnet

Claude 3.7 Sonnet es el modelo más avanzado de Anthropic hasta la fecha y la primera IA de razonamiento híbrido en el mercado. Ofrece modos de pensamiento estándar y extendido, este último proporcionando un razonamiento transparente y paso a paso. El modelo sobresale en codificación y desarrollo web front-end, logrando resultados de vanguardia en SWE-bench Verified y TAU-bench. Disponible a través de Claude.ai, la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI, establece un nuevo estándar para la resolución inteligente de problemas impulsada por IA.

	o3	Claude 3.7 Sonnet
Sitio Web ?	Open	Open
Proveedor ?	OpenAI	Anthropic
Chat ?
Fecha de Lanzamiento ?
Modalidades ?	texto ? imágenes ?	texto ? imágenes ?
Proveedores de API ?	OpenAI API	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Fecha de Corte de Conocimiento ?	-	-
Código Abierto ?	No	No
Costo de Entrada ?	$10.00 por millón de tokens	$3.00 por millón de tokens
Costo de Salida ?	$40.00 por millón de tokens	$15.00 por millón de tokens
MMLU ?	82.9% Fuente	No disponible
MMLU-Pro ?	-	No disponible
MMMU ?	-	71.8% Fuente
HellaSwag ?	-	No disponible
HumanEval ?	-	No disponible
MATH ?	-	82.2% Fuente
GPQA ?	83.3% Diamond, no tools Fuente	68% Diamond Fuente
IFEval ?	-	90.8% Fuente
SimpleQA ?	-	-
AIME 2024	91.6% Fuente	-
AIME 2025	88.9% Fuente	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Aplicación Móvil	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
Puntuación total	-	0%
Doom II	-	0%
Dream DX	-	0%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

Claude 3.7 Sonnet

Sitio Web ?

Open

Proveedor ?

OpenAI

Anthropic

Chat ?

Fecha de Lanzamiento ?

Modalidades ?

texto ?
imágenes ?

Proveedores de API ?

OpenAI API

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Fecha de Corte de Conocimiento ?

Código Abierto ?

Costo de Entrada ?

$10.00 por millón de tokens

$3.00 por millón de tokens

Costo de Salida ?

$40.00 por millón de tokens

$15.00 por millón de tokens

MMLU ?

82.9%
Fuente

No disponible

MMLU-Pro ?

No disponible

MMMU ?

71.8%
Fuente

HellaSwag ?

No disponible

HumanEval ?

No disponible

MATH ?

82.2%
Fuente

GPQA ?

83.3%
Diamond, no tools
Fuente

68%
Diamond
Fuente

IFEval ?

90.8%
Fuente

SimpleQA ?

AIME 2024

91.6%
Fuente

AIME 2025

88.9%
Fuente

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Aplicación Móvil

Google Play
Apple Apps

VideoGameBench ?

Puntuación total

Doom II

Dream DX

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

Comparar LLMs
o3 vs Claude 3.7 Sonnet

o3

Claude 3.7 Sonnet

VideoGameBench ?

Comparar LLMs

Agregar un Comentario

Comparar LLMso3 vs Claude 3.7 Sonnet

o3

Claude 3.7 Sonnet

VideoGameBench ?

Comparar LLMs

Agregar un Comentario

Comparar LLMs
o3 vs Claude 3.7 Sonnet