DeepSeek-R1 vs o4-mini - Comparar LLMs

DeepSeek-R1

DeepSeek-R1 es un modelo Mixture-of-Experts (MoE) con 671 mil millones de parámetros, de los cuales 37 mil millones se activan por token. Fue entrenado mediante aprendizaje por refuerzo a gran escala, con un enfoque en capacidades de razonamiento. Incorpora dos etapas de RL para descubrir patrones de razonamiento mejorados y alinearse con las preferencias humanas, además de dos etapas de SFT para desarrollar habilidades de razonamiento y no razonamiento. El modelo logra un rendimiento comparable a OpenAI-o1 en tareas de matemáticas, programación y razonamiento.

o4-mini

OpenAI o4-mini es el modelo más reciente y ligero de la serie o, diseñado para un razonamiento eficiente y capaz en tareas tanto de texto como visuales. Optimizado para velocidad y rendimiento, destaca en generación de código y comprensión basada en imágenes, manteniendo un equilibrio entre latencia y profundidad de razonamiento. El modelo admite una ventana de contexto de 200.000 tokens con hasta 100.000 tokens de salida, lo que lo hace ideal para interacciones extensas y de alto volumen. Procesa entradas tanto de texto como de imágenes y produce salidas textuales con capacidades avanzadas de razonamiento. Gracias a su arquitectura compacta y rendimiento versátil, o4-mini es perfecto para una amplia gama de aplicaciones del mundo real que requieren inteligencia rápida y rentable.

	DeepSeek-R1	o4-mini
Sitio Web ?	Open	Open
Proveedor ?	DeepSeek	OpenAI
Chat ?
Fecha de Lanzamiento ?
Modalidades ?	texto ?	texto ? imágenes ?
Proveedores de API ?	DeepSeek, HuggingFace	OpenAI API
Fecha de Corte de Conocimiento ?	Desconocido	-
Código Abierto ?	Sí	No
Costo de Entrada ?	$0.55 por millón de tokens	$1.10 por millón de tokens
Costo de Salida ?	$2.19 por millón de tokens	$4.40 por millón de tokens
MMLU ?	90.8% Pass@1 Fuente	fort
MMLU-Pro ?	84% EM Fuente	-
MMMU ?	-	81.6% Fuente
HellaSwag ?	-	-
HumanEval ?	-	14.28% Fuente
MATH ?	-	-
GPQA ?	71.5% Pass@1 Fuente	81.4% Fuente
IFEval ?	83.3% Prompt Strict Fuente	-
SimpleQA ?	-	-
AIME 2024	-	93.4% Fuente
AIME 2025	-	92.7% Fuente
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Aplicación Móvil	Google Play Apple Apps	Google Play Apple Apps

DeepSeek-R1

o4-mini

Sitio Web ?

Open

Proveedor ?

DeepSeek

OpenAI

Chat ?

Fecha de Lanzamiento ?

Modalidades ?

texto ?

texto ?
imágenes ?

Proveedores de API ?

DeepSeek, HuggingFace

OpenAI API

Fecha de Corte de Conocimiento ?

Desconocido

Código Abierto ?

Sí

Costo de Entrada ?

$0.55 por millón de tokens

$1.10 por millón de tokens

Costo de Salida ?

$2.19 por millón de tokens

$4.40 por millón de tokens

MMLU ?

90.8%
Pass@1
Fuente

fort

MMLU-Pro ?

84%
EM
Fuente

MMMU ?

81.6%
Fuente

HellaSwag ?

HumanEval ?

14.28%
Fuente

MATH ?

GPQA ?

71.5%
Pass@1
Fuente

81.4%
Fuente

IFEval ?

83.3%
Prompt Strict
Fuente

SimpleQA ?

AIME 2024

93.4%
Fuente

AIME 2025

92.7%
Fuente

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Aplicación Móvil

Google Play
Apple Apps

Comparar LLMs
DeepSeek-R1 vs o4-mini

DeepSeek-R1

o4-mini

Comparar LLMs

Agregar un Comentario

Comparar LLMsDeepSeek-R1 vs o4-mini

DeepSeek-R1

o4-mini

Comparar LLMs

Agregar un Comentario

Comparar LLMs
DeepSeek-R1 vs o4-mini