GPT-4.1

GPT-4.1, lanzado por OpenAI el 14 de abril de 2025, introduce una ventana de contexto de 1 millón de tokens y admite salidas de hasta 32 768 tokens por solicitud. Ofrece un rendimiento excepcional en tareas de codificación, logrando un 54,6 % en el benchmark SWE-Bench Verified, y muestra una mejora del 10,5 % respecto a GPT-4o en MultiChallenge para el seguimiento de instrucciones. El corte de conocimiento del modelo está establecido en junio de 2024. El precio es de 2,00 $ por millón de tokens para entrada y 8,00 $ por millón de tokens para salida, con un descuento del 75 % aplicado a entradas en caché, lo que lo hace muy rentable para consultas repetidas.

GLM-4.5

GPT-4.1GLM-4.5
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
texto ?
Proveedores de API ?
OpenAI API
Zhipu AI
Fecha de Corte de Conocimiento ?
-
Desconocido
Código Abierto ?
No
Costo de Entrada ?
$2.00 por millón de tokens
-
Costo de Salida ?
$8.00 por millón de tokens
-
MMLU ?
90.2%
pass@1
Fuente
84.6%
Academic Knowledge
Fuente
MMLU-Pro ?
-
-
MMMU ?
74.8%
Fuente
-
HellaSwag ?
-
-
HumanEval ?
-
-
MATH ?
-
-
GPQA ?
66.3%
Diamond
Fuente
-
IFEval ?
-
-
SimpleQA ?
-
-
AIME 2024
48.1%
Fuente
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
87.3%
pass@1
Fuente
-
MathVista ?
-
-
Aplicación Móvil
-

MathArena ?

Puntuación media
-
83%
AIME 2025
Prueba basada en problemas del concurso de matemáticas (American Invitational Mathematics Examination),destinada a evaluar las habilidades matemáticas de los modelos.
-
93%
HMMT February 2025
Prueba basada en problemas del Harvard-MIT Mathematics Tournament, febrero de 2025, destinada a evaluar las habilidades matemáticas de los modelos.
-
78%
BRUMO 2025
-
92%
SMT 2025
Prueba basada en problemas del Stanford Math Tournament, 2025, destinada a evaluar las habilidades matemáticas de los modelos.
-
82%
CMIMC 2025
Prueba basada en problemas de la Olimpiada Matemática Canadiense, 2025, destinada a evaluar las habilidades matemáticas de los modelos.
-
71%

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.