GPT-4.1

GPT-4.1, lanzado por OpenAI el 14 de abril de 2025, introduce una ventana de contexto de 1 millón de tokens y admite salidas de hasta 32 768 tokens por solicitud. Ofrece un rendimiento excepcional en tareas de codificación, logrando un 54,6 % en el benchmark SWE-Bench Verified, y muestra una mejora del 10,5 % respecto a GPT-4o en MultiChallenge para el seguimiento de instrucciones. El corte de conocimiento del modelo está establecido en junio de 2024. El precio es de 2,00 $ por millón de tokens para entrada y 8,00 $ por millón de tokens para salida, con un descuento del 75 % aplicado a entradas en caché, lo que lo hace muy rentable para consultas repetidas.

Mistral Large 2

Mistral Large 2, desarrollado por Mistral, ofrece una ventana de contexto de 128 000 tokens y tiene un precio de 3,00 USD por millón de tokens de entrada y 9,00 USD por millón de tokens de salida. Lanzado el 24 de julio de 2024, el modelo obtuvo una puntuación de 84,0 en el benchmark MMLU en una evaluación de 5-shot, demostrando un fuerte rendimiento en diversas tareas.

GPT-4.1Mistral Large 2
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
texto ?
Proveedores de API ?
OpenAI API
Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
Fecha de Corte de Conocimiento ?
-
Desconocido
Código Abierto ?
No
Costo de Entrada ?
$2.00 por millón de tokens
$3.00 por millón de tokens
Costo de Salida ?
$8.00 por millón de tokens
$9.00 por millón de tokens
MMLU ?
90.2%
pass@1
Fuente
84%
5-shot
Fuente
MMLU-Pro ?
-
50.69%
Fuente
MMMU ?
74.8%
Fuente
No disponible
HellaSwag ?
-
No disponible
HumanEval ?
-
No disponible
MATH ?
-
1.13%
Fuente
GPQA ?
66.3%
Diamond
Fuente
24.94%
IFEval ?
-
84.01%
SimpleQA ?
-
-
AIME 2024
48.1%
Fuente
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
87.3%
pass@1
Fuente
-
MathVista ?
-
-
Aplicación Móvil
-

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.