GPT-4.1

GPT-4.1, lanzado por OpenAI el 14 de abril de 2025, introduce una ventana de contexto de 1 millón de tokens y admite salidas de hasta 32 768 tokens por solicitud. Ofrece un rendimiento excepcional en tareas de codificación, logrando un 54,6 % en el benchmark SWE-Bench Verified, y muestra una mejora del 10,5 % respecto a GPT-4o en MultiChallenge para el seguimiento de instrucciones. El corte de conocimiento del modelo está establecido en junio de 2024. El precio es de 2,00 $ por millón de tokens para entrada y 8,00 $ por millón de tokens para salida, con un descuento del 75 % aplicado a entradas en caché, lo que lo hace muy rentable para consultas repetidas.

Gemini 2.0 Flash

Gemini 2.0 Flash es el modelo de alto rendimiento y baja latencia de Google diseñado para impulsar experiencias agentivas avanzadas. Equipado con integración nativa de herramientas, admite entradas multimodales, incluyendo texto, imágenes, video y audio. Con mejoras significativas respecto a versiones anteriores, el modelo equilibra eficiencia, velocidad y capacidades mejoradas para interacciones en tiempo real sin interrupciones.

GPT-4.1Gemini 2.0 Flash
Proveedor
Sitio Web
Fecha de Lanzamiento
Apr 14, 2025
2 semanas ago
Dec 11, 2024
4 meses ago
Modalidades
texto ?
imágenes ?
texto ?
imágenes ?
voz ?
video ?
Proveedores de API
OpenAI API
Google AI Studio, Vertex AI
Fecha de Corte de Conocimiento
-
08.2024
Código Abierto
No
No
Costo de Entrada
$2.00 por millón de tokens
$0.10 por millón de tokens
Costo de Salida
$8.00 por millón de tokens
$0.40 por millón de tokens
MMLU
90.2%
pass@1
Fuente
No disponible
MMLU Pro
-
77.6%
Fuente
MMMU
74.8%
Fuente
71.7%
Fuente
HellaSwag
-
No disponible
HumanEval
-
No disponible
MATH
-
90.9%
Fuente
GPQA
66.3%
Diamond
Fuente
60.1%
Diamond
Fuente
IFEval
-
No disponible
Aplicación Móvil

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.