Grok 3 Beta

„Grok 3“ es el modelo más avanzado de xAI, entrenado en el superclúster Colossus con una potencia computacional diez veces superior a la de los modelos anteriores más avanzados. Cuenta con una ventana de contexto de 1 millón de tokens y capacidades de razonamiento avanzado, mejoradas mediante aprendizaje por refuerzo a gran escala, lo que permite procesos de pensamiento profundo que van desde segundos hasta minutos para resolver problemas complejos. El modelo alcanza un rendimiento de primer nivel en pruebas académicas y evaluaciones de usuarios en el mundo real, obteniendo una puntuación Elo de 1402 en la Chatbot Arena. Fue lanzado junto con Grok 3 Mini, una variante rentable optimizada para un razonamiento más eficiente.

Gemini 2.0 Pro

Gemini 2.0 Pro es el modelo más avanzado de Google hasta la fecha, ofreciendo un rendimiento excepcional en programación y manejando con facilidad instrucciones complejas. Cuenta con capacidades mejoradas, como integración nativa de herramientas, generación de imágenes y síntesis de voz. Diseñado para un razonamiento avanzado, el modelo admite entradas multimodales, incluyendo texto, imágenes, video y audio. Disponible a través de Google AI Studio y Vertex AI, proporciona mejoras significativas en el rendimiento con respecto a versiones anteriores, manteniendo una alta eficiencia.

Grok 3 BetaGemini 2.0 Pro
Sitio Web ?
Proveedor ?
Chat ?
Fecha de Lanzamiento ?
Modalidades ?
texto ?
imágenes ?
video ?
texto ?
imágenes ?
voz ?
video ?
Proveedores de API ?
xAI
Google AI Studio, Vertex AI
Fecha de Corte de Conocimiento ?
2025-01
08.2024
Código Abierto ?
No
No
Costo de Entrada ?
No disponible
$0.10 por millón de tokens
Costo de Salida ?
No disponible
$0.40 por millón de tokens
MMLU ?
No disponible
No disponible
MMLU-Pro ?
79.9%
Base model
Fuente
79.1%
Fuente
MMMU ?
78%
With Think mode
Fuente
72.7%
Fuente
HellaSwag ?
No disponible
No disponible
HumanEval ?
No disponible
No disponible
MATH ?
No disponible
91.8%
Fuente
GPQA ?
84.6%
With Think mode, Diamond
Fuente
64.7%
Diamond
Fuente
IFEval ?
No disponible
No disponible
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Aplicación Móvil

Comparar LLMs

Agregar un Comentario


10%
Nuestro sitio utiliza cookies.

Política de privacidad y cookies: este sitio utiliza cookies. Si continúa utilizando el sitio, acepta su uso.