Grok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

„Grok 3“ es el modelo más avanzado de xAI, entrenado en el superclúster Colossus con una potencia computacional diez veces superior a la de los modelos anteriores más avanzados. Cuenta con una ventana de contexto de 1 millón de tokens y capacidades de razonamiento avanzado, mejoradas mediante aprendizaje por refuerzo a gran escala, lo que permite procesos de pensamiento profundo que van desde segundos hasta minutos para resolver problemas complejos. El modelo alcanza un rendimiento de primer nivel en pruebas académicas y evaluaciones de usuarios en el mundo real, obteniendo una puntuación Elo de 1402 en la Chatbot Arena. Fue lanzado junto con Grok 3 Mini, una variante rentable optimizada para un razonamiento más eficiente.

Gemini 2.5 Pro

Gemini 2.5 Pro es el modelo de IA más avanzado de Google, diseñado para razonamiento profundo y generación de respuestas reflexivas. Supera los principales benchmarks demostrando lógica excepcional y competencia en codificación. Optimizado para construir aplicaciones web dinámicas, sistemas de código autónomo y adaptación de código, ofrece un rendimiento de alto nivel. Con capacidades multimodales integradas y una ventana de contexto extendida, procesa eficientemente grandes conjuntos de datos e integra diversas fuentes de información para abordar desafíos complejos.

	Grok 3 Beta	Gemini 2.5 Pro
Sitio Web ?	Open	Open
Proveedor ?	xAI	Google
Chat ?
Fecha de Lanzamiento ?
Modalidades ?	texto ? imágenes ? video ?	texto ? imágenes ? voz ? video ?
Proveedores de API ?	xAI	Google AI Studio, Vertex AI, Gemini app
Fecha de Corte de Conocimiento ?	2025-01	-
Código Abierto ?	No	No
Costo de Entrada ?	No disponible	No disponible
Costo de Salida ?	No disponible	No disponible
MMLU ?	No disponible	No disponible
MMLU-Pro ?	79.9% Base model Fuente	No disponible
MMMU ?	78% With Think mode Fuente	81.7% Fuente
HellaSwag ?	No disponible	No disponible
HumanEval ?	No disponible	No disponible
MATH ?	No disponible	No disponible
GPQA ?	84.6% With Think mode, Diamond Fuente	84.0% Diamond Science Fuente
IFEval ?	No disponible	No disponible
SimpleQA ?	-	52.9%
AIME 2024	-	92.0%
AIME 2025	-	86.7%
Aider Polyglot ?	-	74.0% / 68.6%
LiveCodeBench v5 ?	-	70.4%
Global MMLU (Lite) ?	-	89.8%
MathVista ?	-	-
Aplicación Móvil	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
Puntuación total	-	0.48%
Doom II	-	0%
Dream DX	-	4.8%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

Grok 3 Beta

Gemini 2.5 Pro

Sitio Web ?

Open

Proveedor ?

xAI

Google

Chat ?

Fecha de Lanzamiento ?

Modalidades ?

texto ?
imágenes ?
video ?

texto ?
imágenes ?
voz ?
video ?

Proveedores de API ?

xAI

Google AI Studio, Vertex AI, Gemini app

Fecha de Corte de Conocimiento ?

2025-01

Código Abierto ?

Costo de Entrada ?

No disponible

Costo de Salida ?

No disponible

MMLU ?

No disponible

MMLU-Pro ?

79.9%
Base model
Fuente

No disponible

MMMU ?

78%
With Think mode
Fuente

81.7%
Fuente

HellaSwag ?

No disponible

HumanEval ?

No disponible

MATH ?

No disponible

GPQA ?

84.6%
With Think mode, Diamond
Fuente

84.0%
Diamond Science
Fuente

IFEval ?

No disponible

SimpleQA ?

52.9%

AIME 2024

92.0%

AIME 2025

86.7%

Aider Polyglot ?

74.0% / 68.6%

LiveCodeBench v5 ?

70.4%

Global MMLU (Lite) ?

89.8%

MathVista ?

Aplicación Móvil

Google Play
Apple Apps

VideoGameBench ?

Puntuación total

0.48%

Doom II

Dream DX

4.8%

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

Comparar LLMs
Grok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

Comparar LLMs

Agregar un Comentario

Comparar LLMsGrok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

Comparar LLMs

Agregar un Comentario

Comparar LLMs
Grok 3 Beta vs Gemini 2.5 Pro