Grok 3 Beta vs Gemini 2.5 Pro

	Grok 3 Beta	Gemini 2.5 Pro
网站 ?	Open	Open
提供商 ?	xAI	Google
聊天 ?
发布日期 ?
模态 ?	文本 ? 图像 ? 视频 ?	文本 ? 图像 ? 语音 ? 视频 ?
API提供商 ?	xAI	Google AI Studio, Vertex AI, Gemini app
知识截止日期 ?	2025-01	-
开源 ?	否	否
输入定价 ?	不可用	不可用
输出定价 ?	不可用	不可用
MMLU ?	不可用	不可用
MMLU-Pro ?	79.9% Base model 来源	不可用
MMMU ?	78% With Think mode 来源	81.7% 来源
HellaSwag ?	不可用	不可用
HumanEval ?	不可用	不可用
MATH ?	不可用	不可用
GPQA ?	84.6% With Think mode, Diamond 来源	84.0% Diamond Science 来源
IFEval ?	不可用	不可用
SimpleQA ?	-	52.9%
AIME 2024	-	92.0%
AIME 2025	-	86.7%
Aider Polyglot ?	-	74.0% / 68.6%
LiveCodeBench v5 ?	-	70.4%
Global MMLU (Lite) ?	-	89.8%
MathVista ?	-	-
移动应用	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
总分	-	0.48%
Doom II	-	0%
Dream DX	-	4.8%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

对比LLM

Claude Opus 4 vs Claude Sonnet 4
Claude Opus 4 vs Grok 3 Beta
Claude Opus 4 vs GPT-4.5
Claude Opus 4 vs DeepSeek-R1
Claude Opus 4 vs Nova Pro
Claude Opus 4 vs Gemini 2.5 Pro
Claude Opus 4 vs Llama 4 Maverick
Claude Opus 4 vs o3
Claude Opus 4 vs Qwen 3
Claude Opus 4 vs Claude 3.5 Haiku
Claude Opus 4 vs o3-mini
Claude Opus 4 vs Claude 3.7 Sonnet - Extended Thinking
Claude Opus 4 vs Llama 4 Scout
Claude Opus 4 vs o4-mini
Claude Opus 4 vs GPT-4.1
Claude Opus 4 vs Gemini 2.0 Pro
Claude Opus 4 vs Gemini 2.0 Flash
Claude Opus 4 vs Claude 3.7 Sonnet
Claude Opus 4 vs Qwen2.5-VL-32B
Claude Opus 4 vs GPT-4.1 Nano
Claude Opus 4 vs Gemini 2.0 Flash Thinking
Claude Opus 4 vs Llama 3.3 70B Instruct
Claude Opus 4 vs Llama 3.1 Nemotron 70B Instruct
Claude Opus 4 vs Command A
Claude Opus 4 vs Nova Lite
Claude Opus 4 vs Mistral Large 2
Claude Opus 4 vs Nova Micro
Claude Sonnet 4 vs Grok 3 Beta
Claude Sonnet 4 vs GPT-4.5
Claude Sonnet 4 vs DeepSeek-R1
Claude Sonnet 4 vs Nova Pro
Claude Sonnet 4 vs Gemini 2.5 Pro
Claude Sonnet 4 vs Llama 4 Maverick
Claude Sonnet 4 vs o3
Claude Sonnet 4 vs Qwen 3
Claude Sonnet 4 vs Claude 3.5 Haiku
Claude Sonnet 4 vs o3-mini
Claude Sonnet 4 vs Claude 3.7 Sonnet - Extended Thinking
Claude Sonnet 4 vs Llama 4 Scout
Claude Sonnet 4 vs o4-mini
Claude Sonnet 4 vs GPT-4.1
Claude Sonnet 4 vs Gemini 2.0 Pro
Claude Sonnet 4 vs Gemini 2.0 Flash
Claude Sonnet 4 vs Claude 3.7 Sonnet
Claude Sonnet 4 vs Qwen2.5-VL-32B
Claude Sonnet 4 vs GPT-4.1 Nano
Claude Sonnet 4 vs Gemini 2.0 Flash Thinking
Claude Sonnet 4 vs Llama 3.3 70B Instruct
Claude Sonnet 4 vs Llama 3.1 Nemotron 70B Instruct
Claude Sonnet 4 vs Command A
Claude Sonnet 4 vs Nova Lite
Claude Sonnet 4 vs Mistral Large 2
Claude Sonnet 4 vs Nova Micro
Grok 3 Beta vs GPT-4.5
Grok 3 Beta vs DeepSeek-R1
Grok 3 Beta vs Nova Pro
Grok 3 Beta vs Gemini 2.5 Pro
Grok 3 Beta vs Llama 4 Maverick
Grok 3 Beta vs o3
Grok 3 Beta vs Qwen 3
Grok 3 Beta vs Claude 3.5 Haiku
Grok 3 Beta vs o3-mini
Grok 3 Beta vs Claude 3.7 Sonnet - Extended Thinking
Grok 3 Beta vs Llama 4 Scout
Grok 3 Beta vs o4-mini
Grok 3 Beta vs GPT-4.1
Grok 3 Beta vs Gemini 2.0 Pro
Grok 3 Beta vs Gemini 2.0 Flash
Grok 3 Beta vs Claude 3.7 Sonnet
Grok 3 Beta vs Qwen2.5-VL-32B
Grok 3 Beta vs GPT-4.1 Nano
Grok 3 Beta vs Gemini 2.0 Flash Thinking
Grok 3 Beta vs Llama 3.3 70B Instruct
Grok 3 Beta vs Llama 3.1 Nemotron 70B Instruct
Grok 3 Beta vs Command A
Grok 3 Beta vs Nova Lite
Grok 3 Beta vs Mistral Large 2
Grok 3 Beta vs Nova Micro
GPT-4.5 vs DeepSeek-R1
GPT-4.5 vs Nova Pro
GPT-4.5 vs Gemini 2.5 Pro
GPT-4.5 vs Llama 4 Maverick
GPT-4.5 vs o3
GPT-4.5 vs Qwen 3
GPT-4.5 vs Claude 3.5 Haiku
GPT-4.5 vs o3-mini
GPT-4.5 vs Claude 3.7 Sonnet - Extended Thinking
GPT-4.5 vs Llama 4 Scout
GPT-4.5 vs o4-mini
GPT-4.5 vs GPT-4.1
GPT-4.5 vs Gemini 2.0 Pro
GPT-4.5 vs Gemini 2.0 Flash
GPT-4.5 vs Claude 3.7 Sonnet
GPT-4.5 vs Qwen2.5-VL-32B
GPT-4.5 vs GPT-4.1 Nano
GPT-4.5 vs Gemini 2.0 Flash Thinking
GPT-4.5 vs Llama 3.3 70B Instruct
GPT-4.5 vs Llama 3.1 Nemotron 70B Instruct
GPT-4.5 vs Command A
GPT-4.5 vs Nova Lite
GPT-4.5 vs Mistral Large 2
GPT-4.5 vs Nova Micro
DeepSeek-R1 vs Nova Pro
DeepSeek-R1 vs Gemini 2.5 Pro
DeepSeek-R1 vs Llama 4 Maverick
DeepSeek-R1 vs o3
DeepSeek-R1 vs Qwen 3
DeepSeek-R1 vs Claude 3.5 Haiku
DeepSeek-R1 vs o3-mini
DeepSeek-R1 vs Claude 3.7 Sonnet - Extended Thinking
DeepSeek-R1 vs Llama 4 Scout
DeepSeek-R1 vs o4-mini
DeepSeek-R1 vs GPT-4.1
DeepSeek-R1 vs Gemini 2.0 Pro
DeepSeek-R1 vs Gemini 2.0 Flash
DeepSeek-R1 vs Claude 3.7 Sonnet
DeepSeek-R1 vs Qwen2.5-VL-32B
DeepSeek-R1 vs GPT-4.1 Nano
DeepSeek-R1 vs Gemini 2.0 Flash Thinking
DeepSeek-R1 vs Llama 3.3 70B Instruct
DeepSeek-R1 vs Llama 3.1 Nemotron 70B Instruct
DeepSeek-R1 vs Command A
DeepSeek-R1 vs Nova Lite
DeepSeek-R1 vs Mistral Large 2
DeepSeek-R1 vs Nova Micro
Nova Pro vs Gemini 2.5 Pro
Nova Pro vs Llama 4 Maverick
Nova Pro vs o3
Nova Pro vs Qwen 3
Nova Pro vs Claude 3.5 Haiku
Nova Pro vs o3-mini
Nova Pro vs Claude 3.7 Sonnet - Extended Thinking
Nova Pro vs Llama 4 Scout
Nova Pro vs o4-mini
Nova Pro vs GPT-4.1
Nova Pro vs Gemini 2.0 Pro
Nova Pro vs Gemini 2.0 Flash
Nova Pro vs Claude 3.7 Sonnet
Nova Pro vs Qwen2.5-VL-32B
Nova Pro vs GPT-4.1 Nano
Nova Pro vs Gemini 2.0 Flash Thinking
Nova Pro vs Llama 3.3 70B Instruct
Nova Pro vs Llama 3.1 Nemotron 70B Instruct
Nova Pro vs Command A
Nova Pro vs Nova Lite
Nova Pro vs Mistral Large 2
Nova Pro vs Nova Micro
Gemini 2.5 Pro vs Llama 4 Maverick
Gemini 2.5 Pro vs o3
Gemini 2.5 Pro vs Qwen 3
Gemini 2.5 Pro vs Claude 3.5 Haiku
Gemini 2.5 Pro vs o3-mini
Gemini 2.5 Pro vs Claude 3.7 Sonnet - Extended Thinking
Gemini 2.5 Pro vs Llama 4 Scout
Gemini 2.5 Pro vs o4-mini
Gemini 2.5 Pro vs GPT-4.1
Gemini 2.5 Pro vs Gemini 2.0 Pro
Gemini 2.5 Pro vs Gemini 2.0 Flash
Gemini 2.5 Pro vs Claude 3.7 Sonnet
Gemini 2.5 Pro vs Qwen2.5-VL-32B
Gemini 2.5 Pro vs GPT-4.1 Nano
Gemini 2.5 Pro vs Gemini 2.0 Flash Thinking
Gemini 2.5 Pro vs Llama 3.3 70B Instruct
Gemini 2.5 Pro vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.5 Pro vs Command A
Gemini 2.5 Pro vs Nova Lite
Gemini 2.5 Pro vs Mistral Large 2
Gemini 2.5 Pro vs Nova Micro
Llama 4 Maverick vs o3
Llama 4 Maverick vs Qwen 3
Llama 4 Maverick vs Claude 3.5 Haiku
Llama 4 Maverick vs o3-mini
Llama 4 Maverick vs Claude 3.7 Sonnet - Extended Thinking
Llama 4 Maverick vs Llama 4 Scout
Llama 4 Maverick vs o4-mini
Llama 4 Maverick vs GPT-4.1
Llama 4 Maverick vs Gemini 2.0 Pro
Llama 4 Maverick vs Gemini 2.0 Flash
Llama 4 Maverick vs Claude 3.7 Sonnet
Llama 4 Maverick vs Qwen2.5-VL-32B
Llama 4 Maverick vs GPT-4.1 Nano
Llama 4 Maverick vs Gemini 2.0 Flash Thinking
Llama 4 Maverick vs Llama 3.3 70B Instruct
Llama 4 Maverick vs Llama 3.1 Nemotron 70B Instruct
Llama 4 Maverick vs Command A
Llama 4 Maverick vs Nova Lite
Llama 4 Maverick vs Mistral Large 2
Llama 4 Maverick vs Nova Micro
o3 vs Qwen 3
o3 vs Claude 3.5 Haiku
o3 vs o3-mini
o3 vs Claude 3.7 Sonnet - Extended Thinking
o3 vs Llama 4 Scout
o3 vs o4-mini
o3 vs GPT-4.1
o3 vs Gemini 2.0 Pro
o3 vs Gemini 2.0 Flash
o3 vs Claude 3.7 Sonnet
o3 vs Qwen2.5-VL-32B
o3 vs GPT-4.1 Nano
o3 vs Gemini 2.0 Flash Thinking
o3 vs Llama 3.3 70B Instruct
o3 vs Llama 3.1 Nemotron 70B Instruct
o3 vs Command A
o3 vs Nova Lite
o3 vs Mistral Large 2
o3 vs Nova Micro
Qwen 3 vs Claude 3.5 Haiku
Qwen 3 vs o3-mini
Qwen 3 vs Claude 3.7 Sonnet - Extended Thinking
Qwen 3 vs Llama 4 Scout
Qwen 3 vs o4-mini
Qwen 3 vs GPT-4.1
Qwen 3 vs Gemini 2.0 Pro
Qwen 3 vs Gemini 2.0 Flash
Qwen 3 vs Claude 3.7 Sonnet
Qwen 3 vs Qwen2.5-VL-32B
Qwen 3 vs GPT-4.1 Nano
Qwen 3 vs Gemini 2.0 Flash Thinking
Qwen 3 vs Llama 3.3 70B Instruct
Qwen 3 vs Llama 3.1 Nemotron 70B Instruct
Qwen 3 vs Command A
Qwen 3 vs Nova Lite
Qwen 3 vs Mistral Large 2
Qwen 3 vs Nova Micro
Claude 3.5 Haiku vs o3-mini
Claude 3.5 Haiku vs Claude 3.7 Sonnet - Extended Thinking
Claude 3.5 Haiku vs Llama 4 Scout
Claude 3.5 Haiku vs o4-mini
Claude 3.5 Haiku vs GPT-4.1
Claude 3.5 Haiku vs Gemini 2.0 Pro
Claude 3.5 Haiku vs Gemini 2.0 Flash
Claude 3.5 Haiku vs Claude 3.7 Sonnet
Claude 3.5 Haiku vs Qwen2.5-VL-32B
Claude 3.5 Haiku vs GPT-4.1 Nano
Claude 3.5 Haiku vs Gemini 2.0 Flash Thinking
Claude 3.5 Haiku vs Llama 3.3 70B Instruct
Claude 3.5 Haiku vs Llama 3.1 Nemotron 70B Instruct
Claude 3.5 Haiku vs Command A
Claude 3.5 Haiku vs Nova Lite
Claude 3.5 Haiku vs Mistral Large 2
Claude 3.5 Haiku vs Nova Micro
o3-mini vs Claude 3.7 Sonnet - Extended Thinking
o3-mini vs Llama 4 Scout
o3-mini vs o4-mini
o3-mini vs GPT-4.1
o3-mini vs Gemini 2.0 Pro
o3-mini vs Gemini 2.0 Flash
o3-mini vs Claude 3.7 Sonnet
o3-mini vs Qwen2.5-VL-32B
o3-mini vs GPT-4.1 Nano
o3-mini vs Gemini 2.0 Flash Thinking
o3-mini vs Llama 3.3 70B Instruct
o3-mini vs Llama 3.1 Nemotron 70B Instruct
o3-mini vs Command A
o3-mini vs Nova Lite
o3-mini vs Mistral Large 2
o3-mini vs Nova Micro
Claude 3.7 Sonnet - Extended Thinking vs Llama 4 Scout
Claude 3.7 Sonnet - Extended Thinking vs o4-mini
Claude 3.7 Sonnet - Extended Thinking vs GPT-4.1
Claude 3.7 Sonnet - Extended Thinking vs Gemini 2.0 Pro
Claude 3.7 Sonnet - Extended Thinking vs Gemini 2.0 Flash
Claude 3.7 Sonnet - Extended Thinking vs Claude 3.7 Sonnet
Claude 3.7 Sonnet - Extended Thinking vs Qwen2.5-VL-32B
Claude 3.7 Sonnet - Extended Thinking vs GPT-4.1 Nano
Claude 3.7 Sonnet - Extended Thinking vs Gemini 2.0 Flash Thinking
Claude 3.7 Sonnet - Extended Thinking vs Llama 3.3 70B Instruct
Claude 3.7 Sonnet - Extended Thinking vs Llama 3.1 Nemotron 70B Instruct
Claude 3.7 Sonnet - Extended Thinking vs Command A
Claude 3.7 Sonnet - Extended Thinking vs Nova Lite
Claude 3.7 Sonnet - Extended Thinking vs Mistral Large 2
Claude 3.7 Sonnet - Extended Thinking vs Nova Micro
Llama 4 Scout vs o4-mini
Llama 4 Scout vs GPT-4.1
Llama 4 Scout vs Gemini 2.0 Pro
Llama 4 Scout vs Gemini 2.0 Flash
Llama 4 Scout vs Claude 3.7 Sonnet
Llama 4 Scout vs Qwen2.5-VL-32B
Llama 4 Scout vs GPT-4.1 Nano
Llama 4 Scout vs Gemini 2.0 Flash Thinking
Llama 4 Scout vs Llama 3.3 70B Instruct
Llama 4 Scout vs Llama 3.1 Nemotron 70B Instruct
Llama 4 Scout vs Command A
Llama 4 Scout vs Nova Lite
Llama 4 Scout vs Mistral Large 2
Llama 4 Scout vs Nova Micro
o4-mini vs GPT-4.1
o4-mini vs Gemini 2.0 Pro
o4-mini vs Gemini 2.0 Flash
o4-mini vs Claude 3.7 Sonnet
o4-mini vs Qwen2.5-VL-32B
o4-mini vs GPT-4.1 Nano
o4-mini vs Gemini 2.0 Flash Thinking
o4-mini vs Llama 3.3 70B Instruct
o4-mini vs Llama 3.1 Nemotron 70B Instruct
o4-mini vs Command A
o4-mini vs Nova Lite
o4-mini vs Mistral Large 2
o4-mini vs Nova Micro
GPT-4.1 vs Gemini 2.0 Pro
GPT-4.1 vs Gemini 2.0 Flash
GPT-4.1 vs Claude 3.7 Sonnet
GPT-4.1 vs Qwen2.5-VL-32B
GPT-4.1 vs GPT-4.1 Nano
GPT-4.1 vs Gemini 2.0 Flash Thinking
GPT-4.1 vs Llama 3.3 70B Instruct
GPT-4.1 vs Llama 3.1 Nemotron 70B Instruct
GPT-4.1 vs Command A
GPT-4.1 vs Nova Lite
GPT-4.1 vs Mistral Large 2
GPT-4.1 vs Nova Micro
Gemini 2.0 Pro vs Gemini 2.0 Flash
Gemini 2.0 Pro vs Claude 3.7 Sonnet
Gemini 2.0 Pro vs Qwen2.5-VL-32B
Gemini 2.0 Pro vs GPT-4.1 Nano
Gemini 2.0 Pro vs Gemini 2.0 Flash Thinking
Gemini 2.0 Pro vs Llama 3.3 70B Instruct
Gemini 2.0 Pro vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.0 Pro vs Command A
Gemini 2.0 Pro vs Nova Lite
Gemini 2.0 Pro vs Mistral Large 2
Gemini 2.0 Pro vs Nova Micro
Gemini 2.0 Flash vs Claude 3.7 Sonnet
Gemini 2.0 Flash vs Qwen2.5-VL-32B
Gemini 2.0 Flash vs GPT-4.1 Nano
Gemini 2.0 Flash vs Gemini 2.0 Flash Thinking
Gemini 2.0 Flash vs Llama 3.3 70B Instruct
Gemini 2.0 Flash vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.0 Flash vs Command A
Gemini 2.0 Flash vs Nova Lite
Gemini 2.0 Flash vs Mistral Large 2
Gemini 2.0 Flash vs Nova Micro
Claude 3.7 Sonnet vs Qwen2.5-VL-32B
Claude 3.7 Sonnet vs GPT-4.1 Nano
Claude 3.7 Sonnet vs Gemini 2.0 Flash Thinking
Claude 3.7 Sonnet vs Llama 3.3 70B Instruct
Claude 3.7 Sonnet vs Llama 3.1 Nemotron 70B Instruct
Claude 3.7 Sonnet vs Command A
Claude 3.7 Sonnet vs Nova Lite
Claude 3.7 Sonnet vs Mistral Large 2
Claude 3.7 Sonnet vs Nova Micro
Qwen2.5-VL-32B vs GPT-4.1 Nano
Qwen2.5-VL-32B vs Gemini 2.0 Flash Thinking
Qwen2.5-VL-32B vs Llama 3.3 70B Instruct
Qwen2.5-VL-32B vs Llama 3.1 Nemotron 70B Instruct
Qwen2.5-VL-32B vs Command A
Qwen2.5-VL-32B vs Nova Lite
Qwen2.5-VL-32B vs Mistral Large 2
Qwen2.5-VL-32B vs Nova Micro
GPT-4.1 Nano vs Gemini 2.0 Flash Thinking
GPT-4.1 Nano vs Llama 3.3 70B Instruct
GPT-4.1 Nano vs Llama 3.1 Nemotron 70B Instruct
GPT-4.1 Nano vs Command A
GPT-4.1 Nano vs Nova Lite
GPT-4.1 Nano vs Mistral Large 2
GPT-4.1 Nano vs Nova Micro
Gemini 2.0 Flash Thinking vs Llama 3.3 70B Instruct
Gemini 2.0 Flash Thinking vs Llama 3.1 Nemotron 70B Instruct
Gemini 2.0 Flash Thinking vs Command A
Gemini 2.0 Flash Thinking vs Nova Lite
Gemini 2.0 Flash Thinking vs Mistral Large 2
Gemini 2.0 Flash Thinking vs Nova Micro
Llama 3.3 70B Instruct vs Llama 3.1 Nemotron 70B Instruct
Llama 3.3 70B Instruct vs Command A
Llama 3.3 70B Instruct vs Nova Lite
Llama 3.3 70B Instruct vs Mistral Large 2
Llama 3.3 70B Instruct vs Nova Micro
Llama 3.1 Nemotron 70B Instruct vs Command A
Llama 3.1 Nemotron 70B Instruct vs Nova Lite
Llama 3.1 Nemotron 70B Instruct vs Mistral Large 2
Llama 3.1 Nemotron 70B Instruct vs Nova Micro
Command A vs Nova Lite
Command A vs Mistral Large 2
Command A vs Nova Micro
Nova Lite vs Mistral Large 2
Nova Lite vs Nova Micro
Mistral Large 2 vs Nova Micro

对比LLM
Grok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

对比LLM

添加评论

对比LLMGrok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

对比LLM

添加评论

对比LLM
Grok 3 Beta vs Gemini 2.5 Pro