Grok 3 Beta vs Gemini 2.5 Pro - LLM-ek Összehasonlítása

Grok 3 Beta

„Grok 3“ az xAI legfejlettebb modellje, amelyet a Colossus szuperszámítógép-klaszteren képeztek ki, tízszer nagyobb számítási teljesítménnyel, mint a korábbi csúcstechnológiás modellek. Egy 1 millió tokenes kontextusablakkal és fejlett érvelési képességekkel rendelkezik, amelyeket nagyszabású megerősítéses tanulás javított, lehetővé téve a mély gondolkodási folyamatokat, amelyek másodpercekig vagy percekig is eltarthatnak összetett problémák megoldásához. A modell kiemelkedő teljesítményt nyújt akadémiai teszteken és valós felhasználói értékeléseken, 1402-es Elo pontszámot érve el a Chatbot Arénában. A Grok 3 Mini verzióval együtt jelent meg, amely egy költséghatékony változat, optimalizálva az egyszerűsített érveléshez.

Gemini 2.5 Pro

A Gemini 2.5 Pro a Google legfejlettebb AI modellje, mély gondolkodásra és átgondolt válaszgenerálásra tervezve. Kiemelkedő eredményt mutat kulcsfontosságú benchmarkokon, kivételes logikával és kódolási készséggel. Dinamikus webalkalmazások építésére, autonóm kódrendszerekre és kódadaptációra optimalizálva magas szintű teljesítményt nyújt. Beépített multimodális képességekkel és kiterjesztett kontextusablakkal hatékonyan dolgoz fel nagy adathalmazokat és integrál különféle információs forrásokat komplex kihívások kezelésére.

	Grok 3 Beta	Gemini 2.5 Pro
Weboldal ?	Open	Open
Szolgáltató ?	xAI	Google
Csevegés ?
Kiadási Dátum ?
Modalitások ?	szöveg ? képek ? videó ?	szöveg ? képek ? hang ? videó ?
API Szolgáltatók ?	xAI	Google AI Studio, Vertex AI, Gemini app
Tudás Befejezési Dátuma ?	2025-01	-
Nyílt Forráskódú ?	Nem	Nem
Bemeneti Árazás ?	Nem elérhető	Nem elérhető
Kimeneti Árazás ?	Nem elérhető	Nem elérhető
MMLU ?	Nem elérhető	Nem elérhető
MMLU-Pro ?	79.9% Base model Forrás	Nem elérhető
MMMU ?	78% With Think mode Forrás	81.7% Forrás
HellaSwag ?	Nem elérhető	Nem elérhető
HumanEval ?	Nem elérhető	Nem elérhető
MATH ?	Nem elérhető	Nem elérhető
GPQA ?	84.6% With Think mode, Diamond Forrás	84.0% Diamond Science Forrás
IFEval ?	Nem elérhető	Nem elérhető
SimpleQA ?	-	52.9%
AIME 2024	-	92.0%
AIME 2025	-	86.7%
Aider Polyglot ?	-	74.0% / 68.6%
LiveCodeBench v5 ?	-	70.4%
Global MMLU (Lite) ?	-	89.8%
MathVista ?	-	-
Mobilalkalmazás	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
Összesített pontszám	-	0.48%
Doom II	-	0%
Dream DX	-	4.8%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

Grok 3 Beta

Gemini 2.5 Pro

Weboldal ?

Open

Szolgáltató ?

xAI

Google

Csevegés ?

Kiadási Dátum ?

Modalitások ?

szöveg ?
képek ?
videó ?

szöveg ?
képek ?
hang ?
videó ?

API Szolgáltatók ?

xAI

Google AI Studio, Vertex AI, Gemini app

Tudás Befejezési Dátuma ?

2025-01

Nyílt Forráskódú ?

Nem

Bemeneti Árazás ?

Nem elérhető

Kimeneti Árazás ?

Nem elérhető

MMLU ?

Nem elérhető

MMLU-Pro ?

79.9%
Base model
Forrás

Nem elérhető

MMMU ?

78%
With Think mode
Forrás

81.7%
Forrás

HellaSwag ?

Nem elérhető

HumanEval ?

Nem elérhető

MATH ?

Nem elérhető

GPQA ?

84.6%
With Think mode, Diamond
Forrás

84.0%
Diamond Science
Forrás

IFEval ?

Nem elérhető

SimpleQA ?

52.9%

AIME 2024

92.0%

AIME 2025

86.7%

Aider Polyglot ?

74.0% / 68.6%

LiveCodeBench v5 ?

70.4%

Global MMLU (Lite) ?

89.8%

MathVista ?

Mobilalkalmazás

Google Play
Apple Apps

VideoGameBench ?

Összesített pontszám

0.48%

Doom II

Dream DX

4.8%

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

LLM-ek Összehasonlítása
Grok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása

LLM-ek ÖsszehasonlításaGrok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása
Grok 3 Beta vs Gemini 2.5 Pro