Grok 3 Beta

„Grok 3“ az xAI legfejlettebb modellje, amelyet a Colossus szuperszámítógép-klaszteren képeztek ki, tízszer nagyobb számítási teljesítménnyel, mint a korábbi csúcstechnológiás modellek. Egy 1 millió tokenes kontextusablakkal és fejlett érvelési képességekkel rendelkezik, amelyeket nagyszabású megerősítéses tanulás javított, lehetővé téve a mély gondolkodási folyamatokat, amelyek másodpercekig vagy percekig is eltarthatnak összetett problémák megoldásához. A modell kiemelkedő teljesítményt nyújt akadémiai teszteken és valós felhasználói értékeléseken, 1402-es Elo pontszámot érve el a Chatbot Arénában. A Grok 3 Mini verzióval együtt jelent meg, amely egy költséghatékony változat, optimalizálva az egyszerűsített érveléshez.

Gemini 2.5 Pro

A Gemini 2.5 Pro a Google legfejlettebb AI modellje, mély gondolkodásra és átgondolt válaszgenerálásra tervezve. Kiemelkedő eredményt mutat kulcsfontosságú benchmarkokon, kivételes logikával és kódolási készséggel. Dinamikus webalkalmazások építésére, autonóm kódrendszerekre és kódadaptációra optimalizálva magas szintű teljesítményt nyújt. Beépített multimodális képességekkel és kiterjesztett kontextusablakkal hatékonyan dolgoz fel nagy adathalmazokat és integrál különféle információs forrásokat komplex kihívások kezelésére.

Grok 3 BetaGemini 2.5 Pro
Weboldal ?
Szolgáltató ?
Csevegés ?
Kiadási Dátum ?
Modalitások ?
szöveg ?
képek ?
videó ?
szöveg ?
képek ?
hang ?
videó ?
API Szolgáltatók ?
xAI
Google AI Studio, Vertex AI, Gemini app
Tudás Befejezési Dátuma ?
2025-01
-
Nyílt Forráskódú ?
Nem
Nem
Bemeneti Árazás ?
Nem elérhető
Nem elérhető
Kimeneti Árazás ?
Nem elérhető
Nem elérhető
MMLU ?
Nem elérhető
Nem elérhető
MMLU-Pro ?
79.9%
Base model
Forrás
Nem elérhető
MMMU ?
78%
With Think mode
Forrás
81.7%
Forrás
HellaSwag ?
Nem elérhető
Nem elérhető
HumanEval ?
Nem elérhető
Nem elérhető
MATH ?
Nem elérhető
Nem elérhető
GPQA ?
84.6%
With Think mode, Diamond
Forrás
84.0%
Diamond Science
Forrás
IFEval ?
Nem elérhető
Nem elérhető
SimpleQA ?
-
52.9%
AIME 2024
-
92.0%
AIME 2025
-
86.7%
Aider Polyglot ?
-
74.0% / 68.6%
LiveCodeBench v5 ?
-
70.4%
Global MMLU (Lite) ?
-
89.8%
MathVista ?
-
-
Mobilalkalmazás

VideoGameBench ?

Összesített pontszám
-
0.48%
Doom II
-
0%
Dream DX
-
4.8%
Awakening DX
-
0%
Civilization I
-
0%
Pokemon Crystal
-
0%
The Need for Speed
-
0%
The Incredible Machine
-
0%
Secret Game 1
-
0%
Secret Game 2
-
0%
Secret Game 3
-
0%

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.