Grok 3 Beta

„Grok 3“ az xAI legfejlettebb modellje, amelyet a Colossus szuperszámítógép-klaszteren képeztek ki, tízszer nagyobb számítási teljesítménnyel, mint a korábbi csúcstechnológiás modellek. Egy 1 millió tokenes kontextusablakkal és fejlett érvelési képességekkel rendelkezik, amelyeket nagyszabású megerősítéses tanulás javított, lehetővé téve a mély gondolkodási folyamatokat, amelyek másodpercekig vagy percekig is eltarthatnak összetett problémák megoldásához. A modell kiemelkedő teljesítményt nyújt akadémiai teszteken és valós felhasználói értékeléseken, 1402-es Elo pontszámot érve el a Chatbot Arénában. A Grok 3 Mini verzióval együtt jelent meg, amely egy költséghatékony változat, optimalizálva az egyszerűsített érveléshez.

Gemini 2.5 Pro

A Gemini 2.5 Pro a Google legfejlettebb AI modellje, mély gondolkodásra és átgondolt válaszgenerálásra tervezve. Kiemelkedő eredményt mutat kulcsfontosságú benchmarkokon, kivételes logikával és kódolási készséggel. Dinamikus webalkalmazások építésére, autonóm kódrendszerekre és kódadaptációra optimalizálva magas szintű teljesítményt nyújt. Beépített multimodális képességekkel és kiterjesztett kontextusablakkal hatékonyan dolgoz fel nagy adathalmazokat és integrál különféle információs forrásokat komplex kihívások kezelésére.

Grok 3 BetaGemini 2.5 Pro
Szolgáltató
Weboldal
Kiadási Dátum
Jan 19, 2025
4 hónapok ago
Mar 25, 2025
2 hónapok ago
Modalitások
szöveg ?
képek ?
videó ?
szöveg ?
képek ?
hang ?
videó ?
API Szolgáltatók
xAI
Google AI Studio, Vertex AI, Gemini app
Tudás Befejezési Dátuma
2025-01
-
Nyílt Forráskódú
Nem
Nem
Bemeneti Árazás
Nem elérhető
Nem elérhető
Kimeneti Árazás
Nem elérhető
Nem elérhető
MMLU
Nem elérhető
Nem elérhető
MMLU Pro
79.9%
Base model
Forrás
Nem elérhető
MMMU
78%
With Think mode
Forrás
81.7%
Forrás
HellaSwag
Nem elérhető
Nem elérhető
HumanEval
Nem elérhető
Nem elérhető
MATH
Nem elérhető
Nem elérhető
GPQA
84.6%
With Think mode, Diamond
Forrás
84.0%
Diamond Science
Forrás
IFEval
Nem elérhető
Nem elérhető
Array
-
52.9%
AIME 2024
-
92.0%
AIME 2025
-
86.7%
Array
-
74.0% / 68.6%
Array
-
70.4%
Array
-
89.8%
Array
-
-
Mobilalkalmazás

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.