„Grok 3“ az xAI legfejlettebb modellje, amelyet a Colossus szuperszámítógép-klaszteren képeztek ki, tízszer nagyobb számítási teljesítménnyel, mint a korábbi csúcstechnológiás modellek. Egy 1 millió tokenes kontextusablakkal és fejlett érvelési képességekkel rendelkezik, amelyeket nagyszabású megerősítéses tanulás javított, lehetővé téve a mély gondolkodási folyamatokat, amelyek másodpercekig vagy percekig is eltarthatnak összetett problémák megoldásához. A modell kiemelkedő teljesítményt nyújt akadémiai teszteken és valós felhasználói értékeléseken, 1402-es Elo pontszámot érve el a Chatbot Arénában. A Grok 3 Mini verzióval együtt jelent meg, amely egy költséghatékony változat, optimalizálva az egyszerűsített érveléshez.
A Gemini 2.5 Pro a Google legfejlettebb AI modellje, mély gondolkodásra és átgondolt válaszgenerálásra tervezve. Kiemelkedő eredményt mutat kulcsfontosságú benchmarkokon, kivételes logikával és kódolási készséggel. Dinamikus webalkalmazások építésére, autonóm kódrendszerekre és kódadaptációra optimalizálva magas szintű teljesítményt nyújt. Beépített multimodális képességekkel és kiterjesztett kontextusablakkal hatékonyan dolgoz fel nagy adathalmazokat és integrál különféle információs forrásokat komplex kihívások kezelésére.
Grok 3 Beta | Gemini 2.5 Pro | |
---|---|---|
Szolgáltató | ||
Weboldal | ||
Kiadási Dátum | Jan 19, 2025 4 hónapok ago | Mar 25, 2025 2 hónapok ago |
Modalitások | szöveg képek videó | szöveg képek hang videó |
API Szolgáltatók | xAI | Google AI Studio, Vertex AI, Gemini app |
Tudás Befejezési Dátuma | 2025-01 | - |
Nyílt Forráskódú | Nem | Nem |
Bemeneti Árazás | Nem elérhető | Nem elérhető |
Kimeneti Árazás | Nem elérhető | Nem elérhető |
MMLU | Nem elérhető | Nem elérhető |
MMLU Pro | 79.9% Base model Forrás | Nem elérhető |
MMMU | 78% With Think mode Forrás | 81.7% Forrás |
HellaSwag | Nem elérhető | Nem elérhető |
HumanEval | Nem elérhető | Nem elérhető |
MATH | Nem elérhető | Nem elérhető |
GPQA | 84.6% With Think mode, Diamond Forrás | 84.0% Diamond Science Forrás |
IFEval | Nem elérhető | Nem elérhető |
Array | - | 52.9% |
AIME 2024 | - | 92.0% |
AIME 2025 | - | 86.7% |
Array | - | 74.0% / 68.6% |
Array | - | 70.4% |
Array | - | 89.8% |
Array | - | - |
Mobilalkalmazás |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2025 All Right Reserved.