„Grok 3“ az xAI legfejlettebb modellje, amelyet a Colossus szuperszámítógép-klaszteren képeztek ki, tízszer nagyobb számítási teljesítménnyel, mint a korábbi csúcstechnológiás modellek. Egy 1 millió tokenes kontextusablakkal és fejlett érvelési képességekkel rendelkezik, amelyeket nagyszabású megerősítéses tanulás javított, lehetővé téve a mély gondolkodási folyamatokat, amelyek másodpercekig vagy percekig is eltarthatnak összetett problémák megoldásához. A modell kiemelkedő teljesítményt nyújt akadémiai teszteken és valós felhasználói értékeléseken, 1402-es Elo pontszámot érve el a Chatbot Arénában. A Grok 3 Mini verzióval együtt jelent meg, amely egy költséghatékony változat, optimalizálva az egyszerűsített érveléshez.
A LLaMA 4 Scout egy 17 milliárd paraméteres modell, amely Mixture-of-Experts architektúrát használ 16 aktív szakértővel, így kategóriájának vezető multimodális modellje. Rendszeresen felülmúlja a versenytársakat, mint a Gemma 3, Gemini 2.0 Flash-Lite és a Mistral 3.1, különféle benchmark feladatokon. Teljesítménye ellenére a LLaMA 4 Scout rendkívül hatékony – képes egyetlen NVIDIA H100 GPU-n futni Int4 kvantálással. Emellett iparágvezető, 10 millió tokenes kontextusablakkal rendelkezik, és natív módon multimodális, zökkenőmentesen dolgozza fel a szöveges, képi és videós bemeneteket fejlett valós alkalmazásokhoz.
Grok 3 Beta | Llama 4 Scout | |
---|---|---|
Szolgáltató | ||
Weboldal | ||
Kiadási Dátum | Jan 19, 2025 4 hónapok ago | Apr 05, 2025 1 hónap ago |
Modalitások | szöveg képek videó | szöveg képek videó |
API Szolgáltatók | xAI | Meta AI, Hugging Face, Fireworks, Together, DeepInfra |
Tudás Befejezési Dátuma | 2025-01 | 2025-04 |
Nyílt Forráskódú | Nem | Igen (Forrás) |
Bemeneti Árazás | Nem elérhető | Nem elérhető |
Kimeneti Árazás | Nem elérhető | Nem elérhető |
MMLU | Nem elérhető | Nem elérhető |
MMLU Pro | 79.9% Base model Forrás | 74.3% Reasoning & Knowledge Forrás |
MMMU | 78% With Think mode Forrás | 69.4% Image Reasoning Forrás |
HellaSwag | Nem elérhető | Nem elérhető |
HumanEval | Nem elérhető | Nem elérhető |
MATH | Nem elérhető | Nem elérhető |
GPQA | 84.6% With Think mode, Diamond Forrás | 57.2% Diamond Forrás |
IFEval | Nem elérhető | Nem elérhető |
Array | - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Array | - | - |
Array | - | - |
Array | - | - |
Array | - | - |
Mobilalkalmazás | - |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2025 All Right Reserved.