Grok 3 is het meest geavanceerde model van xAI, getraind op het Colossus-supercluster met 10 keer de rekenkracht van eerdere state-of-the-art modellen. Het beschikt over een contextvenster van 1M tokens en geavanceerde redeneervaardigheden, verbeterd door grootschalige reinforcement learning, waardoor diepe denkprocessen mogelijk zijn die variëren van seconden tot minuten voor het oplossen van complexe problemen. Het model behaalt top prestaties in academische benchmarks en real-world gebruikersevaluaties, met een Elo-score van 1402 in de Chatbot Arena. Het werd uitgebracht naast Grok 3 Mini, een kostenefficiënte variant geoptimaliseerd voor gestroomlijnd redeneren.
LLaMA 4 Scout is een model met 17 miljard parameters dat gebruikmaakt van een Mixture-of-Experts-architectuur met 16 actieve experts en zich daarmee positioneert als het toonaangevende multimodale model in zijn klasse. Het presteert consequent beter dan concurrenten zoals Gemma 3, Gemini 2.0 Flash-Lite en Mistral 3.1 op uiteenlopende benchmarktaken. Ondanks zijn prestaties is LLaMA 4 Scout opmerkelijk efficiënt – het kan draaien op één NVIDIA H100 GPU met Int4-kwantisatie. Het beschikt ook over een toonaangevend contextvenster van 10 miljoen tokens en is van nature multimodaal, wat zorgt voor naadloze verwerking van tekst-, beeld- en video-invoer voor geavanceerde toepassingen in de echte wereld.
Grok 3 Beta | Llama 4 Scout | |
---|---|---|
Aanbieder | ||
Website | ||
Releasedatum | Jan 19, 2025 4 maanden ago | Apr 05, 2025 1 maand ago |
Modaliteiten | tekst afbeeldingen video | tekst afbeeldingen video |
API-Aanbieders | xAI | Meta AI, Hugging Face, Fireworks, Together, DeepInfra |
Kennisafsluitdatum | 2025-01 | 2025-04 |
Open Source | Nee | Ja (Bron) |
Prijzen Invoer | Niet beschikbaar | Niet beschikbaar |
Prijzen Uitvoer | Niet beschikbaar | Niet beschikbaar |
MMLU | Niet beschikbaar | Niet beschikbaar |
MMLU Pro | 79.9% Base model Bron | 74.3% Reasoning & Knowledge Bron |
MMMU | 78% With Think mode Bron | 69.4% Image Reasoning Bron |
HellaSwag | Niet beschikbaar | Niet beschikbaar |
HumanEval | Niet beschikbaar | Niet beschikbaar |
MATH | Niet beschikbaar | Niet beschikbaar |
GPQA | 84.6% With Think mode, Diamond Bron | 57.2% Diamond Bron |
IFEval | Niet beschikbaar | Niet beschikbaar |
Array | - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Array | - | - |
Array | - | - |
Array | - | - |
Array | - | - |
Mobiele applicatie | - |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2025 All Right Reserved.