LLaMA 4 Scout is een model met 17 miljard parameters dat gebruikmaakt van een Mixture-of-Experts-architectuur met 16 actieve experts en zich daarmee positioneert als het toonaangevende multimodale model in zijn klasse. Het presteert consequent beter dan concurrenten zoals Gemma 3, Gemini 2.0 Flash-Lite en Mistral 3.1 op uiteenlopende benchmarktaken. Ondanks zijn prestaties is LLaMA 4 Scout opmerkelijk efficiënt – het kan draaien op één NVIDIA H100 GPU met Int4-kwantisatie. Het beschikt ook over een toonaangevend contextvenster van 10 miljoen tokens en is van nature multimodaal, wat zorgt voor naadloze verwerking van tekst-, beeld- en video-invoer voor geavanceerde toepassingen in de echte wereld.
Grok 3 is het meest geavanceerde model van xAI, getraind op het Colossus-supercluster met 10 keer de rekenkracht van eerdere state-of-the-art modellen. Het beschikt over een contextvenster van 1M tokens en geavanceerde redeneervaardigheden, verbeterd door grootschalige reinforcement learning, waardoor diepe denkprocessen mogelijk zijn die variëren van seconden tot minuten voor het oplossen van complexe problemen. Het model behaalt top prestaties in academische benchmarks en real-world gebruikersevaluaties, met een Elo-score van 1402 in de Chatbot Arena. Het werd uitgebracht naast Grok 3 Mini, een kostenefficiënte variant geoptimaliseerd voor gestroomlijnd redeneren.
Llama 4 Scout | Grok 3 Beta | |
---|---|---|
Aanbieder | ||
Website | ||
Releasedatum | Apr 05, 2025 2 weken ago | Jan 19, 2025 3 maanden ago |
Modaliteiten | tekst afbeeldingen video | tekst afbeeldingen video |
API-Aanbieders | Meta AI, Hugging Face, Fireworks, Together, DeepInfra | xAI |
Kennisafsluitdatum | 2025-04 | 2025-01 |
Open Source | Ja (Bron) | Nee |
Prijzen Invoer | Niet beschikbaar | Niet beschikbaar |
Prijzen Uitvoer | Niet beschikbaar | Niet beschikbaar |
MMLU | Niet beschikbaar | Niet beschikbaar |
MMLU Pro | 74.3% Reasoning & Knowledge Bron | 79.9% Base model Bron |
MMMU | 69.4% Image Reasoning Bron | 78% With Think mode Bron |
HellaSwag | Niet beschikbaar | Niet beschikbaar |
HumanEval | Niet beschikbaar | Niet beschikbaar |
MATH | Niet beschikbaar | Niet beschikbaar |
GPQA | 57.2% Diamond Bron | 84.6% With Think mode, Diamond Bron |
IFEval | Niet beschikbaar | Niet beschikbaar |
Mobiele applicatie | - |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2025 All Right Reserved.