LLaMA 4 Scout je model s 17 miliardami parametrů využívající architekturu typu Mixture-of-Experts se 16 aktivními experty, což z něj činí špičkový multimodální model ve své kategorii. Pravidelně překonává konkurenty jako Gemma 3, Gemini 2.0 Flash-Lite a Mistral 3.1 v různých benchmarkových úlohách. Navzdory svému výkonu je LLaMA 4 Scout mimořádně efektivní — dokáže běžet na jediné GPU NVIDIA H100 s kvantizací Int4. Nabízí také špičkové 10milionové kontextové okno a je nativně multimodální, což mu umožňuje bezproblémově zpracovávat text, obrázky i video pro pokročilé aplikace v reálném světě.
„Grok 3“ je nejpokročilejší model společnosti xAI, trénovaný na superklastru Colossus s desetinásobným výpočetním výkonem oproti předchozím špičkovým modelům. Disponuje kontextovým oknem o velikosti 1 milionu tokenů a pokročilými schopnostmi uvažování, vylepšenými díky rozsáhlému posilovanému učení, což umožňuje hluboké myšlenkové procesy trvající od sekund až po minuty při řešení složitých problémů. Model dosahuje špičkového výkonu v akademických srovnávacích testech i v reálných uživatelských hodnoceních, získal Elo skóre 1402 v Chatbot Areně. Byl vydán spolu s Grok 3 Mini, nákladově efektivní variantou optimalizovanou pro zjednodušené uvažování.
Llama 4 Scout | Grok 3 Beta | |
---|---|---|
Poskytovatel | ||
Webová stránka | ||
Datum vydání | Apr 05, 2025 2 týdny ago | Jan 19, 2025 3 měsíce ago |
Modality | text obrázky video | text obrázky video |
Poskytovatelé API | Meta AI, Hugging Face, Fireworks, Together, DeepInfra | xAI |
Datum uzávěrky znalostí | 2025-04 | 2025-01 |
Open Source | Ano (Zdroj) | Ne |
Cena za vstup | Není k dispozici | Není k dispozici |
Cena za výstup | Není k dispozici | Není k dispozici |
MMLU | Není k dispozici | Není k dispozici |
MMLU Pro | 74.3% Reasoning & Knowledge Zdroj | 79.9% Base model Zdroj |
MMMU | 69.4% Image Reasoning Zdroj | 78% With Think mode Zdroj |
HellaSwag | Není k dispozici | Není k dispozici |
HumanEval | Není k dispozici | Není k dispozici |
MATH | Není k dispozici | Není k dispozici |
GPQA | 57.2% Diamond Zdroj | 84.6% With Think mode, Diamond Zdroj |
IFEval | Není k dispozici | Není k dispozici |
Mobilní aplikace | - |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2025 All Right Reserved.