Llama 4 Maverick

Komentáre: 0
Llama 4 Maverick #0
Llama 4 Maverick #1
Llama 4 Maverick #2
Llama 4 Maverick #3
3589
252

Pozícia v celkovom rebríčku k dátumuJún 2026
8
Hodnotenie používateľovhttps://compare-ai.foundtt.com
4.2

Prehľad modelu

Webová stránka
Webová stránka AI modelu
Poskytovateľ
Subjekt, ktorý poskytuje tento model.
Chat
Zadajte správu a začnite chatovať
-
Dátum vydania
Kedy bol model prvýkrát vydaný.
1 rok ago
Apr 05, 2025
Modality
Typy dát, ktoré tento model dokáže spracovať
text ?
obrázky ?
video ?
Poskytovatelia API
Poskytovatelia, ktorí ponúkajú tento model. (Toto nie je vyčerpávajúci zoznam.)
Meta AI, Hugging Face, Fireworks, Together, DeepInfra
Dátum zastarania vedomostí
Kedy boli vedomosti modelu naposledy aktualizované.
2024-08
Open Source
Či je kód modelu dostupný na verejné použitie.
Áno (Zdroj)
Cena za vstup
Cena za spracovanie tokenov vo vašich promptoch
Nie je k dispozícii
Cena za výstup
Cena za tokeny generované modelom
Nie je k dispozícii
MMLU
Massive Multitask Language Understanding – Testuje vedomosti v 57 predmetoch vrátane matematiky, histórie, práva a ďalších
Nie je k dispozícii
MMLU-Pro
Robustnejší benchmark MMLU s náročnejšími otázkami zameranými na uvažovanie, väčším výberom a zníženou citlivosťou na prompty
80.5%
Zdroj
MMMU
Massive Multitask Multimodal Understanding – Testuje porozumenie textu, obrázkom, audiu a videu
73.4%
Zdroj
HellaSwag
Náročný benchmark na dokončovanie viet
Nie je k dispozícii
HumanEval
Hodnotí schopnosti generovania kódu a riešenia problémov
Nie je k dispozícii
MATH
Testuje schopnosti riešenia matematických problémov na rôznych úrovniach náročnosti
Nie je k dispozícii
GPQA
Testuje vedomosti na úrovni PhD v chémii, biológii a fyzike prostredníctvom otázok s výberom odpovedí, ktoré vyžadujú hlboké odborné znalosti
69.8%
Diamond
Zdroj
IFEval
Testuje schopnosť modelu presne dodržiavať explicitné pokyny na formátovanie, generovať vhodné výstupy a udržiavať konzistentné dodržiavanie pokynov pri rôznych úlohách
Nie je k dispozícii
SimpleQA
Hodnotenie presnosti jednoduchých otázok
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Viacjazyčný programovací benchmark.
-
LiveCodeBench v5
Benchmark pre programovanie v reálnom čase
-
Global MMLU (Lite)
Zjednodušená verzia benchmarku na hodnotenie univerzálnosti modelov na globálnej úrovni.
-
MathVista
Hodnotí schopnosti matematického uvažovania modelov AI vo vizuálnych kontextoch
-
Mobilná aplikácia
-

VideoGameBench ?

Celkové hodnotenie0%
Doom II0%
Dream DX0%
Awakening DX0%
Civilization I0%
Pokemon Crystal0%
The Need for Speed0%
The Incredible Machine0%
Secret Game 1%0
Secret Game 20%
Secret Game 30%

Pridať komentár

Porovnaj LLM


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.