LLaMA 4 Scout je model s 17 miliardami parametrů využívající architekturu typu Mixture-of-Experts se 16 aktivními experty, což z něj činí špičkový multimodální model ve své kategorii. Pravidelně překonává konkurenty jako Gemma 3, Gemini 2.0 Flash-Lite a Mistral 3.1 v různých benchmarkových úlohách. Navzdory svému výkonu je LLaMA 4 Scout mimořádně efektivní — dokáže běžet na jediné GPU NVIDIA H100 s kvantizací Int4. Nabízí také špičkové 10milionové kontextové okno a je nativně multimodální, což mu umožňuje bezproblémově zpracovávat text, obrázky i video pro pokročilé aplikace v reálném světě.
OpenAI o3-mini je vysokorychlostní a cenově efektivní model určený pro STEM aplikace, který vyniká ve vědě, matematice a programování. Uvedený na trh v lednu 2025, obsahuje klíčové funkce pro vývojáře, jako je volání funkcí, strukturované výstupy a zprávy pro vývojáře. Model nabízí tři úrovně hloubky úvah—nízkou, střední a vysokou—umožňující uživatelům optimalizovat rovnováhu mezi hlubší analýzou a rychlejší odezvou. Na rozdíl od modelu o3 neobsahuje schopnosti zpracování obrazu. Zpočátku je dostupný vybraným vývojářům v úrovních API 3-5 a lze jej využívat prostřednictvím API pro doplňování chatů, API asistentů a Batch API.
Llama 4 Scout | o3-mini | |
---|---|---|
Poskytovatel | ||
Webová stránka | ||
Datum vydání | Apr 05, 2025 3 týdny ago | Jan 31, 2025 2 měsíce ago |
Modality | text obrázky video | text |
Poskytovatelé API | Meta AI, Hugging Face, Fireworks, Together, DeepInfra | OpenAI API |
Datum uzávěrky znalostí | 2025-04 | Neznámý |
Open Source | Ano (Zdroj) | Ne |
Cena za vstup | Není k dispozici | $1.10 na milion tokenů |
Cena za výstup | Není k dispozici | $4.40 na milion tokenů |
MMLU | Není k dispozici | 86.9% pass@1, high effort Zdroj |
MMLU Pro | 74.3% Reasoning & Knowledge Zdroj | Není k dispozici |
MMMU | 69.4% Image Reasoning Zdroj | Není k dispozici |
HellaSwag | Není k dispozici | Není k dispozici |
HumanEval | Není k dispozici | Není k dispozici |
MATH | Není k dispozici | 97.9% pass@1, high effort Zdroj |
GPQA | 57.2% Diamond Zdroj | 79.7% 0-shot, high effort Zdroj |
IFEval | Není k dispozici | Není k dispozici |
Mobilní aplikace | - |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2025 All Right Reserved.