LLaMA 4 Scout — це модель з 17 мільярдами параметрів, яка використовує архітектуру Mixture-of-Experts з 16 активними експертами, що робить її провідною мультимодальною моделлю у своїй категорії. Вона стабільно перевершує конкурентів, таких як Gemma 3, Gemini 2.0 Flash-Lite та Mistral 3.1, у різноманітних бенчмарках. Незважаючи на потужність, LLaMA 4 Scout є надзвичайно ефективною — здатна працювати на одному графічному процесорі NVIDIA H100 із квантуванням Int4. Вона також має передове в галузі контекстне вікно на 10 мільйонів токенів і є нативно мультимодальною, безперешкодно обробляє текст, зображення та відео для складних прикладних завдань у реальному світі.
„Llama 3.3 70B Instruct“, створена Meta, — це багатомовна велика мовна модель, спеціально налаштована для завдань на основі інструкцій і оптимізована для розмовних додатків. Вона може обробляти та генерувати текст кількома мовами, підтримуючи контекстне вікно до 128 000 токенів. Запущена 6 грудня 2024 року, модель перевершує багато відкритих і комерційних чат-ботів у різних галузевих тестах. Використовує Grouped-Query Attention (GQA) для покращення масштабованості та навчена на різноманітному наборі даних, що містить понад 15 трильйонів токенів із публічних джерел. Знання моделі актуальні до грудня 2023 року.
Llama 4 Scout | Llama 3.3 70B Instruct | |
---|---|---|
Веб-сайт
| ||
Постачальник
| ||
Чат
| ||
Дата випуску
| ||
Модальності
| текст зображення відео | текст |
Постачальники API
| Meta AI, Hugging Face, Fireworks, Together, DeepInfra | Fireworks, Together, DeepInfra, Hyperbolic |
Дата оновлення знань
| 2025-04 | 12.2024 |
Відкритий код
| Так (Джерело) | Так |
Вартість введення
| Недоступно | $0.23 за мільйон токенів |
Вартість виведення
| Недоступно | $0.40 за мільйон токенів |
MMLU
| Недоступно | 86% 0-shot, CoT Джерело |
MMLU-Pro
| 74.3% Reasoning & Knowledge Джерело | 68.9% 5-shot, CoT Джерело |
MMMU
| 69.4% Image Reasoning Джерело | Недоступно |
HellaSwag
| Недоступно | Недоступно |
HumanEval
| Недоступно | 88.4% pass@1 Джерело |
MATH
| Недоступно | 77% 0-shot, CoT Джерело |
GPQA
| 57.2% Diamond Джерело | 50.5% 0-shot, CoT Джерело |
IFEval
| Недоступно | 92.1% Джерело |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Мобільний додаток | - | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.