„Llama 3.3 70B Instruct“, створена Meta, — це багатомовна велика мовна модель, спеціально налаштована для завдань на основі інструкцій і оптимізована для розмовних додатків. Вона може обробляти та генерувати текст кількома мовами, підтримуючи контекстне вікно до 128 000 токенів. Запущена 6 грудня 2024 року, модель перевершує багато відкритих і комерційних чат-ботів у різних галузевих тестах. Використовує Grouped-Query Attention (GQA) для покращення масштабованості та навчена на різноманітному наборі даних, що містить понад 15 трильйонів токенів із публічних джерел. Знання моделі актуальні до грудня 2023 року.
Mistral Large 2, розроблений Mistral, пропонує контекстне вікно у 128 000 токенів і оцінюється в 3,00 USD за мільйон вхідних токенів та 9,00 USD за мільйон вихідних токенів. Випущена 24 липня 2024 року модель набрала 84,0 балів у тесті MMLU при 5-shot оцінці, демонструючи високу продуктивність у різних завданнях.
Llama 3.3 70B Instruct | Mistral Large 2 | |
---|---|---|
Постачальник | ||
Веб-сайт | ||
Дата випуску | Dec 06, 2024 4 months ago | Jun 24, 2024 9 months ago |
Модальності | текст | текст |
Постачальники API | Fireworks, Together, DeepInfra, Hyperbolic | Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex |
Дата оновлення знань | 12.2024 | Невідомо |
Відкритий код | Так | Так |
Вартість введення | $0.23 за мільйон токенів | $3.00 за мільйон токенів |
Вартість виведення | $0.40 за мільйон токенів | $9.00 за мільйон токенів |
MMLU | 86% 0-shot, CoT Джерело | 84% 5-shot Джерело |
MMLU Pro | 68.9% 5-shot, CoT Джерело | 50.69% Джерело |
MMMU | Недоступно | Недоступно |
HellaSwag | Недоступно | Недоступно |
HumanEval | 88.4% pass@1 Джерело | Недоступно |
MATH | 77% 0-shot, CoT Джерело | 1.13% Джерело |
GPQA | 50.5% 0-shot, CoT Джерело | 24.94% |
IFEval | 92.1% Джерело | 84.01% |
Мобільний додаток | - | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.