Протягом п'яти місяців з моменту випуску Qwen2-VL розробники створили нові моделі на його основі, надавши цінні відгуки. Тепер Qwen2.5-VL пропонує покращені можливості, включаючи точний аналіз зображень, текстів і діаграм, а також локалізацію об'єктів із структурованими виводами JSON. Він розуміє довгі відео, визначає ключові події та функціонує як агент, взаємодіючи з інструментами на комп'ютерах і телефонах. Архітектура моделі включає динамічну обробку відео та оптимізований кодувальник ViT для підвищення швидкості та точності.
Amazon Nova Micro — це текстова модель, оптимізована для зниження витрат і підвищення швидкості. Маючи контекстне вікно в 128K токенів, вона відмінно справляється із завданнями, такими як підсумовування тексту, переклад, інтерактивний чат та базове програмування. Випущена як частина фундаментальних моделей Amazon Nova, вона підтримує тонке налаштування та дистиляцію для адаптації під власні дані.
Qwen2.5-VL-32B | Nova Micro | |
---|---|---|
Веб-сайт
| ||
Постачальник
| ||
Чат
| ||
Дата випуску
| ||
Модальності
| текст зображення відео | текст |
Постачальники API
| - | Amazon Bedrock |
Дата оновлення знань
| Невідомо | Навмисно не розголошується |
Відкритий код
| Так (Джерело) | Ні |
Вартість введення
| $0 | $0.04 за мільйон токенів |
Вартість виведення
| $0 | $0.14 за мільйон токенів |
MMLU
| 78.4% Джерело | 77.6% CoT Джерело |
MMLU-Pro
| 49.5% | - |
MMMU
| 70% | - |
HellaSwag
| Недоступно | - |
HumanEval
| Недоступно | 81.1% pass@1 Джерело |
MATH
| 82.2% | 69.3% CoT Джерело |
GPQA
| 46.0% Diamond | 40% Main Джерело |
IFEval
| Недоступно | 87.2% Джерело |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Мобільний додаток | - | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.