Протягом п'яти місяців з моменту випуску Qwen2-VL розробники створили нові моделі на його основі, надавши цінні відгуки. Тепер Qwen2.5-VL пропонує покращені можливості, включаючи точний аналіз зображень, текстів і діаграм, а також локалізацію об'єктів із структурованими виводами JSON. Він розуміє довгі відео, визначає ключові події та функціонує як агент, взаємодіючи з інструментами на комп'ютерах і телефонах. Архітектура моделі включає динамічну обробку відео та оптимізований кодувальник ViT для підвищення швидкості та точності.
Amazon Nova Pro — це передова мультимодальна модель, призначена для обробки текстових, графічних та відео-вхідних даних із розширеними можливостями обробки. Завдяки контекстному вікну в 300 000 токенів вона чудово справляється з аналізом документів, візуальною відповіддю на запитання та складними робочими процесами, керованими агентами. Як частина базових моделей Amazon Nova, вона підтримує тонке налаштування та дистиляцію, що дозволяє глибоко адаптувати її для різних додатків.
Qwen2.5-VL-32B | Nova Pro | |
---|---|---|
Постачальник | ||
Веб-сайт | ||
Дата випуску | Mar 25, 2025 4 weeks ago | Dec 02, 2024 4 months ago |
Модальності | текст зображення відео | текст зображення відео |
Постачальники API | - | Amazon Bedrock |
Дата оновлення знань | Невідомо | Навмисно не розголошується |
Відкритий код | Так (Джерело) | Ні |
Вартість введення | $0 | $0.80 за мільйон токенів |
Вартість виведення | $0 | $3.20 за мільйон токенів |
MMLU | 78.4% Джерело | 85.9% CoT Джерело |
MMLU Pro | 49.5% | Недоступно |
MMMU | 70% | Недоступно |
HellaSwag | Недоступно | Недоступно |
HumanEval | Недоступно | 89% pass@1 Джерело |
MATH | 82.2% | 76.6% CoT Джерело |
GPQA | 46.0% Diamond | 46.9% Main Джерело |
IFEval | Недоступно | 92.1% Джерело |
Мобільний додаток | - | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.