Claude 3.7 Sonnet — це найдосконаліша модель Anthropic на сьогодні та перший гібридний ШІ для міркувань на ринку. Він пропонує як стандартний, так і розширений режими мислення, причому останній забезпечує прозоре, покрокове міркування. Модель чудово справляється з кодуванням і фронтенд-розробкою, досягаючи передових результатів у тестах SWE-bench Verified і TAU-bench. Доступний через Claude.ai, API Anthropic, Amazon Bedrock і Google Cloud Vertex AI, він задає новий стандарт для інтелектуального вирішення проблем, керованого ШІ.
Протягом п'яти місяців з моменту випуску Qwen2-VL розробники створили нові моделі на його основі, надавши цінні відгуки. Тепер Qwen2.5-VL пропонує покращені можливості, включаючи точний аналіз зображень, текстів і діаграм, а також локалізацію об'єктів із структурованими виводами JSON. Він розуміє довгі відео, визначає ключові події та функціонує як агент, взаємодіючи з інструментами на комп'ютерах і телефонах. Архітектура моделі включає динамічну обробку відео та оптимізований кодувальник ViT для підвищення швидкості та точності.
Claude 3.7 Sonnet | Qwen2.5-VL-32B | |
---|---|---|
Веб-сайт
| ||
Постачальник
| ||
Чат
| ||
Дата випуску
| ||
Модальності
| текст зображення | текст зображення відео |
Постачальники API
| Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI | - |
Дата оновлення знань
| - | Невідомо |
Відкритий код
| Ні | Так (Джерело) |
Вартість введення
| $3.00 за мільйон токенів | $0 |
Вартість виведення
| $15.00 за мільйон токенів | $0 |
MMLU
| Недоступно | 78.4% Джерело |
MMLU-Pro
| Недоступно | 49.5% |
MMMU
| 71.8% Джерело | 70% |
HellaSwag
| Недоступно | Недоступно |
HumanEval
| Недоступно | Недоступно |
MATH
| 82.2% Джерело | 82.2% |
GPQA
| 68% Diamond Джерело | 46.0% Diamond |
IFEval
| 90.8% Джерело | Недоступно |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Мобільний додаток | - | |
VideoGameBench | ||
Загальний бал | 0% | - |
Doom II | 0% | - |
Dream DX | 0% | - |
Awakening DX | 0% | - |
Civilization I | 0% | - |
Pokemon Crystal | 0% | - |
The Need for Speed | 0% | - |
The Incredible Machine | 0% | - |
Secret Game 1 | 0% | - |
Secret Game 2 | 0% | - |
Secret Game 3 | 0% | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.