Claude Opus 4.5

Коментарі: 0
Claude Opus 4.5 #0
Claude Opus 4.5 #1
Claude Opus 4.5 #2
4974
543

Позиція в загальному рейтингу станом на
Червень 2026
2
Рейтинг користувачів
https://compare-ai.foundtt.com
4.4

Огляд моделі

Веб-сайт
Веб-сторінка моделі ШІ
Постачальник
Організація, яка надає цю модель.
Чат
Введіть повідомлення, щоб почати спілкування
Дата випуску
Дата першого випуску моделі.
6 місяців ago
Лис 24, 2025
Модальності
Типи даних, які може обробляти ця модель
текст ?
зображення ?
Постачальники API
Постачальники, які пропонують цю модель. (Це не вичерпний список.)
Anthropic API, Amazon Bedrock, Google Vertex AI, Claude developer platform
Дата оновлення знань
Дата останнього оновлення знань моделі.
Невідомо
Відкритий код
Чи доступний код моделі для публічного використання.
Ні
Вартість введення
Вартість обробки токенів у ваших запитах
$5 за мільйон токенів
Вартість виведення
Вартість токенів, згенерованих моделлю
$25 за мільйон токенів
MMLU
Massive Multitask Language Understanding - Тестує знання з 57 предметів, включаючи математику, історію, право та інше
90.8%
Джерело
MMLU-Pro
Більш надійний тест MMLU із складнішими питаннями, орієнтованими на міркування, більшим набором варіантів і зменшеною чутливістю до запитів
-
MMMU
Massive Multitask Multimodal Understanding - Тестує розуміння тексту, зображень, аудіо та відео
80.7%
Validation
Джерело
HellaSwag
Складний тест на завершення речень
-
HumanEval
Оцінює можливості генерації коду та вирішення задач
-
MATH
Тестує математичні навички вирішення задач різного рівня складності
-
GPQA
Тестує знання на рівні PhD з хімії, біології та фізики через багатозначні питання, що вимагають глибоких знань у галузі
87%
Diamond
Джерело
IFEval
Тестує здатність моделі точно дотримуватися явних інструкцій щодо форматування, генерувати відповідні результати та підтримувати послідовне дотримання інструкцій у різних завданнях
-
SimpleQA
Оцінка точності простих запитань
-
AIME 2024
-
AIME 2025
92.77%
Джерело
Aider Polyglot
Багатомовний програмний бенчмарк.
-
LiveCodeBench v5
Бенчмарк для програмування в реальному часі
-
Global MMLU (Lite)
Спрощена версія бенчмарку для оцінки універсальності моделей на глобальному рівні.
-
MathVista
Оцінює математичні здібності ШІ моделей у візуальних контекстах
-
Мобільний додаток

Додати коментар

Порівняти LLM


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.