


Веб-сайт Веб-сторінка моделі ШІ | |
Постачальник Організація, яка надає цю модель. | |
Чат Введіть повідомлення, щоб почати спілкування | |
Дата випуску Дата першого випуску моделі. | 1 рік ago Тра 22, 2025 |
Модальності Типи даних, які може обробляти ця модель | текст зображення |
Постачальники API Постачальники, які пропонують цю модель. (Це не вичерпний список.) | Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI |
Дата оновлення знань Дата останнього оновлення знань моделі. | Невідомо |
Відкритий код Чи доступний код моделі для публічного використання. | Ні |
Вартість введення Вартість обробки токенів у ваших запитах | $3 за мільйон токенів |
Вартість виведення Вартість токенів, згенерованих моделлю | $15 за мільйон токенів |
MMLU Massive Multitask Language Understanding - Тестує знання з 57 предметів, включаючи математику, історію, право та інше | 86.5% Джерело |
MMLU-Pro Більш надійний тест MMLU із складнішими питаннями, орієнтованими на міркування, більшим набором варіантів і зменшеною чутливістю до запитів | - |
MMMU Massive Multitask Multimodal Understanding - Тестує розуміння тексту, зображень, аудіо та відео | 74.4% Джерело |
HellaSwag Складний тест на завершення речень | - |
HumanEval Оцінює можливості генерації коду та вирішення задач | - |
MATH Тестує математичні навички вирішення задач різного рівня складності | - |
GPQA Тестує знання на рівні PhD з хімії, біології та фізики через багатозначні питання, що вимагають глибоких знань у галузі | 75.4% Diamond Джерело |
IFEval Тестує здатність моделі точно дотримуватися явних інструкцій щодо форматування, генерувати відповідні результати та підтримувати послідовне дотримання інструкцій у різних завданнях | - |
SimpleQA Оцінка точності простих запитань | - |
AIME 2024 | - |
AIME 2025 | 75.5% Джерело |
Aider Polyglot Багатомовний програмний бенчмарк. | - |
LiveCodeBench v5 Бенчмарк для програмування в реальному часі | - |
Global MMLU (Lite) Спрощена версія бенчмарку для оцінки універсальності моделей на глобальному рівні. | - |
MathVista Оцінює математичні здібності ШІ моделей у візуальних контекстах | - |
Мобільний додаток |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2026 All Right Reserved.