


Веб-сайт Веб-сторінка моделі ШІ | |
Постачальник Організація, яка надає цю модель. | |
Чат Введіть повідомлення, щоб почати спілкування | |
Дата випуску Дата першого випуску моделі. | 9 місяців ago Сер 07, 2025 |
Модальності Типи даних, які може обробляти ця модель | текст зображення голос відео |
Постачальники API Постачальники, які пропонують цю модель. (Це не вичерпний список.) | OpenAI API |
Дата оновлення знань Дата останнього оновлення знань моделі. | - |
Відкритий код Чи доступний код моделі для публічного використання. | Ні |
Вартість введення Вартість обробки токенів у ваших запитах | - |
Вартість виведення Вартість токенів, згенерованих моделлю | - |
MMLU Massive Multitask Language Understanding - Тестує знання з 57 предметів, включаючи математику, історію, право та інше | - |
MMLU-Pro Більш надійний тест MMLU із складнішими питаннями, орієнтованими на міркування, більшим набором варіантів і зменшеною чутливістю до запитів | - |
MMMU Massive Multitask Multimodal Understanding - Тестує розуміння тексту, зображень, аудіо та відео | 84.2% Джерело |
HellaSwag Складний тест на завершення речень | - |
HumanEval Оцінює можливості генерації коду та вирішення задач | 24.8% Full Set Джерело |
MATH Тестує математичні навички вирішення задач різного рівня складності | - |
GPQA Тестує знання на рівні PhD з хімії, біології та фізики через багатозначні питання, що вимагають глибоких знань у галузі | 85.7% Diamond Джерело |
IFEval Тестує здатність моделі точно дотримуватися явних інструкцій щодо форматування, генерувати відповідні результати та підтримувати послідовне дотримання інструкцій у різних завданнях | - |
SimpleQA Оцінка точності простих запитань | - |
AIME 2024 | - |
AIME 2025 | 94.6% Джерело |
Aider Polyglot Багатомовний програмний бенчмарк. | 88.0% Multi-language code editing Джерело |
LiveCodeBench v5 Бенчмарк для програмування в реальному часі | - |
Global MMLU (Lite) Спрощена версія бенчмарку для оцінки універсальності моделей на глобальному рівні. | - |
MathVista Оцінює математичні здібності ШІ моделей у візуальних контекстах | - |
Мобільний додаток | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2026 All Right Reserved.