




Grok 3 — це найпросунутіша модель xAI, навчена на суперкомп'ютерному кластері Colossus із десятикратною обчислювальною потужністю порівняно з попередніми передовими моделями. Вона має контекстне вікно на 1 мільйон токенів і розширені можливості логічного мислення, покращені завдяки масштабному навчання з підкріпленням, що дозволяє здійснювати глибокі розумові процеси від секунд до хвилин для розв'язання складних задач. Модель досягла високих результатів у академічних тестах та оцінках користувачів, отримавши рейтинг Elo 1402 у Chatbot Arena. Була випущена разом із Grok 3 Mini — економічною версією, оптимізованою для спрощеного логічного мислення.
Веб-сайт Веб-сторінка моделі ШІ | |
Постачальник Організація, яка надає цю модель. | |
Чат Введіть повідомлення, щоб почати спілкування | |
Дата випуску Дата першого випуску моделі. | 1 рік ago Січ 19, 2025 |
Модальності Типи даних, які може обробляти ця модель | текст зображення відео |
Постачальники API Постачальники, які пропонують цю модель. (Це не вичерпний список.) | xAI |
Дата оновлення знань Дата останнього оновлення знань моделі. | 2025-01 |
Відкритий код Чи доступний код моделі для публічного використання. | Ні |
Вартість введення Вартість обробки токенів у ваших запитах | Недоступно |
Вартість виведення Вартість токенів, згенерованих моделлю | Недоступно |
MMLU Massive Multitask Language Understanding - Тестує знання з 57 предметів, включаючи математику, історію, право та інше | Недоступно |
MMLU-Pro Більш надійний тест MMLU із складнішими питаннями, орієнтованими на міркування, більшим набором варіантів і зменшеною чутливістю до запитів | 79.9% Base model Джерело |
MMMU Massive Multitask Multimodal Understanding - Тестує розуміння тексту, зображень, аудіо та відео | 78% With Think mode Джерело |
HellaSwag Складний тест на завершення речень | Недоступно |
HumanEval Оцінює можливості генерації коду та вирішення задач | Недоступно |
MATH Тестує математичні навички вирішення задач різного рівня складності | Недоступно |
GPQA Тестує знання на рівні PhD з хімії, біології та фізики через багатозначні питання, що вимагають глибоких знань у галузі | 84.6% With Think mode, Diamond Джерело |
IFEval Тестує здатність моделі точно дотримуватися явних інструкцій щодо форматування, генерувати відповідні результати та підтримувати послідовне дотримання інструкцій у різних завданнях | Недоступно |
SimpleQA Оцінка точності простих запитань | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Багатомовний програмний бенчмарк. | - |
LiveCodeBench v5 Бенчмарк для програмування в реальному часі | - |
Global MMLU (Lite) Спрощена версія бенчмарку для оцінки універсальності моделей на глобальному рівні. | - |
MathVista Оцінює математичні здібності ШІ моделей у візуальних контекстах | - |
Мобільний додаток |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2026 All Right Reserved.
Коментарі (1)
Pierre
09 Квітень 2026Ziet er goed uit