Grok 3 Beta

Коментарі: 1
Grok 3 Beta #0
Grok 3 Beta #1
Grok 3 Beta #2
Grok 3 Beta #3

Grok 3 — це найпросунутіша модель xAI, навчена на суперкомп'ютерному кластері Colossus із десятикратною обчислювальною потужністю порівняно з попередніми передовими моделями. Вона має контекстне вікно на 1 мільйон токенів і розширені можливості логічного мислення, покращені завдяки масштабному навчання з підкріпленням, що дозволяє здійснювати глибокі розумові процеси від секунд до хвилин для розв'язання складних задач. Модель досягла високих результатів у академічних тестах та оцінках користувачів, отримавши рейтинг Elo 1402 у Chatbot Arena. Була випущена разом із Grok 3 Mini — економічною версією, оптимізованою для спрощеного логічного мислення.

3792
261

Позиція в загальному рейтингу станом на
Червень 2026
13
Рейтинг користувачів
https://compare-ai.foundtt.com
4.1

Огляд моделі

Веб-сайт
Веб-сторінка моделі ШІ
Постачальник
Організація, яка надає цю модель.
Чат
Введіть повідомлення, щоб почати спілкування
Дата випуску
Дата першого випуску моделі.
1 рік ago
Січ 19, 2025
Модальності
Типи даних, які може обробляти ця модель
текст ?
зображення ?
відео ?
Постачальники API
Постачальники, які пропонують цю модель. (Це не вичерпний список.)
xAI
Дата оновлення знань
Дата останнього оновлення знань моделі.
2025-01
Відкритий код
Чи доступний код моделі для публічного використання.
Ні
Вартість введення
Вартість обробки токенів у ваших запитах
Недоступно
Вартість виведення
Вартість токенів, згенерованих моделлю
Недоступно
MMLU
Massive Multitask Language Understanding - Тестує знання з 57 предметів, включаючи математику, історію, право та інше
Недоступно
MMLU-Pro
Більш надійний тест MMLU із складнішими питаннями, орієнтованими на міркування, більшим набором варіантів і зменшеною чутливістю до запитів
79.9%
Base model
Джерело
MMMU
Massive Multitask Multimodal Understanding - Тестує розуміння тексту, зображень, аудіо та відео
78%
With Think mode
Джерело
HellaSwag
Складний тест на завершення речень
Недоступно
HumanEval
Оцінює можливості генерації коду та вирішення задач
Недоступно
MATH
Тестує математичні навички вирішення задач різного рівня складності
Недоступно
GPQA
Тестує знання на рівні PhD з хімії, біології та фізики через багатозначні питання, що вимагають глибоких знань у галузі
84.6%
With Think mode, Diamond
Джерело
IFEval
Тестує здатність моделі точно дотримуватися явних інструкцій щодо форматування, генерувати відповідні результати та підтримувати послідовне дотримання інструкцій у різних завданнях
Недоступно
SimpleQA
Оцінка точності простих запитань
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Багатомовний програмний бенчмарк.
-
LiveCodeBench v5
Бенчмарк для програмування в реальному часі
-
Global MMLU (Lite)
Спрощена версія бенчмарку для оцінки універсальності моделей на глобальному рівні.
-
MathVista
Оцінює математичні здібності ШІ моделей у візуальних контекстах
-
Мобільний додаток

Коментарі (1)

  1. Pierre

    09 Квітень 2026

    Ziet er goed uit

Додати коментар

Порівняти LLM


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.