Grok 3 Beta vs o4-mini - Порівняти LLM

Grok 3 Beta

Grok 3 — це найпросунутіша модель xAI, навчена на суперкомп'ютерному кластері Colossus із десятикратною обчислювальною потужністю порівняно з попередніми передовими моделями. Вона має контекстне вікно на 1 мільйон токенів і розширені можливості логічного мислення, покращені завдяки масштабному навчання з підкріпленням, що дозволяє здійснювати глибокі розумові процеси від секунд до хвилин для розв'язання складних задач. Модель досягла високих результатів у академічних тестах та оцінках користувачів, отримавши рейтинг Elo 1402 у Chatbot Arena. Була випущена разом із Grok 3 Mini — економічною версією, оптимізованою для спрощеного логічного мислення.

o4-mini

OpenAI o4-mini — це найновіша легка модель у серії o, розроблена для ефективного та потужного аналізу текстових та візуальних завдань. Оптимізована для швидкості та продуктивності, вона відмінно справляється з генерацією коду та аналізом зображень, зберігаючи баланс між затримкою та глибиною аналізу. Модель підтримує контекстне вікно у 200 000 токенів з виведенням до 100 000 токенів, що робить її придатною для тривалих та об’ємних взаємодій. Вона обробляє як текстові, так і графічні вхідні дані, видаючи текстові результати з розширеними аналітичними можливостями. Завдяки компактній архітектурі та універсальній продуктивності o4-mini ідеально підходить для широкого спектру реальних додатків, що вимагають швидкого та економічно ефективного інтелекту.

	Grok 3 Beta	o4-mini
Веб-сайт ?	Open	Open
Постачальник ?	xAI	OpenAI
Чат ?
Дата випуску ?
Модальності ?	текст ? зображення ? відео ?	текст ? зображення ?
Постачальники API ?	xAI	OpenAI API
Дата оновлення знань ?	2025-01	-
Відкритий код ?	Ні	Ні
Вартість введення ?	Недоступно	$1.10 за мільйон токенів
Вартість виведення ?	Недоступно	$4.40 за мільйон токенів
MMLU ?	Недоступно	fort
MMLU-Pro ?	79.9% Base model Джерело	-
MMMU ?	78% With Think mode Джерело	81.6% Джерело
HellaSwag ?	Недоступно	-
HumanEval ?	Недоступно	14.28% Джерело
MATH ?	Недоступно	-
GPQA ?	84.6% With Think mode, Diamond Джерело	81.4% Джерело
IFEval ?	Недоступно	-
SimpleQA ?	-	-
AIME 2024	-	93.4% Джерело
AIME 2025	-	92.7% Джерело
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Мобільний додаток	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

o4-mini

Веб-сайт ?

Open

Постачальник ?

xAI

OpenAI

Чат ?

Дата випуску ?

Модальності ?

текст ?
зображення ?
відео ?

текст ?
зображення ?

Постачальники API ?

xAI

OpenAI API

Дата оновлення знань ?

2025-01

Відкритий код ?

Ні

Вартість введення ?

Недоступно

$1.10 за мільйон токенів

Вартість виведення ?

Недоступно

$4.40 за мільйон токенів

MMLU ?

Недоступно

fort

MMLU-Pro ?

79.9%
Base model
Джерело

MMMU ?

78%
With Think mode
Джерело

81.6%
Джерело

HellaSwag ?

Недоступно

HumanEval ?

Недоступно

14.28%
Джерело

MATH ?

Недоступно

GPQA ?

84.6%
With Think mode, Diamond
Джерело

81.4%
Джерело

IFEval ?

Недоступно

SimpleQA ?

AIME 2024

93.4%
Джерело

AIME 2025

92.7%
Джерело

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Мобільний додаток

Google Play
Apple Apps

Порівняти LLM
Grok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

Порівняти LLM

Додати коментар

Порівняти LLMGrok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

Порівняти LLM

Додати коментар

Порівняти LLM
Grok 3 Beta vs o4-mini