Grok 3 Beta vs Gemini 2.5 Pro - Порівняти LLM

Grok 3 Beta

Grok 3 — це найпросунутіша модель xAI, навчена на суперкомп'ютерному кластері Colossus із десятикратною обчислювальною потужністю порівняно з попередніми передовими моделями. Вона має контекстне вікно на 1 мільйон токенів і розширені можливості логічного мислення, покращені завдяки масштабному навчання з підкріпленням, що дозволяє здійснювати глибокі розумові процеси від секунд до хвилин для розв'язання складних задач. Модель досягла високих результатів у академічних тестах та оцінках користувачів, отримавши рейтинг Elo 1402 у Chatbot Arena. Була випущена разом із Grok 3 Mini — економічною версією, оптимізованою для спрощеного логічного мислення.

Gemini 2.5 Pro

Gemini 2.5 Pro — це найдосконаліша модель ШІ від Google, розроблена для глибоких міркувань і продуманого створення відповідей. Вона перевершує ключові тести, демонструючи виняткову логіку та навички програмування. Оптимізована для створення динамічних веб-додатків, автономних систем коду та адаптації коду, забезпечуючи високу продуктивність. З вбудованими мультимодальними можливостями та розширеним контекстним вікном вона ефективно обробляє великі набори даних і інтегрує різні джерела інформації для вирішення складних завдань.

	Grok 3 Beta	Gemini 2.5 Pro
Веб-сайт ?	Open	Open
Постачальник ?	xAI	Google
Чат ?
Дата випуску ?
Модальності ?	текст ? зображення ? відео ?	текст ? зображення ? голос ? відео ?
Постачальники API ?	xAI	Google AI Studio, Vertex AI, Gemini app
Дата оновлення знань ?	2025-01	-
Відкритий код ?	Ні	Ні
Вартість введення ?	Недоступно	Недоступно
Вартість виведення ?	Недоступно	Недоступно
MMLU ?	Недоступно	Недоступно
MMLU-Pro ?	79.9% Base model Джерело	Недоступно
MMMU ?	78% With Think mode Джерело	81.7% Джерело
HellaSwag ?	Недоступно	Недоступно
HumanEval ?	Недоступно	Недоступно
MATH ?	Недоступно	Недоступно
GPQA ?	84.6% With Think mode, Diamond Джерело	84.0% Diamond Science Джерело
IFEval ?	Недоступно	Недоступно
SimpleQA ?	-	52.9%
AIME 2024	-	92.0%
AIME 2025	-	86.7%
Aider Polyglot ?	-	74.0% / 68.6%
LiveCodeBench v5 ?	-	70.4%
Global MMLU (Lite) ?	-	89.8%
MathVista ?	-	-
Мобільний додаток	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
Загальний бал	-	0.48%
Doom II	-	0%
Dream DX	-	4.8%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

Grok 3 Beta

Gemini 2.5 Pro

Веб-сайт ?

Open

Постачальник ?

xAI

Google

Чат ?

Дата випуску ?

Модальності ?

текст ?
зображення ?
відео ?

текст ?
зображення ?
голос ?
відео ?

Постачальники API ?

xAI

Google AI Studio, Vertex AI, Gemini app

Дата оновлення знань ?

2025-01

Відкритий код ?

Ні

Вартість введення ?

Недоступно

Вартість виведення ?

Недоступно

MMLU ?

Недоступно

MMLU-Pro ?

79.9%
Base model
Джерело

Недоступно

MMMU ?

78%
With Think mode
Джерело

81.7%
Джерело

HellaSwag ?

Недоступно

HumanEval ?

Недоступно

MATH ?

Недоступно

GPQA ?

84.6%
With Think mode, Diamond
Джерело

84.0%
Diamond Science
Джерело

IFEval ?

Недоступно

SimpleQA ?

52.9%

AIME 2024

92.0%

AIME 2025

86.7%

Aider Polyglot ?

74.0% / 68.6%

LiveCodeBench v5 ?

70.4%

Global MMLU (Lite) ?

89.8%

MathVista ?

Мобільний додаток

Google Play
Apple Apps

VideoGameBench ?

Загальний бал

0.48%

Doom II

Dream DX

4.8%

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

Порівняти LLM
Grok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

Порівняти LLM

Додати коментар

Порівняти LLMGrok 3 Beta vs Gemini 2.5 Pro

Grok 3 Beta

Gemini 2.5 Pro

VideoGameBench ?

Порівняти LLM

Додати коментар

Порівняти LLM
Grok 3 Beta vs Gemini 2.5 Pro