Grok 3 Beta vs DeepSeek-R1 - Сравнение LLM

Grok 3 Beta

Grok 3 — это самый продвинутый модельный продукт xAI, обученный на суперкомпьютерном кластере Colossus с вычислительной мощностью, превышающей предыдущие передовые модели в 10 раз. Обладает контекстным окном в 1 миллион токенов и расширенными возможностями рассуждения, улучшенными благодаря крупномасштабному обучению с подкреплением, что позволяет осуществлять глубокие мыслительные процессы от секунд до минут для решения сложных задач. Модель демонстрирует выдающиеся результаты в академических тестах и реальных пользовательских оценках, набрав рейтинг Elo 1402 в Chatbot Arena. Выпущена вместе с Grok 3 Mini — экономичной версией, оптимизированной для упрощенного рассуждения.

DeepSeek-R1

DeepSeek-R1 — это модель типа Mixture-of-Experts (MoE) с 671 млрд параметров, из которых 37 млрд активируются на каждый токен. Обучена с использованием масштабного обучения с подкреплением (RL) с упором на развитие навыков рассуждения. Включает два этапа RL для выявления улучшенных схем рассуждения и согласования с предпочтениями человека, а также два этапа SFT для развития навыков, связанных и не связанных с рассуждением. По математическим, программным и логическим задачам модель демонстрирует производительность, сопоставимую с OpenAI-o1.

	Grok 3 Beta	DeepSeek-R1
Провайдер	xAI	DeepSeek
Веб-сайт	Open	Open
Дата выпуска	Jan 19, 2025 4 месяца назад	Jan 21, 2025 4 месяца назад
Модальности	текст ? изображения ? видео ?	текст ?
Поставщики API	xAI	DeepSeek, HuggingFace
Дата актуальности знаний	2025-01	Неизвестно
Открытый исходный код	Нет	Да
Стоимость ввода	Недоступно	$0.55 за миллион токенов
Стоимость вывода	Недоступно	$2.19 за миллион токенов
MMLU	Недоступно	90.8% Pass@1 Источник
MMLU Pro	79.9% Base model Источник	84% EM Источник
MMMU	78% With Think mode Источник	-
HellaSwag	Недоступно	-
HumanEval	Недоступно	-
MATH	Недоступно	-
GPQA	84.6% With Think mode, Diamond Источник	71.5% Pass@1 Источник
IFEval	Недоступно	83.3% Prompt Strict Источник
Array	-	-
AIME 2024	-	-
AIME 2025	-	-
Array	-	-
Array	-	-
Array	-	-
Array	-	-
Мобильное приложение	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

DeepSeek-R1

Провайдер

xAI

DeepSeek

Веб-сайт

Open

Дата выпуска

Jan 19, 2025
4 месяца назад

Jan 21, 2025
4 месяца назад

Модальности

текст ?
изображения ?
видео ?

текст ?

Поставщики API

xAI

DeepSeek, HuggingFace

Дата актуальности знаний

2025-01

Неизвестно

Открытый исходный код

Нет

Да

Стоимость ввода

Недоступно

$0.55 за миллион токенов

Стоимость вывода

Недоступно

$2.19 за миллион токенов

MMLU

Недоступно

90.8%
Pass@1
Источник

MMLU Pro

79.9%
Base model
Источник

84%
EM
Источник

MMMU

78%
With Think mode
Источник

HellaSwag

Недоступно

HumanEval

Недоступно

MATH

Недоступно

GPQA

84.6%
With Think mode, Diamond
Источник

71.5%
Pass@1
Источник

IFEval

Недоступно

83.3%
Prompt Strict
Источник

Array

AIME 2024

AIME 2025

Array

Мобильное приложение

Google Play
Apple Apps

Сравнение LLM
Grok 3 Beta vs DeepSeek-R1

Grok 3 Beta

DeepSeek-R1

Сравнение LLM

Добавить комментарий

Сравнение LLMGrok 3 Beta vs DeepSeek-R1

Grok 3 Beta

DeepSeek-R1

Сравнение LLM

Добавить комментарий

Сравнение LLM
Grok 3 Beta vs DeepSeek-R1