DeepSeek-R1 vs Claude 3.5 Haiku - Сравнение LLM

DeepSeek-R1

DeepSeek-R1 — это модель типа Mixture-of-Experts (MoE) с 671 млрд параметров, из которых 37 млрд активируются на каждый токен. Обучена с использованием масштабного обучения с подкреплением (RL) с упором на развитие навыков рассуждения. Включает два этапа RL для выявления улучшенных схем рассуждения и согласования с предпочтениями человека, а также два этапа SFT для развития навыков, связанных и не связанных с рассуждением. По математическим, программным и логическим задачам модель демонстрирует производительность, сопоставимую с OpenAI-o1.

Claude 3.5 Haiku

Claude 3.5 Haiku, разработанный компанией Anthropic, предлагает контекстное окно размером 200 000 токенов. Стоимость составляет 1 $ за миллион входных токенов и 5 $ за миллион выходных токенов, при этом возможна экономия до 90 % с помощью кэширования подсказок и до 50 % через API Message Batches. Эта модель, выпущенная 4 ноября 2024 года, отлично справляется с дополнением кода, интерактивными чат-ботами, извлечением и маркировкой данных, а также с модерацией контента в реальном времени.

	DeepSeek-R1	Claude 3.5 Haiku
Веб-сайт ?	Open	Open
Провайдер ?	DeepSeek	Anthropic
Чат ?
Дата выпуска ?
Модальности ?	текст ?	текст ?
Поставщики API ?	DeepSeek, HuggingFace	Anthropic, AWS Bedrock, Vertex AI
Дата актуальности знаний ?	Неизвестно	01.04.2024
Открытый исходный код ?	Да	Нет
Стоимость ввода ?	$0.55 за миллион токенов	$0.80 за миллион токенов
Стоимость вывода ?	$2.19 за миллион токенов	$4.00
MMLU ?	90.8% Pass@1 Источник	Недоступно
MMLU-Pro ?	84% EM Источник	65% 0-shot CoT Источник
MMMU ?	-	Недоступно
HellaSwag ?	-	Недоступно
HumanEval ?	-	88.1% 0-shot Источник
MATH ?	-	69.4% 0-shot CoT Источник
GPQA ?	71.5% Pass@1 Источник	Недоступно
IFEval ?	83.3% Prompt Strict Источник	Недоступно
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Мобильное приложение	Google Play Apple Apps	Google Play Apple Apps

DeepSeek-R1

Claude 3.5 Haiku

Веб-сайт ?

Open

Провайдер ?

DeepSeek

Anthropic

Чат ?

Дата выпуска ?

Модальности ?

текст ?

Поставщики API ?

DeepSeek, HuggingFace

Anthropic, AWS Bedrock, Vertex AI

Дата актуальности знаний ?

Неизвестно

01.04.2024

Открытый исходный код ?

Да

Нет

Стоимость ввода ?

$0.55 за миллион токенов

$0.80 за миллион токенов

Стоимость вывода ?

$2.19 за миллион токенов

$4.00

MMLU ?

90.8%
Pass@1
Источник

Недоступно

MMLU-Pro ?

84%
EM
Источник

65%
0-shot CoT
Источник

MMMU ?

Недоступно

HellaSwag ?

Недоступно

HumanEval ?

88.1%
0-shot
Источник

MATH ?

69.4%
0-shot CoT
Источник

GPQA ?

71.5%
Pass@1
Источник

Недоступно

IFEval ?

83.3%
Prompt Strict
Источник

Недоступно

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Мобильное приложение

Google Play
Apple Apps

Сравнение LLM
DeepSeek-R1 vs Claude 3.5 Haiku

DeepSeek-R1

Claude 3.5 Haiku

Сравнение LLM

Добавить комментарий

Сравнение LLMDeepSeek-R1 vs Claude 3.5 Haiku

DeepSeek-R1

Claude 3.5 Haiku

Сравнение LLM

Добавить комментарий

Сравнение LLM
DeepSeek-R1 vs Claude 3.5 Haiku