DeepSeek-R1 vs Claude 3.7 Sonnet - Extended Thinking

DeepSeek-R1

DeepSeek-R1 je model Mixture-of-Experts (MoE) s 671 miliardami parametrů, z nichž 37 miliard je aktivováno na token. Byl vyškolen pomocí rozsáhlého posilovaného učení se zaměřením na schopnosti logického uvažování. Model obsahuje dvě fáze RL pro objevování lepších vzorců uvažování a sladění s lidskými preferencemi, spolu se dvěma fázemi SFT pro inicializaci schopností souvisejících s uvažováním i bez něj. Dosahuje výkonu srovnatelného s OpenAI-o1 v matematických, programovacích a logických úlohách.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet je dosud nejpokročilejší model AI od Anthropic a první hybridní systém pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vykazuje významná vylepšení v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů poháněné AI.

	DeepSeek-R1	Claude 3.7 Sonnet - Extended Thinking
Poskytovatel	DeepSeek	Anthropic
Webová stránka	Open	Open
Datum vydání	Jan 21, 2025 3 měsíce ago	Feb 24, 2025 1 měsíc ago
Modality	text ?	text ? obrázky ?
Poskytovatelé API	DeepSeek, HuggingFace	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí	Neznámý	-
Open Source	Ano	Ne
Cena za vstup	$0.55 na milion tokenů	$3.00 na milion tokenů
Cena za výstup	$2.19 na milion tokenů	$15.00 na milion tokenů
MMLU	90.8% Pass@1 Zdroj	Není k dispozici
MMLU Pro	84% EM Zdroj	Není k dispozici
MMMU	-	75% Zdroj
HellaSwag	-	Není k dispozici
HumanEval	-	Není k dispozici
MATH	-	96.2% Zdroj
GPQA	71.5% Pass@1 Zdroj	84.8% Diamond Zdroj
IFEval	83.3% Prompt Strict Zdroj	93.2% Zdroj
Mobilní aplikace	Google Play Apple Apps	Google Play Apple Apps

DeepSeek-R1

Claude 3.7 Sonnet - Extended Thinking

Poskytovatel

DeepSeek

Anthropic

Webová stránka

Open

Datum vydání

Jan 21, 2025
3 měsíce ago

Feb 24, 2025
1 měsíc ago

Modality

text ?

text ?
obrázky ?

Poskytovatelé API

DeepSeek, HuggingFace

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Datum uzávěrky znalostí

Neznámý

Open Source

Ano

Cena za vstup

$0.55 na milion tokenů

$3.00 na milion tokenů

Cena za výstup

$2.19 na milion tokenů

$15.00 na milion tokenů

MMLU

90.8%
Pass@1
Zdroj

Není k dispozici

MMLU Pro

84%
EM
Zdroj

Není k dispozici

MMMU

75%
Zdroj

HellaSwag

Není k dispozici

HumanEval

Není k dispozici

MATH

96.2%
Zdroj

GPQA

71.5%
Pass@1
Zdroj

84.8%
Diamond
Zdroj

IFEval

83.3%
Prompt Strict
Zdroj

93.2%
Zdroj

Mobilní aplikace

Google Play
Apple Apps

Porovnat LLM
DeepSeek-R1 vs Claude 3.7 Sonnet - Extended Thinking

DeepSeek-R1

Claude 3.7 Sonnet - Extended Thinking

Porovnat LLM

Přidat komentář

Porovnat LLMDeepSeek-R1 vs Claude 3.7 Sonnet - Extended Thinking

DeepSeek-R1

Claude 3.7 Sonnet - Extended Thinking

Porovnat LLM

Přidat komentář

Porovnat LLM
DeepSeek-R1 vs Claude 3.7 Sonnet - Extended Thinking