DeepSeek-R1 vs o3 - Palyginti LLM

DeepSeek-R1

DeepSeek-R1 yra 671B parametrų Mišrios ekspertų (MoE) modelis su 37B aktyvuotais parametrais per žodį, apmokytas didelio masto sustiprinto mokymosi, sutelkiant dėmesį į mąstymo gebėjimus. Jis apima dvi sustiprinto mokymosi stadijas, skirtas atrasti patobulintas mąstymo schemas ir suderinti su žmogaus pageidavimais, taip pat dvi SFT stadijas, skirtas pritaikyti mąstymo ir nemąstymo gebėjimus. Modelis pasiekia našumą, panašų į OpenAI-o1, matematikos, kodo ir mąstymo užduotyse.

o3

OpenAI o3 yra pažangiausias OpenAI samprotavimo modelis, specialiai sukurtas sudėtingoms, didelio pažinimo užduotims atlikti. Pristatytas 2025 m. balandį, jis pasižymi puikiais rezultatais programinės įrangos inžinerijoje, matematikoje ir mokslinėje problemų sprendimo srityje. Modelis pristato tris samprotavimo pastangų lygius – žemą, vidutinį ir aukštą – leidžiantys vartotojams subalansuoti delsą ir samprotavimo gylį pagal užduoties sudėtingumą. o3 palaiko pagrindines kūrėjų priemones, įskaitant funkcijų iškvietimus, struktūrizuotus rezultatus ir sistemos lygio žinutes. Turėdamas integruotas vaizdo galimybes, o3 gali interpretuoti ir analizuoti vaizdus, todėl tinka įvairioms daugialypėms programoms. Jis pasiekiamas per Chat Completions API, Assistants API ir Batch API, leidžiant lanksčiai integruoti į įmonių ir mokslo darbo eigą.

	DeepSeek-R1	o3
Internetinė svetainė ?	Open	Open
Tiekėjas ?	DeepSeek	OpenAI
Pokalbiai ?
Išleidimo data ?
Modalumai ?	tekstas ?	tekstas ? vaizdai ?
API tiekėjai ?	DeepSeek, HuggingFace	OpenAI API
Žinių nutraukimo data ?	Nežinoma	-
Atvirojo kodo ?	Taip	Ne
Įvesties kaina ?	$0.55 už milijoną žodžių	$10.00 už milijoną žodžių
Išvesties kaina ?	$2.19 už milijoną žodžių	$40.00 už milijoną žodžių
MMLU ?	90.8% Pass@1 Šaltinis	82.9% Šaltinis
MMLU-Pro ?	84% EM Šaltinis	-
MMMU ?	-	-
HellaSwag ?	-	-
HumanEval ?	-	-
MATH ?	-	-
GPQA ?	71.5% Pass@1 Šaltinis	83.3% Diamond, no tools Šaltinis
IFEval ?	83.3% Prompt Strict Šaltinis	-
SimpleQA ?	-	-
AIME 2024	-	91.6% Šaltinis
AIME 2025	-	88.9% Šaltinis
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilioji programa	Google Play Apple Apps	Google Play Apple Apps

DeepSeek-R1

Internetinė svetainė ?

Open

Tiekėjas ?

DeepSeek

OpenAI

Pokalbiai ?

Išleidimo data ?

Modalumai ?

tekstas ?

tekstas ?
vaizdai ?

API tiekėjai ?

DeepSeek, HuggingFace

OpenAI API

Žinių nutraukimo data ?

Nežinoma

Atvirojo kodo ?

Taip

Įvesties kaina ?

$0.55 už milijoną žodžių

$10.00 už milijoną žodžių

Išvesties kaina ?

$2.19 už milijoną žodžių

$40.00 už milijoną žodžių

MMLU ?

90.8%
Pass@1
Šaltinis

82.9%
Šaltinis

MMLU-Pro ?

84%
EM
Šaltinis

MMMU ?

HellaSwag ?

HumanEval ?

MATH ?

GPQA ?

71.5%
Pass@1
Šaltinis

83.3%
Diamond, no tools
Šaltinis

IFEval ?

83.3%
Prompt Strict
Šaltinis

SimpleQA ?

AIME 2024

91.6%
Šaltinis

AIME 2025

88.9%
Šaltinis

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilioji programa

Google Play
Apple Apps

Palyginti LLM
DeepSeek-R1 vs o3

DeepSeek-R1

o3

Palyginti LLM

Pridėti komentarą

Palyginti LLMDeepSeek-R1 vs o3

DeepSeek-R1

o3

Palyginti LLM

Pridėti komentarą

Palyginti LLM
DeepSeek-R1 vs o3