DeepSeek-R1 vs o3-mini - LLM-ek Összehasonlítása

DeepSeek-R1

A DeepSeek-R1 egy 671B paraméteres Mixture-of-Experts (MoE) modell, amely tokenenként 37B aktivált paraméterrel rendelkezik, és nagymértékű megerősítéses tanuláson keresztül készült, kiemelt figyelmet fordítva a gondolkodási képességekre. Két RL (reinforcement learning) szakaszt tartalmaz a javított gondolkodási minták felfedezésére és az emberi preferenciákhoz igazításra, valamint két SFT (supervised fine-tuning) szakaszt a gondolkodási és nem-gondolkodási képességek bevetésére. A modell teljesítménye hasonló az OpenAI-o1 modelléhez matematikai, kódolási és gondolkodási feladatokban.

o3-mini

Az OpenAI o3-mini egy gyors és költséghatékony érvelési modell, amelyet STEM alkalmazásokhoz terveztek, és kiváló teljesítményt nyújt a tudomány, a matematika és a programozás területén. 2025 januárjában került piacra, és olyan alapvető fejlesztői funkciókat tartalmaz, mint a függvényhívások, a strukturált kimenetek és a fejlesztői üzenetek. A modell három érvelési szintet kínál—alacsony, közepes és magas—amelyek lehetővé teszik a felhasználók számára az egyensúly optimalizálását a mélyebb elemzés és a gyorsabb válaszidő között. Az o3 modellel ellentétben nem rendelkezik vizuális képességekkel. Kezdetben a 3-5 API-használati szintű fejlesztők számára érhető el, és a Chat Completions API, az Assistants API és a Batch API segítségével használható.

	DeepSeek-R1	o3-mini
Weboldal ?	Open	Open
Szolgáltató ?	DeepSeek	OpenAI
Csevegés ?
Kiadási Dátum ?
Modalitások ?	szöveg ?	szöveg ?
API Szolgáltatók ?	DeepSeek, HuggingFace	OpenAI API
Tudás Befejezési Dátuma ?	Ismeretlen	Ismeretlen
Nyílt Forráskódú ?	Igen	Nem
Bemeneti Árazás ?	$0.55 millió tokenenként	$1.10 millió tokenenként
Kimeneti Árazás ?	$2.19 millió tokenenként	$4.40 millió tokenenként
MMLU ?	90.8% Pass@1 Forrás	86.9% pass@1, high effort Forrás
MMLU-Pro ?	84% EM Forrás	Nem elérhető
MMMU ?	-	Nem elérhető
HellaSwag ?	-	Nem elérhető
HumanEval ?	-	Nem elérhető
MATH ?	-	97.9% pass@1, high effort Forrás
GPQA ?	71.5% Pass@1 Forrás	79.7% 0-shot, high effort Forrás
IFEval ?	83.3% Prompt Strict Forrás	Nem elérhető
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilalkalmazás	Google Play Apple Apps	Google Play Apple Apps

DeepSeek-R1

o3-mini

Weboldal ?

Open

Szolgáltató ?

DeepSeek

OpenAI

Csevegés ?

Kiadási Dátum ?

Modalitások ?

szöveg ?

API Szolgáltatók ?

DeepSeek, HuggingFace

OpenAI API

Tudás Befejezési Dátuma ?

Ismeretlen

Nyílt Forráskódú ?

Igen

Nem

Bemeneti Árazás ?

$0.55 millió tokenenként

$1.10 millió tokenenként

Kimeneti Árazás ?

$2.19 millió tokenenként

$4.40 millió tokenenként

MMLU ?

90.8%
Pass@1
Forrás

86.9%
pass@1, high effort
Forrás

MMLU-Pro ?

84%
EM
Forrás

Nem elérhető

MMMU ?

Nem elérhető

HellaSwag ?

Nem elérhető

HumanEval ?

Nem elérhető

MATH ?

97.9%
pass@1, high effort
Forrás

GPQA ?

71.5%
Pass@1
Forrás

79.7%
0-shot, high effort
Forrás

IFEval ?

83.3%
Prompt Strict
Forrás

Nem elérhető

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilalkalmazás

Google Play
Apple Apps

LLM-ek Összehasonlítása
DeepSeek-R1 vs o3-mini

DeepSeek-R1

o3-mini

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása

LLM-ek ÖsszehasonlításaDeepSeek-R1 vs o3-mini

DeepSeek-R1

o3-mini

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása
DeepSeek-R1 vs o3-mini