DeepSeek-R1 vs Llama 3.3 70B Instruct - LLM-ek Összehasonlítása

DeepSeek-R1

A DeepSeek-R1 egy 671B paraméteres Mixture-of-Experts (MoE) modell, amely tokenenként 37B aktivált paraméterrel rendelkezik, és nagymértékű megerősítéses tanuláson keresztül készült, kiemelt figyelmet fordítva a gondolkodási képességekre. Két RL (reinforcement learning) szakaszt tartalmaz a javított gondolkodási minták felfedezésére és az emberi preferenciákhoz igazításra, valamint két SFT (supervised fine-tuning) szakaszt a gondolkodási és nem-gondolkodási képességek bevetésére. A modell teljesítménye hasonló az OpenAI-o1 modelléhez matematikai, kódolási és gondolkodási feladatokban.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, a Meta által létrehozott többnyelvű, nagyméretű nyelvi modell, amelyet kifejezetten utasításalapú feladatokhoz finomhangoltak és beszélgetési alkalmazásokhoz optimalizáltak. Több nyelven képes szöveget feldolgozni és generálni, kontextusablaka akár 128 000 tokenig terjed. A 2024. december 6-án megjelent modell számos nyílt forráskódú és saját fejlesztésű chatbotot felülmúl az iparági benchmarkokban. A skálázhatóság javítása érdekében Grouped-Query Attention (GQA) technológiát alkalmaz, és több mint 15 billió tokenből álló, nyilvánosan elérhető forrásokból származó változatos adathalmazon tanult. A modell tudása 2023. decemberéig aktuális.

	DeepSeek-R1	Llama 3.3 70B Instruct
Weboldal ?	Open	Open
Szolgáltató ?	DeepSeek	Meta
Csevegés ?
Kiadási Dátum ?
Modalitások ?	szöveg ?	szöveg ?
API Szolgáltatók ?	DeepSeek, HuggingFace	Fireworks, Together, DeepInfra, Hyperbolic
Tudás Befejezési Dátuma ?	Ismeretlen	12.2024
Nyílt Forráskódú ?	Igen	Igen
Bemeneti Árazás ?	$0.55 millió tokenenként	$0.23 millió tokenenként
Kimeneti Árazás ?	$2.19 millió tokenenként	$0.40 millió tokenenként
MMLU ?	90.8% Pass@1 Forrás	86% 0-shot, CoT Forrás
MMLU-Pro ?	84% EM Forrás	68.9% 5-shot, CoT Forrás
MMMU ?	-	Nem elérhető
HellaSwag ?	-	Nem elérhető
HumanEval ?	-	88.4% pass@1 Forrás
MATH ?	-	77% 0-shot, CoT Forrás
GPQA ?	71.5% Pass@1 Forrás	50.5% 0-shot, CoT Forrás
IFEval ?	83.3% Prompt Strict Forrás	92.1% Forrás
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilalkalmazás	Google Play Apple Apps	-

DeepSeek-R1

Llama 3.3 70B Instruct

Weboldal ?

Open

Szolgáltató ?

DeepSeek

LLM-ek Összehasonlítása
DeepSeek-R1 vs Llama 3.3 70B Instruct

DeepSeek-R1

Llama 3.3 70B Instruct

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása

LLM-ek ÖsszehasonlításaDeepSeek-R1 vs Llama 3.3 70B Instruct

DeepSeek-R1

Llama 3.3 70B Instruct

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása
DeepSeek-R1 vs Llama 3.3 70B Instruct