DeepSeek-R1 AI Technické špecifikácie a recenzia

DeepSeek-R1

Komentáre: 1

DeepSeek-R1 je model s 671 miliardami parametrov Mixture-of-Experts (MoE),s 37 miliardami aktivovaných parametrov na token, vyškolený pomocou veľkého rozsahu posilňovacieho učenia so zameraním na schopnosti dedukcie. Zohľadňuje dve fázy RL na objavovanie vylepšených vzorcov dedukcie a zosúladenie s ľudskými preferenciami, spolu s dvoma fázami SFT na posilnenie dedukčných a nededukčných schopností. Model dosahuje výkon porovnateľný s OpenAI-o1 v úlohách matematiky, kódu a dedukcie.

1224

Pozícia v celkovom rebríčku k dátumuJún 2026

Hodnotenie používateľovhttps://compare-ai.foundtt.com

4.2

Prehľad modelu

Webová stránka Webová stránka AI modelu	Open
Poskytovateľ Subjekt, ktorý poskytuje tento model.	DeepSeek
Chat Zadajte správu a začnite chatovať	-
Dátum vydania Kedy bol model prvýkrát vydaný.	1 rok ago Jan 21, 2025
Modality Typy dát, ktoré tento model dokáže spracovať	text ?
Poskytovatelia API Poskytovatelia, ktorí ponúkajú tento model. (Toto nie je vyčerpávajúci zoznam.)	DeepSeek, HuggingFace
Dátum zastarania vedomostí Kedy boli vedomosti modelu naposledy aktualizované.	Neznáme
Open Source Či je kód modelu dostupný na verejné použitie.	Áno
Cena za vstup Cena za spracovanie tokenov vo vašich promptoch	$0.55 za milión tokenov
Cena za výstup Cena za tokeny generované modelom	$2.19 za milión tokenov
MMLU Massive Multitask Language Understanding – Testuje vedomosti v 57 predmetoch vrátane matematiky, histórie, práva a ďalších	90.8% Pass@1 Zdroj
MMLU-Pro Robustnejší benchmark MMLU s náročnejšími otázkami zameranými na uvažovanie, väčším výberom a zníženou citlivosťou na prompty	84% EM Zdroj
MMMU Massive Multitask Multimodal Understanding – Testuje porozumenie textu, obrázkom, audiu a videu	-
HellaSwag Náročný benchmark na dokončovanie viet	-
HumanEval Hodnotí schopnosti generovania kódu a riešenia problémov	-
MATH Testuje schopnosti riešenia matematických problémov na rôznych úrovniach náročnosti	-
GPQA Testuje vedomosti na úrovni PhD v chémii, biológii a fyzike prostredníctvom otázok s výberom odpovedí, ktoré vyžadujú hlboké odborné znalosti	71.5% Pass@1 Zdroj
IFEval Testuje schopnosť modelu presne dodržiavať explicitné pokyny na formátovanie, generovať vhodné výstupy a udržiavať konzistentné dodržiavanie pokynov pri rôznych úlohách	83.3% Prompt Strict Zdroj
SimpleQA Hodnotenie presnosti jednoduchých otázok	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Viacjazyčný programovací benchmark.	-
LiveCodeBench v5 Benchmark pre programovanie v reálnom čase	-
Global MMLU (Lite) Zjednodušená verzia benchmarku na hodnotenie univerzálnosti modelov na globálnej úrovni.	-
MathVista Hodnotí schopnosti matematického uvažovania modelov AI vo vizuálnych kontextoch	-
Mobilná aplikácia	Google Play Apple Apps
MathArena ?
Priemerné skóre	82%
AIME 2025 Test založený na úlohách zo súťaže v matematike (American Invitational Mathematics Examination),určený na overenie matematických schopností modelov.	89%
HMMT February 2025 Test založený na úlohách z Harvard-MIT Mathematics Tournament, február 2025, určený na overenie matematických schopností modelov.	77%
BRUMO 2025	92%
SMT 2025 Test založený na úlohách zo Stanford Math Tournament, 2025, určený na overenie matematických schopností modelov.	83%
CMIMC 2025 Test založený na úlohách z Canadian Mathematical Olympiad, 2025, určený na overenie matematických schopností modelov.	69%

Komentáre (1)

Jacquie
27 Január 2026
Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

DeepSeek-R1 Špecifikácie, recenzia a porovnanie

DeepSeek-R1

Prehľad modelu

MathArena ?

Komentáre (1)

Jacquie

Pridať komentár

Porovnaj LLM