



DeepSeek-R1 je model s 671 miliardami parametrov Mixture-of-Experts (MoE),s 37 miliardami aktivovaných parametrov na token, vyškolený pomocou veľkého rozsahu posilňovacieho učenia so zameraním na schopnosti dedukcie. Zohľadňuje dve fázy RL na objavovanie vylepšených vzorcov dedukcie a zosúladenie s ľudskými preferenciami, spolu s dvoma fázami SFT na posilnenie dedukčných a nededukčných schopností. Model dosahuje výkon porovnateľný s OpenAI-o1 v úlohách matematiky, kódu a dedukcie.
Webová stránka Webová stránka AI modelu | |
Poskytovateľ Subjekt, ktorý poskytuje tento model. | |
Chat Zadajte správu a začnite chatovať | - |
Dátum vydania Kedy bol model prvýkrát vydaný. | 1 rok ago Jan 21, 2025 |
Modality Typy dát, ktoré tento model dokáže spracovať | text |
Poskytovatelia API Poskytovatelia, ktorí ponúkajú tento model. (Toto nie je vyčerpávajúci zoznam.) | DeepSeek, HuggingFace |
Dátum zastarania vedomostí Kedy boli vedomosti modelu naposledy aktualizované. | Neznáme |
Open Source Či je kód modelu dostupný na verejné použitie. | Áno |
Cena za vstup Cena za spracovanie tokenov vo vašich promptoch | $0.55 za milión tokenov |
Cena za výstup Cena za tokeny generované modelom | $2.19 za milión tokenov |
MMLU Massive Multitask Language Understanding – Testuje vedomosti v 57 predmetoch vrátane matematiky, histórie, práva a ďalších | 90.8% Pass@1 Zdroj |
MMLU-Pro Robustnejší benchmark MMLU s náročnejšími otázkami zameranými na uvažovanie, väčším výberom a zníženou citlivosťou na prompty | 84% EM Zdroj |
MMMU Massive Multitask Multimodal Understanding – Testuje porozumenie textu, obrázkom, audiu a videu | - |
HellaSwag Náročný benchmark na dokončovanie viet | - |
HumanEval Hodnotí schopnosti generovania kódu a riešenia problémov | - |
MATH Testuje schopnosti riešenia matematických problémov na rôznych úrovniach náročnosti | - |
GPQA Testuje vedomosti na úrovni PhD v chémii, biológii a fyzike prostredníctvom otázok s výberom odpovedí, ktoré vyžadujú hlboké odborné znalosti | 71.5% Pass@1 Zdroj |
IFEval Testuje schopnosť modelu presne dodržiavať explicitné pokyny na formátovanie, generovať vhodné výstupy a udržiavať konzistentné dodržiavanie pokynov pri rôznych úlohách | 83.3% Prompt Strict Zdroj |
SimpleQA Hodnotenie presnosti jednoduchých otázok | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Viacjazyčný programovací benchmark. | - |
LiveCodeBench v5 Benchmark pre programovanie v reálnom čase | - |
Global MMLU (Lite) Zjednodušená verzia benchmarku na hodnotenie univerzálnosti modelov na globálnej úrovni. | - |
MathVista Hodnotí schopnosti matematického uvažovania modelov AI vo vizuálnych kontextoch | - |
Mobilná aplikácia | |
MathArena | |
| Priemerné skóre | 82% |
| AIME 2025 Test založený na úlohách zo súťaže v matematike (American Invitational Mathematics Examination),určený na overenie matematických schopností modelov. | 89% |
| HMMT February 2025 Test založený na úlohách z Harvard-MIT Mathematics Tournament, február 2025, určený na overenie matematických schopností modelov. | 77% |
| BRUMO 2025 | 92% |
| SMT 2025 Test založený na úlohách zo Stanford Math Tournament, 2025, určený na overenie matematických schopností modelov. | 83% |
| CMIMC 2025 Test založený na úlohách z Canadian Mathematical Olympiad, 2025, určený na overenie matematických schopností modelov. | 69% |
Compare AI. Test. Benchmarks. Chatboty pre mobilné aplikácie, Sketch
Copyright © 2026 All Right Reserved.
Komentáre (1)
Jacquie
27 Január 2026Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar