DeepSeek-R1

Komentáre: 1
DeepSeek-R1 #0
DeepSeek-R1 #1
DeepSeek-R1 #2

DeepSeek-R1 je model s 671 miliardami parametrov Mixture-of-Experts (MoE),s 37 miliardami aktivovaných parametrov na token, vyškolený pomocou veľkého rozsahu posilňovacieho učenia so zameraním na schopnosti dedukcie. Zohľadňuje dve fázy RL na objavovanie vylepšených vzorcov dedukcie a zosúladenie s ľudskými preferenciami, spolu s dvoma fázami SFT na posilnenie dedukčných a nededukčných schopností. Model dosahuje výkon porovnateľný s OpenAI-o1 v úlohách matematiky, kódu a dedukcie.

1224
21

Pozícia v celkovom rebríčku k dátumuJún 2026
5
Hodnotenie používateľovhttps://compare-ai.foundtt.com
4.2

Prehľad modelu

Webová stránka
Webová stránka AI modelu
Poskytovateľ
Subjekt, ktorý poskytuje tento model.
Chat
Zadajte správu a začnite chatovať
-
Dátum vydania
Kedy bol model prvýkrát vydaný.
1 rok ago
Jan 21, 2025
Modality
Typy dát, ktoré tento model dokáže spracovať
text ?
Poskytovatelia API
Poskytovatelia, ktorí ponúkajú tento model. (Toto nie je vyčerpávajúci zoznam.)
DeepSeek, HuggingFace
Dátum zastarania vedomostí
Kedy boli vedomosti modelu naposledy aktualizované.
Neznáme
Open Source
Či je kód modelu dostupný na verejné použitie.
Áno
Cena za vstup
Cena za spracovanie tokenov vo vašich promptoch
$0.55 za milión tokenov
Cena za výstup
Cena za tokeny generované modelom
$2.19 za milión tokenov
MMLU
Massive Multitask Language Understanding – Testuje vedomosti v 57 predmetoch vrátane matematiky, histórie, práva a ďalších
90.8%
Pass@1
Zdroj
MMLU-Pro
Robustnejší benchmark MMLU s náročnejšími otázkami zameranými na uvažovanie, väčším výberom a zníženou citlivosťou na prompty
84%
EM
Zdroj
MMMU
Massive Multitask Multimodal Understanding – Testuje porozumenie textu, obrázkom, audiu a videu
-
HellaSwag
Náročný benchmark na dokončovanie viet
-
HumanEval
Hodnotí schopnosti generovania kódu a riešenia problémov
-
MATH
Testuje schopnosti riešenia matematických problémov na rôznych úrovniach náročnosti
-
GPQA
Testuje vedomosti na úrovni PhD v chémii, biológii a fyzike prostredníctvom otázok s výberom odpovedí, ktoré vyžadujú hlboké odborné znalosti
71.5%
Pass@1
Zdroj
IFEval
Testuje schopnosť modelu presne dodržiavať explicitné pokyny na formátovanie, generovať vhodné výstupy a udržiavať konzistentné dodržiavanie pokynov pri rôznych úlohách
83.3%
Prompt Strict
Zdroj
SimpleQA
Hodnotenie presnosti jednoduchých otázok
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Viacjazyčný programovací benchmark.
-
LiveCodeBench v5
Benchmark pre programovanie v reálnom čase
-
Global MMLU (Lite)
Zjednodušená verzia benchmarku na hodnotenie univerzálnosti modelov na globálnej úrovni.
-
MathVista
Hodnotí schopnosti matematického uvažovania modelov AI vo vizuálnych kontextoch
-
Mobilná aplikácia

MathArena ?

Priemerné skóre82%
AIME 2025
Test založený na úlohách zo súťaže v matematike (American Invitational Mathematics Examination),určený na overenie matematických schopností modelov.
89%
HMMT February 2025
Test založený na úlohách z Harvard-MIT Mathematics Tournament, február 2025, určený na overenie matematických schopností modelov.
77%
BRUMO 202592%
SMT 2025
Test založený na úlohách zo Stanford Math Tournament, 2025, určený na overenie matematických schopností modelov.
83%
CMIMC 2025
Test založený na úlohách z Canadian Mathematical Olympiad, 2025, určený na overenie matematických schopností modelov.
69%

Komentáre (1)

  1. Jacquie

    27 Január 2026

    Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

Pridať komentár

Porovnaj LLM


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.