DeepSeek-R1 DI techninės specifikacijos ir apžvalga

DeepSeek-R1

Komentarai: 1

DeepSeek-R1 yra 671B parametrų Mišrios ekspertų (MoE) modelis su 37B aktyvuotais parametrais per žodį, apmokytas didelio masto sustiprinto mokymosi, sutelkiant dėmesį į mąstymo gebėjimus. Jis apima dvi sustiprinto mokymosi stadijas, skirtas atrasti patobulintas mąstymo schemas ir suderinti su žmogaus pageidavimais, taip pat dvi SFT stadijas, skirtas pritaikyti mąstymo ir nemąstymo gebėjimus. Modelis pasiekia našumą, panašų į OpenAI-o1, matematikos, kodo ir mąstymo užduotyse.

1224

Pozicija bendroje reitingų lentelėje nuo
Birželis 2026

Vartotojo įvertinimas
https://compare-ai.foundtt.com

4.2

Modelio apžvalga

Internetinė svetainė DI modelio puslapis	Open
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas.	DeepSeek
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį	-
Išleidimo data Kada modelis buvo pirmą kartą išleistas.	1 metai ago Sau 21, 2025
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti	tekstas ?
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.)	DeepSeek, HuggingFace
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios.	Nežinoma
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui.	Taip
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose	$0.55 už milijoną žodžių
Išvesties kaina Kaina už modelio sugeneruotus žodžius	$2.19 už milijoną žodžių
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau	90.8% Pass@1 Šaltinis
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms	84% EM Šaltinis
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus	-
HellaSwag Iššūkis sakinio užbaigimo testas	-
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus	-
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais	-
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse	71.5% Pass@1 Šaltinis
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse	83.3% Prompt Strict Šaltinis
SimpleQA Paprastų klausimų tikslumo vertinimas	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Daugiakalbis programavimo etalonas.	-
LiveCodeBench v5 Realaus laiko programavimo etalonas	-
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje.	-
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose	-
Mobilioji programa	Google Play Apple Apps
MathArena ?
Vidutinis balas	82%
AIME 2025 Testas, pagrįstas užduotimis iš matematikos konkurso (American Invitational Mathematics Examination),skirtas modelių matematikos įgūdžiams patikrinti.	89%
HMMT February 2025 Testas, pagrįstas užduotimis iš Harvard-MIT Mathematics Tournament, 2025 m. vasario mėn., skirtas modelių matematikos įgūdžiams patikrinti.	77%
BRUMO 2025	92%
SMT 2025 Testas, pagrįstas užduotimis iš Stanford Math Tournament, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.	83%
CMIMC 2025 Testas, pagrįstas užduotimis iš Canadian Mathematical Olympiad, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.	69%

Komentarai (1)

Jacquie
27 Sausis 2026
Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

DeepSeek-R1 specifikacijos, apžvalga ir palyginimas

DeepSeek-R1

Modelio apžvalga

MathArena ?

Komentarai (1)

Jacquie

Pridėti komentarą

Palyginti LLM