DeepSeek-R1

Komentarai: 1
DeepSeek-R1 #0
DeepSeek-R1 #1
DeepSeek-R1 #2

DeepSeek-R1 yra 671B parametrų Mišrios ekspertų (MoE) modelis su 37B aktyvuotais parametrais per žodį, apmokytas didelio masto sustiprinto mokymosi, sutelkiant dėmesį į mąstymo gebėjimus. Jis apima dvi sustiprinto mokymosi stadijas, skirtas atrasti patobulintas mąstymo schemas ir suderinti su žmogaus pageidavimais, taip pat dvi SFT stadijas, skirtas pritaikyti mąstymo ir nemąstymo gebėjimus. Modelis pasiekia našumą, panašų į OpenAI-o1, matematikos, kodo ir mąstymo užduotyse.

1224
21

Pozicija bendroje reitingų lentelėje nuo
Birželis 2026
5
Vartotojo įvertinimas
https://compare-ai.foundtt.com
4.2

Modelio apžvalga

Internetinė svetainė
DI modelio puslapis
Tiekėjas
Subjekto, kuris teikia šį modelį, pavadinimas.
Pokalbiai
Įveskite žinutę, kad pradėtumėte pokalbį
-
Išleidimo data
Kada modelis buvo pirmą kartą išleistas.
1 metai ago
Sau 21, 2025
Modalumai
Duomenų tipai, kuriuos šis modelis gali apdoroti
tekstas ?
API tiekėjai
Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.)
DeepSeek, HuggingFace
Žinių nutraukimo data
Kada paskutinį kartą buvo atnaujintos modelio žinios.
Nežinoma
Atvirojo kodo
Ar modelio kodas yra prieinamas viešam naudojimui.
Taip
Įvesties kaina
Kaina už žodžių apdorojimą jūsų užklausose
$0.55 už milijoną žodžių
Išvesties kaina
Kaina už modelio sugeneruotus žodžius
$2.19 už milijoną žodžių
MMLU
Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau
90.8%
Pass@1
Šaltinis
MMLU-Pro
Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms
84%
EM
Šaltinis
MMMU
Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus
-
HellaSwag
Iššūkis sakinio užbaigimo testas
-
HumanEval
Vertina kodo generavimo ir problemų sprendimo gebėjimus
-
MATH
Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais
-
GPQA
Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse
71.5%
Pass@1
Šaltinis
IFEval
Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse
83.3%
Prompt Strict
Šaltinis
SimpleQA
Paprastų klausimų tikslumo vertinimas
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Daugiakalbis programavimo etalonas.
-
LiveCodeBench v5
Realaus laiko programavimo etalonas
-
Global MMLU (Lite)
Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje.
-
MathVista
Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose
-
Mobilioji programa

MathArena ?

Vidutinis balas82%
AIME 2025
Testas, pagrįstas užduotimis iš matematikos konkurso (American Invitational Mathematics Examination),skirtas modelių matematikos įgūdžiams patikrinti.
89%
HMMT February 2025
Testas, pagrįstas užduotimis iš Harvard-MIT Mathematics Tournament, 2025 m. vasario mėn., skirtas modelių matematikos įgūdžiams patikrinti.
77%
BRUMO 202592%
SMT 2025
Testas, pagrįstas užduotimis iš Stanford Math Tournament, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.
83%
CMIMC 2025
Testas, pagrįstas užduotimis iš Canadian Mathematical Olympiad, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.
69%

Komentarai (1)

  1. Jacquie

    27 Sausis 2026

    Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

Pridėti komentarą

Palyginti LLM


10%
Mūsų svetainė naudoja slapukus.

Privatumo ir slapukų politika: Ši svetainė naudoja slapukus. Tęsdami naudojimąsi svetaine, jūs sutinkate su jų naudojimu.