



DeepSeek-R1 yra 671B parametrų Mišrios ekspertų (MoE) modelis su 37B aktyvuotais parametrais per žodį, apmokytas didelio masto sustiprinto mokymosi, sutelkiant dėmesį į mąstymo gebėjimus. Jis apima dvi sustiprinto mokymosi stadijas, skirtas atrasti patobulintas mąstymo schemas ir suderinti su žmogaus pageidavimais, taip pat dvi SFT stadijas, skirtas pritaikyti mąstymo ir nemąstymo gebėjimus. Modelis pasiekia našumą, panašų į OpenAI-o1, matematikos, kodo ir mąstymo užduotyse.
Internetinė svetainė DI modelio puslapis | |
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas. | |
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį | - |
Išleidimo data Kada modelis buvo pirmą kartą išleistas. | 1 metai ago Sau 21, 2025 |
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti | tekstas |
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.) | DeepSeek, HuggingFace |
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios. | Nežinoma |
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui. | Taip |
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose | $0.55 už milijoną žodžių |
Išvesties kaina Kaina už modelio sugeneruotus žodžius | $2.19 už milijoną žodžių |
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau | 90.8% Pass@1 Šaltinis |
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms | 84% EM Šaltinis |
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus | - |
HellaSwag Iššūkis sakinio užbaigimo testas | - |
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus | - |
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais | - |
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse | 71.5% Pass@1 Šaltinis |
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse | 83.3% Prompt Strict Šaltinis |
SimpleQA Paprastų klausimų tikslumo vertinimas | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Daugiakalbis programavimo etalonas. | - |
LiveCodeBench v5 Realaus laiko programavimo etalonas | - |
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje. | - |
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose | - |
Mobilioji programa | |
MathArena | |
| Vidutinis balas | 82% |
| AIME 2025 Testas, pagrįstas užduotimis iš matematikos konkurso (American Invitational Mathematics Examination),skirtas modelių matematikos įgūdžiams patikrinti. | 89% |
| HMMT February 2025 Testas, pagrįstas užduotimis iš Harvard-MIT Mathematics Tournament, 2025 m. vasario mėn., skirtas modelių matematikos įgūdžiams patikrinti. | 77% |
| BRUMO 2025 | 92% |
| SMT 2025 Testas, pagrįstas užduotimis iš Stanford Math Tournament, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti. | 83% |
| CMIMC 2025 Testas, pagrįstas užduotimis iš Canadian Mathematical Olympiad, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti. | 69% |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2026 All Right Reserved.
Komentarai (1)
Jacquie
27 Sausis 2026Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar