




NVIDIA Llama 3.1 Nemotron 70B yra galingas kalbos modelis, optimizuotas teikti tikslius ir informatyvius atsakymus. Sukurtas pagal Llama 3.1 70B architektūrą ir patobulintas naudojant stiprinamąjį mokymą iš žmogaus atsiliepimų (RLHF),jis pasiekia aukščiausius rezultatus automatinio lygiavimo testuose. Sukurtas programoms, reikalaujančioms didelio tikslumo atsakymų generavime ir naudingumo, šis modelis tinka įvairioms vartotojų užklausoms įvairiose srityse.
Internetinė svetainė DI modelio puslapis | |
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas. | |
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį | - |
Išleidimo data Kada modelis buvo pirmą kartą išleistas. | 2 metai ago Spa 15, 2023 |
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti | tekstas |
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.) | OpenRouter |
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios. | - |
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui. | Taip |
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose | $0.35 už milijoną žodžių |
Išvesties kaina Kaina už modelio sugeneruotus žodžius | $0.40 už milijoną žodžių |
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau | 85% 5-shot Šaltinis |
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms | Nėra prieinama |
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus | Nėra prieinama |
HellaSwag Iššūkis sakinio užbaigimo testas | Nėra prieinama |
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus | 75% Šaltinis |
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais | 71% Šaltinis |
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse | Nėra prieinama |
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse | Nėra prieinama |
SimpleQA Paprastų klausimų tikslumo vertinimas | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Daugiakalbis programavimo etalonas. | - |
LiveCodeBench v5 Realaus laiko programavimo etalonas | - |
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje. | - |
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose | - |
Mobilioji programa | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2026 All Right Reserved.