Llama 3.1 Nemotron 70B Instruct

Komentarai: 0
Llama 3.1 Nemotron 70B Instruct #0
Llama 3.1 Nemotron 70B Instruct #1
Llama 3.1 Nemotron 70B Instruct #2
Llama 3.1 Nemotron 70B Instruct #3

NVIDIA Llama 3.1 Nemotron 70B yra galingas kalbos modelis, optimizuotas teikti tikslius ir informatyvius atsakymus. Sukurtas pagal Llama 3.1 70B architektūrą ir patobulintas naudojant stiprinamąjį mokymą iš žmogaus atsiliepimų (RLHF),jis pasiekia aukščiausius rezultatus automatinio lygiavimo testuose. Sukurtas programoms, reikalaujančioms didelio tikslumo atsakymų generavime ir naudingumo, šis modelis tinka įvairioms vartotojų užklausoms įvairiose srityse.

4028
265

Pozicija bendroje reitingų lentelėje nuo
Birželis 2026
30
Vartotojo įvertinimas
https://compare-ai.foundtt.com
3.9

Modelio apžvalga

Internetinė svetainė
DI modelio puslapis
Tiekėjas
Subjekto, kuris teikia šį modelį, pavadinimas.
Pokalbiai
Įveskite žinutę, kad pradėtumėte pokalbį
-
Išleidimo data
Kada modelis buvo pirmą kartą išleistas.
2 metai ago
Spa 15, 2023
Modalumai
Duomenų tipai, kuriuos šis modelis gali apdoroti
tekstas ?
API tiekėjai
Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.)
OpenRouter
Žinių nutraukimo data
Kada paskutinį kartą buvo atnaujintos modelio žinios.
-
Atvirojo kodo
Ar modelio kodas yra prieinamas viešam naudojimui.
Taip
Įvesties kaina
Kaina už žodžių apdorojimą jūsų užklausose
$0.35 už milijoną žodžių
Išvesties kaina
Kaina už modelio sugeneruotus žodžius
$0.40 už milijoną žodžių
MMLU
Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau
85%
5-shot
Šaltinis
MMLU-Pro
Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms
Nėra prieinama
MMMU
Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus
Nėra prieinama
HellaSwag
Iššūkis sakinio užbaigimo testas
Nėra prieinama
HumanEval
Vertina kodo generavimo ir problemų sprendimo gebėjimus
75%
Šaltinis
MATH
Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais
71%
Šaltinis
GPQA
Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse
Nėra prieinama
IFEval
Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse
Nėra prieinama
SimpleQA
Paprastų klausimų tikslumo vertinimas
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Daugiakalbis programavimo etalonas.
-
LiveCodeBench v5
Realaus laiko programavimo etalonas
-
Global MMLU (Lite)
Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje.
-
MathVista
Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose
-
Mobilioji programa
-

Pridėti komentarą

Palyginti LLM


10%
Mūsų svetainė naudoja slapukus.

Privatumo ir slapukų politika: Ši svetainė naudoja slapukus. Tęsdami naudojimąsi svetaine, jūs sutinkate su jų naudojimu.