GPT-4.1, kurį OpenAI pristatė 2025 m. balandžio 14 d., pristato 1 milijono ženklų konteksto langą ir palaiko iki 32 768 ženklų išvestį užklausai. Jis pasižymi puikiais rezultatais programavimo užduotyse, pasiekdamas 54,6 % SWE-Bench Verified etalono rodiklio ir parodydamas 10,5 % pagerėjimą, lyginant su GPT-4o, vykdant instrukcijas „MultiChallenge“. Modelio žinių atnaujinimo data – 2024 m. birželis. Kaina – 2,00 USD už milijoną įvesties ženklų ir 8,00 USD už milijoną išvesties ženklų, su 75 % nuolaida talpinamiems duomenims, todėl jis yra labai ekonomiškas pasikartojančioms užklausoms.
NVIDIA Llama 3.1 Nemotron 70B yra galingas kalbos modelis, optimizuotas teikti tikslius ir informatyvius atsakymus. Sukurtas pagal Llama 3.1 70B architektūrą ir patobulintas naudojant stiprinamąjį mokymą iš žmogaus atsiliepimų (RLHF),jis pasiekia aukščiausius rezultatus automatinio lygiavimo testuose. Sukurtas programoms, reikalaujančioms didelio tikslumo atsakymų generavime ir naudingumo, šis modelis tinka įvairioms vartotojų užklausoms įvairiose srityse.
GPT-4.1 | Llama 3.1 Nemotron 70B Instruct | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | ||
Išleidimo data | Apr 14, 2025 2 savaitės ago | Oct 15, 2023 1 metai ago |
Modalumai | tekstas vaizdai | tekstas |
API tiekėjai | OpenAI API | OpenRouter |
Žinių nutraukimo data | - | - |
Atvirojo kodo | Ne | Taip |
Įvesties kaina | $2.00 už milijoną žodžių | $0.35 už milijoną žodžių |
Išvesties kaina | $8.00 už milijoną žodžių | $0.40 už milijoną žodžių |
MMLU | 90.2% pass@1 Šaltinis | 85% 5-shot Šaltinis |
MMLU Pro | - | Nėra prieinama |
MMMU | 74.8% Šaltinis | Nėra prieinama |
HellaSwag | - | Nėra prieinama |
HumanEval | - | 75% Šaltinis |
MATH | - | 71% Šaltinis |
GPQA | 66.3% Diamond Šaltinis | Nėra prieinama |
IFEval | - | Nėra prieinama |
Mobilioji programa | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.