„OpenAI o3-mini“ yra greitas ir ekonomiškas loginio samprotavimo modelis, skirtas STEM sritims, pasižymintis puikiu veikimu moksle, matematikoje ir programavime. Pristatytas 2025 m. sausį, jis apima svarbiausias kūrėjams skirtas funkcijas, tokias kaip funkcijų iškvietimas, struktūrizuoti išvesties duomenys ir kūrėjų pranešimai. Modelis siūlo tris loginio samprotavimo lygius—žemą, vidutinį ir aukštą—leidžiančius naudotojams optimizuoti pusiausvyrą tarp gilesnės analizės ir greitesnio atsako. Skirtingai nei o3 modelis, jis neturi vaizdo apdorojimo galimybių. Pradžioje prieinamas tik tam tikriems kūrėjams su 3–5 API naudojimo lygiais ir gali būti pasiekiamas per „Chat Completions API“, „Assistants API“ ir „Batch API“.
NVIDIA Llama 3.1 Nemotron 70B yra galingas kalbos modelis, optimizuotas teikti tikslius ir informatyvius atsakymus. Sukurtas pagal Llama 3.1 70B architektūrą ir patobulintas naudojant stiprinamąjį mokymą iš žmogaus atsiliepimų (RLHF),jis pasiekia aukščiausius rezultatus automatinio lygiavimo testuose. Sukurtas programoms, reikalaujančioms didelio tikslumo atsakymų generavime ir naudingumo, šis modelis tinka įvairioms vartotojų užklausoms įvairiose srityse.
o3-mini | Llama 3.1 Nemotron 70B Instruct | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | ||
Išleidimo data | Jan 31, 2025 2 mėnesiai ago | Oct 15, 2023 1 metai ago |
Modalumai | tekstas | tekstas |
API tiekėjai | OpenAI API | OpenRouter |
Žinių nutraukimo data | Nežinoma | - |
Atvirojo kodo | Ne | Taip |
Įvesties kaina | $1.10 už milijoną žodžių | $0.35 už milijoną žodžių |
Išvesties kaina | $4.40 už milijoną žodžių | $0.40 už milijoną žodžių |
MMLU | 86.9% pass@1, high effort Šaltinis | 85% 5-shot Šaltinis |
MMLU Pro | Nėra prieinama | Nėra prieinama |
MMMU | Nėra prieinama | Nėra prieinama |
HellaSwag | Nėra prieinama | Nėra prieinama |
HumanEval | Nėra prieinama | 75% Šaltinis |
MATH | 97.9% pass@1, high effort Šaltinis | 71% Šaltinis |
GPQA | 79.7% 0-shot, high effort Šaltinis | Nėra prieinama |
IFEval | Nėra prieinama | Nėra prieinama |
Mobilioji programa | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.