



Internetinė svetainė DI modelio puslapis | |
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas. | |
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį | |
Išleidimo data Kada modelis buvo pirmą kartą išleistas. | 1 metai ago Bal 29, 2025 |
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti | - |
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.) | - |
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios. | - |
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui. | Taip (Šaltinis) |
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose | - |
Išvesties kaina Kaina už modelio sugeneruotus žodžius | - |
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau | - |
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms | - |
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus | - |
HellaSwag Iššūkis sakinio užbaigimo testas | - |
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus | - |
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais | - |
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse | - |
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse | - |
SimpleQA Paprastų klausimų tikslumo vertinimas | - |
AIME 2024 | Šaltinis |
AIME 2025 | Šaltinis |
Aider Polyglot Daugiakalbis programavimo etalonas. | - |
LiveCodeBench v5 Realaus laiko programavimo etalonas | - |
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje. | - |
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose | - |
Mobilioji programa | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2026 All Right Reserved.