



Internetinė svetainė DI modelio puslapis | |
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas. | |
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį | |
Išleidimo data Kada modelis buvo pirmą kartą išleistas. | 11 mėnesių ago Bir 17, 2025 |
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti | tekstas vaizdai balso vaizdo |
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.) | Google AI Studio, Vertex AI, Gemini app |
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios. | - |
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui. | Ne |
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose | $0.10 už milijoną žodžių |
Išvesties kaina Kaina už modelio sugeneruotus žodžius | $0.40 už milijoną žodžių |
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau | 81.1% Šaltinis |
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms | - |
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus | 72.9% Šaltinis |
HellaSwag Iššūkis sakinio užbaigimo testas | - |
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus | - |
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais | - |
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse | 64.6% Diamond Šaltinis |
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse | - |
SimpleQA Paprastų klausimų tikslumo vertinimas | 13% Šaltinis |
AIME 2024 | - |
AIME 2025 | 49.8% Šaltinis |
Aider Polyglot Daugiakalbis programavimo etalonas. | - |
LiveCodeBench v5 Realaus laiko programavimo etalonas | - |
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje. | - |
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose | - |
Mobilioji programa |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2026 All Right Reserved.