



Internetinė svetainė DI modelio puslapis | |
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas. | |
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį | |
Išleidimo data Kada modelis buvo pirmą kartą išleistas. | 11 mėnesių ago Lie 01, 2025 |
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti | tekstas |
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.) | Zhipu AI |
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios. | Nežinoma |
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui. | Taip |
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose | - |
Išvesties kaina Kaina už modelio sugeneruotus žodžius | - |
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau | 84.6% Academic Knowledge Šaltinis |
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms | - |
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus | - |
HellaSwag Iššūkis sakinio užbaigimo testas | - |
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus | - |
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais | - |
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse | - |
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse | - |
SimpleQA Paprastų klausimų tikslumo vertinimas | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Daugiakalbis programavimo etalonas. | - |
LiveCodeBench v5 Realaus laiko programavimo etalonas | - |
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje. | - |
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose | - |
Mobilioji programa | - |
MathArena | |
| Vidutinis balas | 83% |
| AIME 2025 Testas, pagrįstas užduotimis iš matematikos konkurso (American Invitational Mathematics Examination),skirtas modelių matematikos įgūdžiams patikrinti. | 93% |
| HMMT February 2025 Testas, pagrįstas užduotimis iš Harvard-MIT Mathematics Tournament, 2025 m. vasario mėn., skirtas modelių matematikos įgūdžiams patikrinti. | 78% |
| BRUMO 2025 | 92% |
| SMT 2025 Testas, pagrįstas užduotimis iš Stanford Math Tournament, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti. | 82% |
| CMIMC 2025 Testas, pagrįstas užduotimis iš Canadian Mathematical Olympiad, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti. | 71% |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2026 All Right Reserved.