GLM-4.5 DI techninės specifikacijos ir apžvalga

GLM-4.5

Komentarai: 0

4940

204

Pozicija bendroje reitingų lentelėje nuo
Birželis 2026

Vartotojo įvertinimas
https://compare-ai.foundtt.com

3.8

Modelio apžvalga

Internetinė svetainė DI modelio puslapis	Open
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas.	Zhipu AI
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį	Open
Išleidimo data Kada modelis buvo pirmą kartą išleistas.	11 mėnesių ago Lie 01, 2025
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti	tekstas ?
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.)	Zhipu AI
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios.	Nežinoma
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui.	Taip
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose	-
Išvesties kaina Kaina už modelio sugeneruotus žodžius	-
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau	84.6% Academic Knowledge Šaltinis
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms	-
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus	-
HellaSwag Iššūkis sakinio užbaigimo testas	-
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus	-
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais	-
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse	-
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse	-
SimpleQA Paprastų klausimų tikslumo vertinimas	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Daugiakalbis programavimo etalonas.	-
LiveCodeBench v5 Realaus laiko programavimo etalonas	-
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje.	-
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose	-
Mobilioji programa	-
MathArena ?
Vidutinis balas	83%
AIME 2025 Testas, pagrįstas užduotimis iš matematikos konkurso (American Invitational Mathematics Examination),skirtas modelių matematikos įgūdžiams patikrinti.	93%
HMMT February 2025 Testas, pagrįstas užduotimis iš Harvard-MIT Mathematics Tournament, 2025 m. vasario mėn., skirtas modelių matematikos įgūdžiams patikrinti.	78%
BRUMO 2025	92%
SMT 2025 Testas, pagrįstas užduotimis iš Stanford Math Tournament, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.	82%
CMIMC 2025 Testas, pagrįstas užduotimis iš Canadian Mathematical Olympiad, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.	71%

GLM-4.5 specifikacijos, apžvalga ir palyginimas

GLM-4.5

Modelio apžvalga

MathArena ?

Pridėti komentarą

Palyginti LLM