GLM-4.5

Komentarai: 0
GLM-4.5 #0
GLM-4.5 #1
GLM-4.5 #2
4940
204

Pozicija bendroje reitingų lentelėje nuo
Birželis 2026
35
Vartotojo įvertinimas
https://compare-ai.foundtt.com
3.8

Modelio apžvalga

Internetinė svetainė
DI modelio puslapis
Tiekėjas
Subjekto, kuris teikia šį modelį, pavadinimas.
Pokalbiai
Įveskite žinutę, kad pradėtumėte pokalbį
Išleidimo data
Kada modelis buvo pirmą kartą išleistas.
11 mėnesių ago
Lie 01, 2025
Modalumai
Duomenų tipai, kuriuos šis modelis gali apdoroti
tekstas ?
API tiekėjai
Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.)
Zhipu AI
Žinių nutraukimo data
Kada paskutinį kartą buvo atnaujintos modelio žinios.
Nežinoma
Atvirojo kodo
Ar modelio kodas yra prieinamas viešam naudojimui.
Taip
Įvesties kaina
Kaina už žodžių apdorojimą jūsų užklausose
-
Išvesties kaina
Kaina už modelio sugeneruotus žodžius
-
MMLU
Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau
84.6%
Academic Knowledge
Šaltinis
MMLU-Pro
Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms
-
MMMU
Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus
-
HellaSwag
Iššūkis sakinio užbaigimo testas
-
HumanEval
Vertina kodo generavimo ir problemų sprendimo gebėjimus
-
MATH
Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais
-
GPQA
Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse
-
IFEval
Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse
-
SimpleQA
Paprastų klausimų tikslumo vertinimas
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Daugiakalbis programavimo etalonas.
-
LiveCodeBench v5
Realaus laiko programavimo etalonas
-
Global MMLU (Lite)
Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje.
-
MathVista
Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose
-
Mobilioji programa
-

MathArena ?

Vidutinis balas83%
AIME 2025
Testas, pagrįstas užduotimis iš matematikos konkurso (American Invitational Mathematics Examination),skirtas modelių matematikos įgūdžiams patikrinti.
93%
HMMT February 2025
Testas, pagrįstas užduotimis iš Harvard-MIT Mathematics Tournament, 2025 m. vasario mėn., skirtas modelių matematikos įgūdžiams patikrinti.
78%
BRUMO 202592%
SMT 2025
Testas, pagrįstas užduotimis iš Stanford Math Tournament, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.
82%
CMIMC 2025
Testas, pagrįstas užduotimis iš Canadian Mathematical Olympiad, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.
71%

Pridėti komentarą

Palyginti LLM


10%
Mūsų svetainė naudoja slapukus.

Privatumo ir slapukų politika: Ši svetainė naudoja slapukus. Tęsdami naudojimąsi svetaine, jūs sutinkate su jų naudojimu.