


Internetinė svetainė DI modelio puslapis | |
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas. | |
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį | |
Išleidimo data Kada modelis buvo pirmą kartą išleistas. | 1 metai ago Geg 22, 2025 |
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti | tekstas vaizdai |
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.) | Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI |
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios. | Nežinoma |
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui. | Ne |
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose | $15 |
Išvesties kaina Kaina už modelio sugeneruotus žodžius | $75 už milijoną žodžių |
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau | 88.8% Šaltinis |
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms | - |
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus | 76.5% Šaltinis |
HellaSwag Iššūkis sakinio užbaigimo testas | - |
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus | - |
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais | - |
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse | 79.6% Diamond Šaltinis |
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse | - |
SimpleQA Paprastų klausimų tikslumo vertinimas | - |
AIME 2024 | - |
AIME 2025 | 75.5% Šaltinis |
Aider Polyglot Daugiakalbis programavimo etalonas. | - |
LiveCodeBench v5 Realaus laiko programavimo etalonas | - |
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje. | - |
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose | - |
Mobilioji programa |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2026 All Right Reserved.
Komentarai (1)
Tawfiq
18 Liepa 2025اريد claude opus