Claude Opus 4 DI techninės specifikacijos ir apžvalga

Claude Opus 4

Komentarai: 1

4975

513

Pozicija bendroje reitingų lentelėje nuo
Birželis 2026

Vartotojo įvertinimas
https://compare-ai.foundtt.com

4.1

Modelio apžvalga

Internetinė svetainė DI modelio puslapis	Open
Tiekėjas Subjekto, kuris teikia šį modelį, pavadinimas.	Anthropic
Pokalbiai Įveskite žinutę, kad pradėtumėte pokalbį	Open
Išleidimo data Kada modelis buvo pirmą kartą išleistas.	1 metai ago Geg 22, 2025
Modalumai Duomenų tipai, kuriuos šis modelis gali apdoroti	tekstas ? vaizdai ?
API tiekėjai Tiekėjai, kurie siūlo šį modelį. (Tai nėra išsamus sąrašas.)	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Žinių nutraukimo data Kada paskutinį kartą buvo atnaujintos modelio žinios.	Nežinoma
Atvirojo kodo Ar modelio kodas yra prieinamas viešam naudojimui.	Ne
Įvesties kaina Kaina už žodžių apdorojimą jūsų užklausose	$15
Išvesties kaina Kaina už modelio sugeneruotus žodžius	$75 už milijoną žodžių
MMLU Masinis daugiužduotis kalbos supratimas – testuoja žinias apie 57 temas, įskaitant matematiką, istoriją, teisę ir daugiau	88.8% Šaltinis
MMLU-Pro Išsamus MMLU testas su sudėtingesniais, mąstymą orientuotais klausimais, didesniu pasirinkimu ir sumažintu jautrumu užklausoms	-
MMMU Masinis daugiužduotis multimodalus supratimas – testuoja supratimą apie tekstą, vaizdus, garsą ir vaizdo įrašus	76.5% Šaltinis
HellaSwag Iššūkis sakinio užbaigimo testas	-
HumanEval Vertina kodo generavimo ir problemų sprendimo gebėjimus	-
MATH Testuoja matematinių užduočių sprendimo gebėjimus įvairiais sudėtingumo lygiais	-
GPQA Testuoja PhD lygio žinias chemijoje, biologijoje ir fizikoje per pasirinkimo klausimus, kurie reikalauja gilių žinių šiose srityse	79.6% Diamond Šaltinis
IFEval Testuoja modelio gebėjimą tiksliai sekti aiškias formatavimo instrukcijas, generuoti tinkamus rezultatus ir išlaikyti nuoseklumą įvairiose užduotyse	-
SimpleQA Paprastų klausimų tikslumo vertinimas	-
AIME 2024	-
AIME 2025	75.5% Šaltinis
Aider Polyglot Daugiakalbis programavimo etalonas.	-
LiveCodeBench v5 Realaus laiko programavimo etalonas	-
Global MMLU (Lite) Supaprastinta etalono versija, skirta modelių universalumui įvertinti pasaulyje.	-
MathVista Įvertina DI modelių matematinius samprotavimo gebėjimus vaizdiniuose kontekstuose	-
Mobilioji programa	Google Play Apple Apps

Komentarai (1)

Tawfiq
18 Liepa 2025
اريد claude opus

Claude Opus 4 specifikacijos, apžvalga ir palyginimas

Claude Opus 4

Modelio apžvalga

Komentarai (1)

Tawfiq

Pridėti komentarą

Palyginti LLM