Claude Opus 4 AI Technické špecifikácie a recenzia

Claude Opus 4

Komentáre: 1

4975

513

Pozícia v celkovom rebríčku k dátumuJúl 2026

Hodnotenie používateľovhttps://compare-ai.foundtt.com

4.1

Prehľad modelu

Webová stránka Webová stránka AI modelu	Open
Poskytovateľ Subjekt, ktorý poskytuje tento model.	Anthropic
Chat Zadajte správu a začnite chatovať	Open
Dátum vydania Kedy bol model prvýkrát vydaný.	1 rok ago Máj 22, 2025
Modality Typy dát, ktoré tento model dokáže spracovať	text ? obrázky ?
Poskytovatelia API Poskytovatelia, ktorí ponúkajú tento model. (Toto nie je vyčerpávajúci zoznam.)	Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Dátum zastarania vedomostí Kedy boli vedomosti modelu naposledy aktualizované.	Neznáme
Open Source Či je kód modelu dostupný na verejné použitie.	Nie
Cena za vstup Cena za spracovanie tokenov vo vašich promptoch	$15
Cena za výstup Cena za tokeny generované modelom	$75 za milión tokenov
MMLU Massive Multitask Language Understanding – Testuje vedomosti v 57 predmetoch vrátane matematiky, histórie, práva a ďalších	88.8% Zdroj
MMLU-Pro Robustnejší benchmark MMLU s náročnejšími otázkami zameranými na uvažovanie, väčším výberom a zníženou citlivosťou na prompty	-
MMMU Massive Multitask Multimodal Understanding – Testuje porozumenie textu, obrázkom, audiu a videu	76.5% Zdroj
HellaSwag Náročný benchmark na dokončovanie viet	-
HumanEval Hodnotí schopnosti generovania kódu a riešenia problémov	-
MATH Testuje schopnosti riešenia matematických problémov na rôznych úrovniach náročnosti	-
GPQA Testuje vedomosti na úrovni PhD v chémii, biológii a fyzike prostredníctvom otázok s výberom odpovedí, ktoré vyžadujú hlboké odborné znalosti	79.6% Diamond Zdroj
IFEval Testuje schopnosť modelu presne dodržiavať explicitné pokyny na formátovanie, generovať vhodné výstupy a udržiavať konzistentné dodržiavanie pokynov pri rôznych úlohách	-
SimpleQA Hodnotenie presnosti jednoduchých otázok	-
AIME 2024	-
AIME 2025	75.5% Zdroj
Aider Polyglot Viacjazyčný programovací benchmark.	-
LiveCodeBench v5 Benchmark pre programovanie v reálnom čase	-
Global MMLU (Lite) Zjednodušená verzia benchmarku na hodnotenie univerzálnosti modelov na globálnej úrovni.	-
MathVista Hodnotí schopnosti matematického uvažovania modelov AI vo vizuálnych kontextoch	-
Mobilná aplikácia	Google Play Apple Apps

Komentáre (1)

Tawfiq
18 Júl 2025
اريد claude opus

Claude Opus 4 Špecifikácie, recenzia a porovnanie

Claude Opus 4

Prehľad modelu

Komentáre (1)

Tawfiq

Pridať komentár

Porovnaj LLM