Claude Opus 4.5

Komentáre: 0
Claude Opus 4.5 #0
Claude Opus 4.5 #1
Claude Opus 4.5 #2
4974
543

Pozícia v celkovom rebríčku k dátumuJún 2026
2
Hodnotenie používateľovhttps://compare-ai.foundtt.com
4.4

Prehľad modelu

Webová stránka
Webová stránka AI modelu
Poskytovateľ
Subjekt, ktorý poskytuje tento model.
Chat
Zadajte správu a začnite chatovať
Dátum vydania
Kedy bol model prvýkrát vydaný.
6 mesiacov ago
Nov 24, 2025
Modality
Typy dát, ktoré tento model dokáže spracovať
text ?
obrázky ?
Poskytovatelia API
Poskytovatelia, ktorí ponúkajú tento model. (Toto nie je vyčerpávajúci zoznam.)
Anthropic API, Amazon Bedrock, Google Vertex AI, Claude developer platform
Dátum zastarania vedomostí
Kedy boli vedomosti modelu naposledy aktualizované.
Neznáme
Open Source
Či je kód modelu dostupný na verejné použitie.
Nie
Cena za vstup
Cena za spracovanie tokenov vo vašich promptoch
$5 za milión tokenov
Cena za výstup
Cena za tokeny generované modelom
$25 za milión tokenov
MMLU
Massive Multitask Language Understanding – Testuje vedomosti v 57 predmetoch vrátane matematiky, histórie, práva a ďalších
90.8%
Zdroj
MMLU-Pro
Robustnejší benchmark MMLU s náročnejšími otázkami zameranými na uvažovanie, väčším výberom a zníženou citlivosťou na prompty
-
MMMU
Massive Multitask Multimodal Understanding – Testuje porozumenie textu, obrázkom, audiu a videu
80.7%
Validation
Zdroj
HellaSwag
Náročný benchmark na dokončovanie viet
-
HumanEval
Hodnotí schopnosti generovania kódu a riešenia problémov
-
MATH
Testuje schopnosti riešenia matematických problémov na rôznych úrovniach náročnosti
-
GPQA
Testuje vedomosti na úrovni PhD v chémii, biológii a fyzike prostredníctvom otázok s výberom odpovedí, ktoré vyžadujú hlboké odborné znalosti
87%
Diamond
Zdroj
IFEval
Testuje schopnosť modelu presne dodržiavať explicitné pokyny na formátovanie, generovať vhodné výstupy a udržiavať konzistentné dodržiavanie pokynov pri rôznych úlohách
-
SimpleQA
Hodnotenie presnosti jednoduchých otázok
-
AIME 2024
-
AIME 2025
92.77%
Zdroj
Aider Polyglot
Viacjazyčný programovací benchmark.
-
LiveCodeBench v5
Benchmark pre programovanie v reálnom čase
-
Global MMLU (Lite)
Zjednodušená verzia benchmarku na hodnotenie univerzálnosti modelov na globálnej úrovni.
-
MathVista
Hodnotí schopnosti matematického uvažovania modelov AI vo vizuálnych kontextoch
-
Mobilná aplikácia

Pridať komentár

Porovnaj LLM


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.