Claude Opus 4

Komentáre: 1
Claude Opus 4 #0
Claude Opus 4 #1
4975
513

Pozícia v celkovom rebríčku k dátumuJún 2026
18
Hodnotenie používateľovhttps://compare-ai.foundtt.com
4.1

Prehľad modelu

Webová stránka
Webová stránka AI modelu
Poskytovateľ
Subjekt, ktorý poskytuje tento model.
Chat
Zadajte správu a začnite chatovať
Dátum vydania
Kedy bol model prvýkrát vydaný.
1 rok ago
Máj 22, 2025
Modality
Typy dát, ktoré tento model dokáže spracovať
text ?
obrázky ?
Poskytovatelia API
Poskytovatelia, ktorí ponúkajú tento model. (Toto nie je vyčerpávajúci zoznam.)
Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI
Dátum zastarania vedomostí
Kedy boli vedomosti modelu naposledy aktualizované.
Neznáme
Open Source
Či je kód modelu dostupný na verejné použitie.
Nie
Cena za vstup
Cena za spracovanie tokenov vo vašich promptoch
$15
Cena za výstup
Cena za tokeny generované modelom
$75 za milión tokenov
MMLU
Massive Multitask Language Understanding – Testuje vedomosti v 57 predmetoch vrátane matematiky, histórie, práva a ďalších
88.8%
Zdroj
MMLU-Pro
Robustnejší benchmark MMLU s náročnejšími otázkami zameranými na uvažovanie, väčším výberom a zníženou citlivosťou na prompty
-
MMMU
Massive Multitask Multimodal Understanding – Testuje porozumenie textu, obrázkom, audiu a videu
76.5%
Zdroj
HellaSwag
Náročný benchmark na dokončovanie viet
-
HumanEval
Hodnotí schopnosti generovania kódu a riešenia problémov
-
MATH
Testuje schopnosti riešenia matematických problémov na rôznych úrovniach náročnosti
-
GPQA
Testuje vedomosti na úrovni PhD v chémii, biológii a fyzike prostredníctvom otázok s výberom odpovedí, ktoré vyžadujú hlboké odborné znalosti
79.6%
Diamond
Zdroj
IFEval
Testuje schopnosť modelu presne dodržiavať explicitné pokyny na formátovanie, generovať vhodné výstupy a udržiavať konzistentné dodržiavanie pokynov pri rôznych úlohách
-
SimpleQA
Hodnotenie presnosti jednoduchých otázok
-
AIME 2024
-
AIME 2025
75.5%
Zdroj
Aider Polyglot
Viacjazyčný programovací benchmark.
-
LiveCodeBench v5
Benchmark pre programovanie v reálnom čase
-
Global MMLU (Lite)
Zjednodušená verzia benchmarku na hodnotenie univerzálnosti modelov na globálnej úrovni.
-
MathVista
Hodnotí schopnosti matematického uvažovania modelov AI vo vizuálnych kontextoch
-
Mobilná aplikácia

Komentáre (1)

  1. Tawfiq

    18 Júl 2025

    اريد claude opus

Pridať komentár

Porovnaj LLM


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.