


Webová stránka Webová stránka AI modelu | |
Poskytovatel Subjekt, který poskytuje tento model. | |
Chat Zadejte zprávu a začněte chatovat | |
Datum vydání Kdy byl model poprvé vydán. | 1 rok ago Kvě 22, 2025 |
Modality Typy dat, která tento model dokáže zpracovat | text obrázky |
Poskytovatelé API Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.) | Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI |
Datum uzávěrky znalostí Kdy byly poslední aktualizace znalostí modelu. | Neznámý |
Open Source Zda je kód modelu k dispozici pro veřejné použití. | Ne |
Cena za vstup Cena za zpracování tokenů ve vašich výzvách | $3 na milion tokenů |
Cena za výstup Cena za tokeny generované modelem | $15 na milion tokenů |
MMLU Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších | 86.5% Zdroj |
MMLU-Pro Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy | - |
MMMU Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem | 74.4% Zdroj |
HellaSwag Náročný benchmark pro dokončení vět | - |
HumanEval Hodnotí schopnosti generování kódu a řešení problémů | - |
MATH Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti | - |
GPQA Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost | 75.4% Diamond Zdroj |
IFEval Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly | - |
SimpleQA Hodnocení přesnosti jednoduchých otázek | - |
AIME 2024 | - |
AIME 2025 | 75.5% Zdroj |
Aider Polyglot Vícejazyčný programovací benchmark. | - |
LiveCodeBench v5 Benchmark pro programování v reálném čase | - |
Global MMLU (Lite) Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni. | - |
MathVista Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech | - |
Mobilní aplikace |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2026 All Right Reserved.