



Webová stránka Webová stránka AI modelu | |
Poskytovatel Subjekt, který poskytuje tento model. | |
Chat Zadejte zprávu a začněte chatovat | |
Datum vydání Kdy byl model poprvé vydán. | 6 měsíců ago Lis 13, 2025 |
Modality Typy dat, která tento model dokáže zpracovat | text obrázky |
Poskytovatelé API Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.) | OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE) |
Datum uzávěrky znalostí Kdy byly poslední aktualizace znalostí modelu. | 06.2025 |
Open Source Zda je kód modelu k dispozici pro veřejné použití. | Ne |
Cena za vstup Cena za zpracování tokenů ve vašich výzvách | $1.25 na milion tokenů |
Cena za výstup Cena za tokeny generované modelem | $10.00 na milion tokenů |
MMLU Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších | - |
MMLU-Pro Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy | 78.4% Zdroj |
MMMU Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem | 85.4% Zdroj |
HellaSwag Náročný benchmark pro dokončení vět | - |
HumanEval Hodnotí schopnosti generování kódu a řešení problémů | - |
MATH Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti | - |
GPQA Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost | 88.1% Diamond Zdroj |
IFEval Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly | - |
SimpleQA Hodnocení přesnosti jednoduchých otázek | - |
AIME 2024 | - |
AIME 2025 | 94% Zdroj |
Aider Polyglot Vícejazyčný programovací benchmark. | - |
LiveCodeBench v5 Benchmark pro programování v reálném čase | - |
Global MMLU (Lite) Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni. | - |
MathVista Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech | - |
Mobilní aplikace |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2026 All Right Reserved.