




Webová stránka Webová stránka AI modelu | |
Poskytovatel Subjekt, který poskytuje tento model. | |
Chat Zadejte zprávu a začněte chatovat | |
Datum vydání Kdy byl model poprvé vydán. | 1 rok ago Dub 14, 2025 |
Modality Typy dat, která tento model dokáže zpracovat | text obrázky |
Poskytovatelé API Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.) | OpenAI API |
Datum uzávěrky znalostí Kdy byly poslední aktualizace znalostí modelu. | - |
Open Source Zda je kód modelu k dispozici pro veřejné použití. | Ne |
Cena za vstup Cena za zpracování tokenů ve vašich výzvách | $0.10 na milion tokenů |
Cena za výstup Cena za tokeny generované modelem | $0.40 na milion tokenů |
MMLU Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších | 80.1% Zdroj |
MMLU-Pro Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy | - |
MMMU Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem | 55.4% Zdroj |
HellaSwag Náročný benchmark pro dokončení vět | - |
HumanEval Hodnotí schopnosti generování kódu a řešení problémů | - |
MATH Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti | - |
GPQA Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost | 50.3% Diamond Zdroj |
IFEval Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly | 74.5% Zdroj |
SimpleQA Hodnocení přesnosti jednoduchých otázek | - |
AIME 2024 | 29.4% Zdroj |
AIME 2025 | - |
Aider Polyglot Vícejazyčný programovací benchmark. | - |
LiveCodeBench v5 Benchmark pro programování v reálném čase | - |
Global MMLU (Lite) Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni. | 66.9% Zdroj |
MathVista Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech | 56.2% Image Reasoning Zdroj |
Mobilní aplikace |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2026 All Right Reserved.