GPT‑5.1 Technické specifikace a přehled

GPT‑5.1

Komentáře: 0

3593

359

Pozice v celkovém hodnocení k datu
Červenec 2026

Hodnocení uživatelů
https://compare-ai.foundtt.com

4.3

Přehled modelu

Webová stránka Webová stránka AI modelu	Open
Poskytovatel Subjekt, který poskytuje tento model.	OpenAI
Chat Zadejte zprávu a začněte chatovat	Open
Datum vydání Kdy byl model poprvé vydán.	8 měsíců ago Lis 13, 2025
Modality Typy dat, která tento model dokáže zpracovat	text ? obrázky ?
Poskytovatelé API Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.)	OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE)
Datum uzávěrky znalostí Kdy byly poslední aktualizace znalostí modelu.	06.2025
Open Source Zda je kód modelu k dispozici pro veřejné použití.	Ne
Cena za vstup Cena za zpracování tokenů ve vašich výzvách	$1.25 na milion tokenů
Cena za výstup Cena za tokeny generované modelem	$10.00 na milion tokenů
MMLU Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších	-
MMLU-Pro Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy	78.4% Zdroj
MMMU Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem	85.4% Zdroj
HellaSwag Náročný benchmark pro dokončení vět	-
HumanEval Hodnotí schopnosti generování kódu a řešení problémů	-
MATH Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti	-
GPQA Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost	88.1% Diamond Zdroj
IFEval Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly	-
SimpleQA Hodnocení přesnosti jednoduchých otázek	-
AIME 2024	-
AIME 2025	94% Zdroj
Aider Polyglot Vícejazyčný programovací benchmark.	-
LiveCodeBench v5 Benchmark pro programování v reálném čase	-
Global MMLU (Lite) Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni.	-
MathVista Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech	-
Mobilní aplikace	Google Play Apple Apps

GPT‑5.1 Specifikace, recenze a porovnání

GPT‑5.1

Přehled modelu

Přidat komentář

Porovnat LLM