GPT‑5.1

Komentáře: 0
GPT‑5.1 #0
GPT‑5.1 #1
GPT‑5.1 #2
3593
359

Pozice v celkovém hodnocení k datu
Červen 2026
4
Hodnocení uživatelů
https://compare-ai.foundtt.com
4.3

Přehled modelu

Webová stránka
Webová stránka AI modelu
Poskytovatel
Subjekt, který poskytuje tento model.
Chat
Zadejte zprávu a začněte chatovat
Datum vydání
Kdy byl model poprvé vydán.
6 měsíců ago
Lis 13, 2025
Modality
Typy dat, která tento model dokáže zpracovat
text ?
obrázky ?
Poskytovatelé API
Poskytovatelé, kteří tento model nabízejí. (Toto není vyčerpávající seznam.)
OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE)
Datum uzávěrky znalostí
Kdy byly poslední aktualizace znalostí modelu.
06.2025
Open Source
Zda je kód modelu k dispozici pro veřejné použití.
Ne
Cena za vstup
Cena za zpracování tokenů ve vašich výzvách
$1.25 na milion tokenů
Cena za výstup
Cena za tokeny generované modelem
$10.00 na milion tokenů
MMLU
Massive Multitask Language Understanding - Testuje znalosti v 57 oblastech, včetně matematiky, historie, práva a dalších
-
MMLU-Pro
Robustnější MMLU benchmark s těžšími, na uvažování zaměřenými otázkami, větším výběrem a nižší citlivostí na výzvy
78.4%
Zdroj
MMMU
Massive Multitask Multimodal Understanding - Testuje porozumění napříč textem, obrázky, zvukem a videem
85.4%
Zdroj
HellaSwag
Náročný benchmark pro dokončení vět
-
HumanEval
Hodnotí schopnosti generování kódu a řešení problémů
-
MATH
Testuje schopnosti řešení matematických problémů napříč různými úrovněmi obtížnosti
-
GPQA
Testuje znalosti na úrovni PhD z chemie, biologie a fyziky prostřednictvím otázek s výběrem, které vyžadují hlubokou odbornou znalost
88.1%
Diamond
Zdroj
IFEval
Testuje schopnost modelu přesně dodržovat explicitní formátovací pokyny, generovat vhodné výstupy a udržovat konzistenci dodržování pokynů napříč různými úkoly
-
SimpleQA
Hodnocení přesnosti jednoduchých otázek
-
AIME 2024
-
AIME 2025
94%
Zdroj
Aider Polyglot
Vícejazyčný programovací benchmark.
-
LiveCodeBench v5
Benchmark pro programování v reálném čase
-
Global MMLU (Lite)
Zjednodušená verze benchmarku pro hodnocení univerzálnosti modelů na globální úrovni.
-
MathVista
Hodnotí schopnosti matematického uvažování modelů umělé inteligence ve vizuálních kontextech
-
Mobilní aplikace

Přidat komentář

Porovnat LLM


10%
Naše stránky používají soubory cookie.

Zásady ochrany osobních údajů a souborů cookie: Tento web používá soubory cookie. Dalším používáním webu souhlasíte s jejich používáním.