o3

OpenAI o3 je najpokročilejší model na uvažovanie od OpenAI, špeciálne vytvorený pre zvládanie zložitých úloh s vysokými kognitívnymi nárokmi. Spustený v apríli 2025 poskytuje výnimočný výkon v softvérovom inžinierstve, matematike a vedeckom riešení problémov. Model zavádza tri úrovne úsilia uvažovania – nízke, stredné a vysoké – čo umožňuje používateľom vyvážiť latenciu a hĺbku uvažovania podľa zložitosti úlohy. o3 podporuje základné nástroje pre vývojárov, vrátane volania funkcií, štruktúrovaných výstupov a systémových správ. S vstavanými vizuálnymi schopnosťami dokáže o3 interpretovať a analyzovať obrázky, čo ho robí vhodným pre multimodálne aplikácie. Je dostupný cez Chat Completions API, Assistants API a Batch API pre flexibilnú integráciu do podnikových a výskumných pracovných postupov.

o4-mini

OpenAI o4-mini je najnovší ľahký model v rade o-series, navrhnutý pre efektívne a schopné uvažovanie naprieč textovými a vizuálnymi úlohami. Optimalizovaný pre rýchlosť a výkon vyniká v generovaní kódu a porozumení založenom na obrázkoch, pri zachovaní rovnováhy medzi latenciou a hĺbkou uvažovania. Model podporuje kontextové okno s veľkosťou 200 000 tokenov s až 100 000 výstupnými tokenmi, čo ho robí vhodným pre rozsiahle interakcie. Spracováva textové aj obrazové vstupy a produkuje textové výstupy s pokročilými schopnosťami uvažovania. Vďaka kompaktnej architektúre a všestrannému výkonu je o4-mini ideálny pre širokú škálu reálnych aplikácií vyžadujúcich rýchlu a nákladovo efektívnu inteligenciu.

o3o4-mini
Webová stránka ?
Poskytovateľ ?
Chat ?
Dátum vydania ?
Modality ?
text ?
obrázky ?
text ?
obrázky ?
Poskytovatelia API ?
OpenAI API
OpenAI API
Dátum zastarania vedomostí ?
-
-
Open Source ?
Nie
Nie
Cena za vstup ?
$10.00 za milión tokenov
$1.10 za milión tokenov
Cena za výstup ?
$40.00 za milión tokenov
$4.40 za milión tokenov
MMLU ?
82.9%
Zdroj
fort
MMLU-Pro ?
-
-
MMMU ?
-
81.6%
Zdroj
HellaSwag ?
-
-
HumanEval ?
-
14.28%
Zdroj
MATH ?
-
-
GPQA ?
83.3%
Diamond, no tools
Zdroj
81.4%
Zdroj
IFEval ?
-
-
SimpleQA ?
-
-
AIME 2024
91.6%
Zdroj
93.4%
Zdroj
AIME 2025
88.9%
Zdroj
92.7%
Zdroj
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilná aplikácia

MathArena ?

Priemerné skóre
86%
87%
AIME 2025
Test založený na úlohách zo súťaže v matematike (American Invitational Mathematics Examination),určený na overenie matematických schopností modelov.
89%
92%
HMMT February 2025
Test založený na úlohách z Harvard-MIT Mathematics Tournament, február 2025, určený na overenie matematických schopností modelov.
78%
83%
BRUMO 2025
96%
87%
SMT 2025
Test založený na úlohách zo Stanford Math Tournament, 2025, určený na overenie matematických schopností modelov.
88%
89%
CMIMC 2025
Test založený na úlohách z Canadian Mathematical Olympiad, 2025, určený na overenie matematických schopností modelov.
78%
84%

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.