Az OpenAI o3-mini egy gyors és költséghatékony érvelési modell, amelyet STEM alkalmazásokhoz terveztek, és kiváló teljesítményt nyújt a tudomány, a matematika és a programozás területén. 2025 januárjában került piacra, és olyan alapvető fejlesztői funkciókat tartalmaz, mint a függvényhívások, a strukturált kimenetek és a fejlesztői üzenetek. A modell három érvelési szintet kínál—alacsony, közepes és magas—amelyek lehetővé teszik a felhasználók számára az egyensúly optimalizálását a mélyebb elemzés és a gyorsabb válaszidő között. Az o3 modellel ellentétben nem rendelkezik vizuális képességekkel. Kezdetben a 3-5 API-használati szintű fejlesztők számára érhető el, és a Chat Completions API, az Assistants API és a Batch API segítségével használható.
A GPT-4.1-et az OpenAI 2025. április 14-én dobta piacra, amely 1 millió tokenes kontextusablakot vezet be, és kérésselként legfeljebb 32 768 token kimenetet támogat. Kiváló teljesítményt nyújt kódolási feladatokban, 54,6%-ot ér el a SWE-Bench Verified benchmarkon, és 10,5%-os javulást mutat a GPT-4o-hoz képest a MultiChallenge-en az utasítások követésében. A modell tudásának határidője 2024. júniusra van állítva. A díjszabás 2,00 $ milliónyi token bemenetre és 8,00 $ milliónyi token kimenetre vonatkozik, a gyorsítótárazott bemenetekre 75%-os kedvezményt alkalmazva, ami nagyon költséghatékonyvá teszi az ismétlődő lekérdezések esetén.
o3-mini | GPT-4.1 | |
---|---|---|
Szolgáltató | ||
Weboldal | ||
Kiadási Dátum | Jan 31, 2025 2 hónapok ago | Apr 14, 2025 2 hetek ago |
Modalitások | szöveg | szöveg képek |
API Szolgáltatók | OpenAI API | OpenAI API |
Tudás Befejezési Dátuma | Ismeretlen | - |
Nyílt Forráskódú | Nem | Nem |
Bemeneti Árazás | $1.10 millió tokenenként | $2.00 millió tokenenként |
Kimeneti Árazás | $4.40 millió tokenenként | $8.00 millió tokenenként |
MMLU | 86.9% pass@1, high effort Forrás | 90.2% pass@1 Forrás |
MMLU Pro | Nem elérhető | - |
MMMU | Nem elérhető | 74.8% Forrás |
HellaSwag | Nem elérhető | - |
HumanEval | Nem elérhető | - |
MATH | 97.9% pass@1, high effort Forrás | - |
GPQA | 79.7% 0-shot, high effort Forrás | 66.3% Diamond Forrás |
IFEval | Nem elérhető | - |
Mobilalkalmazás |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2025 All Right Reserved.