Az Qwen2-VL megjelenése után öt hónappal a fejlesztők új modelleket építettek rá, értékes visszajelzést nyújtva. Most az Qwen2.5-VL továbbfejlesztett képességeket mutat be, beleértve a képek, szövegek és diagramok pontos elemzését, valamint objektumok lokalizálását strukturált JSON kimenetekkel. Megérti a hosszú videókat, kulcseseményeket azonosít, és ügynökként működik, eszközökkel kommunikálva számítógépeken és telefonokon. A modell architektúrája dinamikus videofeldolgozást és optimalizált ViT kódolót tartalmaz a gyorsaság és pontosság javításáért.
Az OpenAI o3 az OpenAI legfejlettebb gondolkodási modellje, amelyet kifejezetten összetett, magas kognitív igényű feladatok kezelésére terveztek. 2025 áprilisában jelent meg, kiváló teljesítményt nyújtva a szoftverfejlesztésben, matematikában és tudományos problémamegoldásban. A modell három szintű gondolkodási erőfeszítést vezet be – alacsony, közepes és magas –, lehetővé téve a felhasználók számára, hogy a feladat összetettsége alapján mérlegeljenek a késleltetés és a gondolkodás mélysége között. Az o3 támogatja a fejlesztők számára nélkülözhetetlen eszközöket, beleértve a függvényhívásokat, strukturált kimeneteket és rendszerszintű üzeneteket. Beépített látási képességekkel az o3 képes képeket értelmezni és elemezni, ami multimodális alkalmazásokhoz teszi alkalmassá. Elérhető a Chat Completions API, az Assistants API és a Batch API segítségével, rugalmas integrációt biztosítva vállalati és kutatási munkafolyamatokba.
Qwen2.5-VL-32B | o3 | |
---|---|---|
Szolgáltató | ||
Weboldal | ||
Kiadási Dátum | Mar 25, 2025 1 hónap ago | Apr 16, 2025 1 hét ago |
Modalitások | szöveg képek videó | szöveg képek |
API Szolgáltatók | - | OpenAI API |
Tudás Befejezési Dátuma | Ismeretlen | - |
Nyílt Forráskódú | Igen (Forrás) | Nem |
Bemeneti Árazás | $0 | $10.00 millió tokenenként |
Kimeneti Árazás | $0 | $40.00 millió tokenenként |
MMLU | 78.4% Forrás | 82.9% Forrás |
MMLU Pro | 49.5% | - |
MMMU | 70% | - |
HellaSwag | Nem elérhető | - |
HumanEval | Nem elérhető | - |
MATH | 82.2% | - |
GPQA | 46.0% Diamond | 83.3% Diamond, no tools Forrás |
IFEval | Nem elérhető | - |
Mobilalkalmazás | - |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2025 All Right Reserved.