Az Qwen2-VL megjelenése után öt hónappal a fejlesztők új modelleket építettek rá, értékes visszajelzést nyújtva. Most az Qwen2.5-VL továbbfejlesztett képességeket mutat be, beleértve a képek, szövegek és diagramok pontos elemzését, valamint objektumok lokalizálását strukturált JSON kimenetekkel. Megérti a hosszú videókat, kulcseseményeket azonosít, és ügynökként működik, eszközökkel kommunikálva számítógépeken és telefonokon. A modell architektúrája dinamikus videofeldolgozást és optimalizált ViT kódolót tartalmaz a gyorsaság és pontosság javításáért.
A GPT-4.1-et az OpenAI 2025. április 14-én dobta piacra, amely 1 millió tokenes kontextusablakot vezet be, és kérésselként legfeljebb 32 768 token kimenetet támogat. Kiváló teljesítményt nyújt kódolási feladatokban, 54,6%-ot ér el a SWE-Bench Verified benchmarkon, és 10,5%-os javulást mutat a GPT-4o-hoz képest a MultiChallenge-en az utasítások követésében. A modell tudásának határidője 2024. júniusra van állítva. A díjszabás 2,00 $ milliónyi token bemenetre és 8,00 $ milliónyi token kimenetre vonatkozik, a gyorsítótárazott bemenetekre 75%-os kedvezményt alkalmazva, ami nagyon költséghatékonyvá teszi az ismétlődő lekérdezések esetén.
Qwen2.5-VL-32B | GPT-4.1 | |
---|---|---|
Szolgáltató | ||
Weboldal | ||
Kiadási Dátum | Mar 25, 2025 1 hónap ago | Apr 14, 2025 2 hetek ago |
Modalitások | szöveg képek videó | szöveg képek |
API Szolgáltatók | - | OpenAI API |
Tudás Befejezési Dátuma | Ismeretlen | - |
Nyílt Forráskódú | Igen (Forrás) | Nem |
Bemeneti Árazás | $0 | $2.00 millió tokenenként |
Kimeneti Árazás | $0 | $8.00 millió tokenenként |
MMLU | 78.4% Forrás | 90.2% pass@1 Forrás |
MMLU Pro | 49.5% | - |
MMMU | 70% | 74.8% Forrás |
HellaSwag | Nem elérhető | - |
HumanEval | Nem elérhető | - |
MATH | 82.2% | - |
GPQA | 46.0% Diamond | 66.3% Diamond Forrás |
IFEval | Nem elérhető | - |
Mobilalkalmazás | - |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2025 All Right Reserved.