Per pastaruosius penkis mėnesius nuo Qwen2-VL išleidimo kūrėjai sukūrė naujus modelius, paremtus juo, suteikdami vertingų atsiliepimų. Dabar Qwen2.5-VL pristato patobulintas galimybes, įskaitant tikslų vaizdų, teksto ir diagramų analizę bei objektų lokalizavimą su struktūruotomis JSON išvestimis. Jis supranta ilgus vaizdo įrašus, nustato pagrindinius įvykius ir veikia kaip agentas, bendraujantis su įrankiais kompiuteriuose ir telefonuose. Modelio architektūra apima dinaminį vaizdo įrašų apdorojimą ir optimizuotą ViT kodavimo įrenginį, skirtą greičiui ir tikslumui padidinti.
Amazon Nova Pro yra modernus daugialypis modelis, skirtas apdoroti tekstą, vaizdus ir vaizdo įrašus su pažangiomis apdorojimo galimybėmis. Turėdamas 300 000 ženklų konteksto langą, jis puikiai tinka dokumentų analizei, vaizdinių klausimų atsakymams ir sudėtingiems agentų valdomiems darbo procesams. Kaip „Amazon Nova“ pagrindinių modelių dalis, jis palaiko tikslų derinimą ir distiliavimą, leidžiantį giliai pritaikyti įvairioms programoms.
Qwen2.5-VL-32B | Nova Pro | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | ||
Išleidimo data | Mar 25, 2025 4 savaitės ago | Dec 02, 2024 4 mėnesiai ago |
Modalumai | tekstas vaizdai vaizdo | tekstas vaizdai vaizdo |
API tiekėjai | - | Amazon Bedrock |
Žinių nutraukimo data | Nežinoma | Paskirtai neatskleista |
Atvirojo kodo | Taip (Šaltinis) | Ne |
Įvesties kaina | $0 | $0.80 už milijoną žodžių |
Išvesties kaina | $0 | $3.20 už milijoną žodžių |
MMLU | 78.4% Šaltinis | 85.9% CoT Šaltinis |
MMLU Pro | 49.5% | Nėra prieinama |
MMMU | 70% | Nėra prieinama |
HellaSwag | Nėra prieinama | Nėra prieinama |
HumanEval | Nėra prieinama | 89% pass@1 Šaltinis |
MATH | 82.2% | 76.6% CoT Šaltinis |
GPQA | 46.0% Diamond | 46.9% Main Šaltinis |
IFEval | Nėra prieinama | 92.1% Šaltinis |
Mobilioji programa | - | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.