Per pastaruosius penkis mėnesius nuo Qwen2-VL išleidimo kūrėjai sukūrė naujus modelius, paremtus juo, suteikdami vertingų atsiliepimų. Dabar Qwen2.5-VL pristato patobulintas galimybes, įskaitant tikslų vaizdų, teksto ir diagramų analizę bei objektų lokalizavimą su struktūruotomis JSON išvestimis. Jis supranta ilgus vaizdo įrašus, nustato pagrindinius įvykius ir veikia kaip agentas, bendraujantis su įrankiais kompiuteriuose ir telefonuose. Modelio architektūra apima dinaminį vaizdo įrašų apdorojimą ir optimizuotą ViT kodavimo įrenginį, skirtą greičiui ir tikslumui padidinti.
„Amazon Nova Lite“ yra universalus multimodalinis modelis, sukurtas apdoroti teksto, vaizdo ir vaizdo įrašų įvestis, generuojant tekstinius išvesties duomenis. Turėdamas 300 000 žetonų kontekstinį langą, jis puikiai tinka realaus laiko sąveikoms, dokumentų analizei ir vizualiam klausimų atsakymui. Kaip „Amazon Nova“ pagrindinių modelių dalis, jis palaiko detalią adaptaciją ir distiliaciją, leidžiančią pažangų pritaikymą.
Qwen2.5-VL-32B | Nova Lite | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | - | |
Išleidimo data | Mar 25, 2025 4 savaitės ago | Dec 02, 2024 4 mėnesiai ago |
Modalumai | tekstas vaizdai vaizdo | tekstas vaizdai vaizdo |
API tiekėjai | - | Amazon Bedrock |
Žinių nutraukimo data | Nežinoma | Paskirtai neatskleista |
Atvirojo kodo | Taip (Šaltinis) | Ne |
Įvesties kaina | $0 | $0.06 už milijoną žodžių |
Išvesties kaina | $0 | $0.24 už milijoną žodžių |
MMLU | 78.4% Šaltinis | 80.5% CoT Šaltinis |
MMLU Pro | 49.5% | Nėra prieinama |
MMMU | 70% | Nėra prieinama |
HellaSwag | Nėra prieinama | Nėra prieinama |
HumanEval | Nėra prieinama | 85.4% pass@1 Šaltinis |
MATH | 82.2% | 73.3% CoT Šaltinis |
GPQA | 46.0% Diamond | 42% Main Šaltinis |
IFEval | Nėra prieinama | 89.7% Šaltinis |
Mobilioji programa | - | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.