Během pěti měsíců od vydání Qwen2-VL vývojáři vytvořili nové modely na jeho základě a poskytli cennou zpětnou vazbu. Nyní Qwen2.5-VL přináší vylepšené schopnosti včetně přesné analýzy obrázků, textů a grafů, stejně jako lokalizaci objektů se strukturovanými JSON výstupy. Rozumí dlouhým videím, identifikuje klíčové události a funguje jako agent interagující s nástroji na počítačích a telefonech. Architektura modelu zahrnuje dynamické zpracování videa a optimalizovaný ViT enkodér pro vyšší rychlost a přesnost.
Amazon Nova Pro je špičkový multimodální model navržený pro zpracování textových, obrazových a video vstupů s pokročilými schopnostmi zpracování. S kontextovým oknem o velikosti 300 000 tokenů vyniká v analýze dokumentů, vizuálním zodpovídání otázek a složitých pracovních postupech řízených agenty. Jako součást základních modelů Amazon Nova podporuje doladění a destilaci, což umožňuje hlubokou přizpůsobivost pro různé aplikace.
Qwen2.5-VL-32B | Nova Pro | |
---|---|---|
Poskytovatel | ||
Webová stránka | ||
Datum vydání | Mar 25, 2025 4 týdny ago | Dec 02, 2024 4 měsíce ago |
Modality | text obrázky video | text obrázky video |
Poskytovatelé API | - | Amazon Bedrock |
Datum uzávěrky znalostí | Neznámý | Úmyslně nezveřejněno |
Open Source | Ano (Zdroj) | Ne |
Cena za vstup | $0 | $0.80 na milion tokenů |
Cena za výstup | $0 | $3.20 na milion tokenů |
MMLU | 78.4% Zdroj | 85.9% CoT Zdroj |
MMLU Pro | 49.5% | Není k dispozici |
MMMU | 70% | Není k dispozici |
HellaSwag | Není k dispozici | Není k dispozici |
HumanEval | Není k dispozici | 89% pass@1 Zdroj |
MATH | 82.2% | 76.6% CoT Zdroj |
GPQA | 46.0% Diamond | 46.9% Main Zdroj |
IFEval | Není k dispozici | 92.1% Zdroj |
Mobilní aplikace | - | - |
Compare AI. Test. Benchmarks. Mobilní chatboty, Sketch
Copyright © 2025 All Right Reserved.