अमेज़न नोवा प्रो एक अत्याधुनिक मल्टीमोडल मॉडल है जो टेक्स्ट, इमेज और वीडियो इनपुट्स को उन्नत प्रोसेसिंग क्षमताओं के साथ संभालने के लिए डिज़ाइन किया गया है। 300के-टोकन कंटेक्स्ट विंडो की विशेषता के साथ, यह डॉक्यूमेंट एनालिसिस, विजुअल क्वेश्चन आंसरिंग और जटिल एजेंट-संचालित वर्कफ्लो में उत्कृष्ट प्रदर्शन करता है। अमेज़न नोवा फाउंडेशन मॉडल्स के हिस्से के रूप में, यह फाइन-ट्यूनिंग और डिस्टिलेशन को सपोर्ट करता है, जिससे विभिन्न अनुप्रयोगों के लिए गहन कस्टमाइजेशन संभव होता है।
Qwen2-VL के रिलीज के बाद पिछले पांच महीनों में, डेवलपर्स ने इस पर आधारित नए मॉडल बनाए हैं, जिन्होंने मूल्यवान फीडबैक दिया है। अब, Qwen2.5-VL में छवियों, पाठ और चार्ट का सटीक विश्लेषण, साथ ही संरचित JSON आउटपुट के साथ वस्तु स्थानीकरण जैसी उन्नत क्षमताएं शामिल हैं। यह लंबे वीडियो को समझता है, प्रमुख घटनाओं की पहचान करता है और एक एजेंट के रूप में कार्य करते हुए कंप्यूटर और फोन पर टूल्स के साथ इंटरैक्ट करता है। मॉडल की आर्किटेक्चर में गति और सटीकता में सुधार के लिए डायनामिक वीडियो प्रोसेसिंग और एक ऑप्टिमाइज्ड ViT एनकोडर शामिल है।
Nova Pro | Qwen2.5-VL-32B | |
---|---|---|
वेबसाइट
| ||
प्रदाता
| ||
चैट
| ||
रिलीज तिथि
| ||
मोडलिटीज
| टेक्स्ट छवियां वीडियो | टेक्स्ट छवियां वीडियो |
एपीआई प्रदाता
| Amazon Bedrock | - |
ज्ञान समाप्ति तिथि
| जानबूझकर प्रकट नहीं किया गया | अज्ञात |
ओपन सोर्स
| नहीं | हां (स्रोत) |
मूल्य निर्धारण इनपुट
| $0.80 प्रति मिलियन टोकन | $0 |
मूल्य निर्धारण आउटपुट
| $3.20 प्रति मिलियन टोकन | $0 |
एमएमएलयू
| 85.9% CoT स्रोत | 78.4% स्रोत |
एमएमएलयू-प्रो
| उपलब्ध नहीं | 49.5% |
एमएमएमयू
| उपलब्ध नहीं | 70% |
हेलास्वैग
| उपलब्ध नहीं | उपलब्ध नहीं |
ह्यूमनएवैल
| 89% pass@1 स्रोत | उपलब्ध नहीं |
मैथ
| 76.6% CoT स्रोत | 82.2% |
जीपीक्यूए
| 46.9% Main स्रोत | 46.0% Diamond |
आईएफइवैल
| 92.1% स्रोत | उपलब्ध नहीं |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
वैश्विक MMLU (लाइट)
| - | - |
MathVista
| - | - |
मोबाइल एप्लिकेशन | - | - |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2025 All Right Reserved.