Qwen2-VL के रिलीज के बाद पिछले पांच महीनों में, डेवलपर्स ने इस पर आधारित नए मॉडल बनाए हैं, जिन्होंने मूल्यवान फीडबैक दिया है। अब, Qwen2.5-VL में छवियों, पाठ और चार्ट का सटीक विश्लेषण, साथ ही संरचित JSON आउटपुट के साथ वस्तु स्थानीकरण जैसी उन्नत क्षमताएं शामिल हैं। यह लंबे वीडियो को समझता है, प्रमुख घटनाओं की पहचान करता है और एक एजेंट के रूप में कार्य करते हुए कंप्यूटर और फोन पर टूल्स के साथ इंटरैक्ट करता है। मॉडल की आर्किटेक्चर में गति और सटीकता में सुधार के लिए डायनामिक वीडियो प्रोसेसिंग और एक ऑप्टिमाइज्ड ViT एनकोडर शामिल है।
मिस्ट्राल लार्ज 2, मिस्ट्राल द्वारा विकसित, 128के-टोकन कंटेक्स्ट विंडो प्रदान करता है और इसकी कीमत $3.00 प्रति मिलियन इनपुट टोकन और $9.00 प्रति मिलियन आउटपुट टोकन पर निर्धारित है। 24 जुलाई, 2024 को जारी किया गया, यह मॉडल 5-शॉट मूल्यांकन में एमएमएलयू बेंचमार्क पर 84.0 स्कोर करता है, जो विविध कार्यों में मजबूत प्रदर्शन प्रदर्शित करता है।
Qwen2.5-VL-32B | Mistral Large 2 | |
---|---|---|
वेबसाइट
| ||
प्रदाता
| ||
चैट
| ||
रिलीज तिथि
| ||
मोडलिटीज
| टेक्स्ट छवियां वीडियो | टेक्स्ट |
एपीआई प्रदाता
| - | Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex |
ज्ञान समाप्ति तिथि
| अज्ञात | अज्ञात |
ओपन सोर्स
| हां (स्रोत) | हां |
मूल्य निर्धारण इनपुट
| $0 | $3.00 प्रति मिलियन टोकन |
मूल्य निर्धारण आउटपुट
| $0 | $9.00 प्रति मिलियन टोकन |
एमएमएलयू
| 78.4% स्रोत | 84% 5-shot स्रोत |
एमएमएलयू-प्रो
| 49.5% | 50.69% स्रोत |
एमएमएमयू
| 70% | उपलब्ध नहीं |
हेलास्वैग
| उपलब्ध नहीं | उपलब्ध नहीं |
ह्यूमनएवैल
| उपलब्ध नहीं | उपलब्ध नहीं |
मैथ
| 82.2% | 1.13% स्रोत |
जीपीक्यूए
| 46.0% Diamond | 24.94% |
आईएफइवैल
| उपलब्ध नहीं | 84.01% |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
वैश्विक MMLU (लाइट)
| - | - |
MathVista
| - | - |
मोबाइल एप्लिकेशन | - | - |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2025 All Right Reserved.