



Qwen2-VL के रिलीज के बाद पिछले पांच महीनों में, डेवलपर्स ने इस पर आधारित नए मॉडल बनाए हैं, जिन्होंने मूल्यवान फीडबैक दिया है। अब, Qwen2.5-VL में छवियों, पाठ और चार्ट का सटीक विश्लेषण, साथ ही संरचित JSON आउटपुट के साथ वस्तु स्थानीकरण जैसी उन्नत क्षमताएं शामिल हैं। यह लंबे वीडियो को समझता है, प्रमुख घटनाओं की पहचान करता है और एक एजेंट के रूप में कार्य करते हुए कंप्यूटर और फोन पर टूल्स के साथ इंटरैक्ट करता है। मॉडल की आर्किटेक्चर में गति और सटीकता में सुधार के लिए डायनामिक वीडियो प्रोसेसिंग और एक ऑप्टिमाइज्ड ViT एनकोडर शामिल है।
वेबसाइट एआई मॉडल वेब पेज | |
प्रदाता इस मॉडल को प्रदान करने वाली इकाई। | |
चैट चैट शुरू करने के लिए एक संदेश दर्ज करें | - |
रिलीज तिथि मॉडल पहली बार कब रिलीज हुआ था। | 1 वर्ष ago मार्च 25, 2025 |
मोडलिटीज इस मॉडल द्वारा संसाधित किए जा सकने वाले डेटा के प्रकार | टेक्स्ट छवियां वीडियो |
एपीआई प्रदाता वे प्रदाता जो इस मॉडल को प्रदान करते हैं। (यह एक पूर्ण सूची नहीं है।) | - |
ज्ञान समाप्ति तिथि मॉडल का ज्ञान अंतिम बार कब अपडेट किया गया था। | अज्ञात |
ओपन सोर्स क्या मॉडल का कोड सार्वजनिक उपयोग के लिए उपलब्ध है। | हां (स्रोत) |
मूल्य निर्धारण इनपुट आपके प्रॉम्प्ट में टोकन प्रोसेसिंग की लागत | $0 |
मूल्य निर्धारण आउटपुट मॉडल द्वारा उत्पन्न टोकन की लागत | $0 |
एमएमएलयू मैसिव मल्टीटास्क भाषा समझ - गणित, इतिहास, कानून और अन्य सहित 57 विषयों में ज्ञान का परीक्षण | 78.4% स्रोत |
एमएमएलयू-प्रो अधिक मजबूत एमएमएलयू बेंचमार्क जिसमें कठिन, तर्क-केंद्रित प्रश्न, बड़ा विकल्प सेट, और कम प्रॉम्प्ट संवेदनशीलता शामिल है | 49.5% |
एमएमएमयू मैसिव मल्टीटास्क मल्टीमॉडल समझ - टेक्स्ट, छवियों, ऑडियो और वीडियो में समझ का परीक्षण | 70% |
हेलास्वैग एक चुनौतीपूर्ण वाक्य पूर्णता बेंचमार्क | उपलब्ध नहीं |
ह्यूमनएवैल कोड जनरेशन और समस्या-समाधान क्षमताओं का मूल्यांकन करता है | उपलब्ध नहीं |
मैथ विभिन्न कठिनाई स्तरों पर गणितीय समस्या-समाधान क्षमताओं का परीक्षण | 82.2% |
जीपीक्यूए रसायन विज्ञान, जीव विज्ञान और भौतिकी में पीएचडी-स्तर के ज्ञान का बहुविकल्पीय प्रश्नों के माध्यम से परीक्षण जो गहरे डोमेन विशेषज्ञता की आवश्यकता रखते हैं | 46.0% Diamond |
आईएफइवैल मॉडल की स्पष्ट स्वरूपण निर्देशों का सटीक पालन करने, उपयुक्त आउटपुट उत्पन्न करने, और विभिन्न कार्यों में लगातार निर्देश अनुपालन बनाए रखने की क्षमता का परीक्षण | उपलब्ध नहीं |
SimpleQA साधारण प्रश्नों की सटीकता का आकलन | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot बहुभाषी प्रोग्रामिंग बेंचमार्क। | - |
LiveCodeBench v5 रीयल-टाइम प्रोग्रामिंग के लिए बेंचमार्क | - |
वैश्विक MMLU (लाइट) वैश्विक स्तर पर मॉडलों की सार्वभौमिकता का आकलन करने के लिए बेंचमार्क का सरलीकृत संस्करण। | - |
MathVista दृश्य संदर्भों में AI मॉडलों की गणितीय तर्क क्षमताओं का मूल्यांकन | - |
मोबाइल एप्लिकेशन | - |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2026 All Right Reserved.