Qwen2-VL के रिलीज के बाद पिछले पांच महीनों में, डेवलपर्स ने इस पर आधारित नए मॉडल बनाए हैं, जिन्होंने मूल्यवान फीडबैक दिया है। अब, Qwen2.5-VL में छवियों, पाठ और चार्ट का सटीक विश्लेषण, साथ ही संरचित JSON आउटपुट के साथ वस्तु स्थानीकरण जैसी उन्नत क्षमताएं शामिल हैं। यह लंबे वीडियो को समझता है, प्रमुख घटनाओं की पहचान करता है और एक एजेंट के रूप में कार्य करते हुए कंप्यूटर और फोन पर टूल्स के साथ इंटरैक्ट करता है। मॉडल की आर्किटेक्चर में गति और सटीकता में सुधार के लिए डायनामिक वीडियो प्रोसेसिंग और एक ऑप्टिमाइज्ड ViT एनकोडर शामिल है।
जेमिनी 2.0 फ्लैश थिंकिंग एक उन्नत तर्क मॉडल है जिसे प्रदर्शन और व्याख्यात्मकता को बढ़ाने के लिए डिज़ाइन किया गया है जिससे इसकी विचार प्रक्रिया दृश्यमान होती है। यह जटिल समस्या-समाधान, कोडिंग चुनौतियों और गणितीय तर्क में उत्कृष्ट प्रदर्शन करता है, चरण-दर-चरण समाधान प्रदर्शित करता है। विस्तृत स्पष्टीकरण और तार्किक विश्लेषण की मांग वाले कार्यों के लिए अनुकूलित, यह मॉडल कोड एक्सीक्यूशन और गूगल सर्च क्षमताओं सहित नेटिव टूल इंटीग्रेशन भी प्रदान करता है।
Qwen2.5-VL-32B | Gemini 2.0 Flash Thinking | |
---|---|---|
वेबसाइट
| ||
प्रदाता
| ||
चैट
| ||
रिलीज तिथि
| ||
मोडलिटीज
| टेक्स्ट छवियां वीडियो | टेक्स्ट छवियां |
एपीआई प्रदाता
| - | Google AI Studio, Vertex AI, Gemini API |
ज्ञान समाप्ति तिथि
| अज्ञात | 04.2024 |
ओपन सोर्स
| हां (स्रोत) | नहीं |
मूल्य निर्धारण इनपुट
| $0 | उपलब्ध नहीं |
मूल्य निर्धारण आउटपुट
| $0 | उपलब्ध नहीं |
एमएमएलयू
| 78.4% स्रोत | उपलब्ध नहीं |
एमएमएलयू-प्रो
| 49.5% | उपलब्ध नहीं |
एमएमएमयू
| 70% | 75.4% स्रोत |
हेलास्वैग
| उपलब्ध नहीं | उपलब्ध नहीं |
ह्यूमनएवैल
| उपलब्ध नहीं | उपलब्ध नहीं |
मैथ
| 82.2% | उपलब्ध नहीं |
जीपीक्यूए
| 46.0% Diamond | 74.2% Diamond Science स्रोत |
आईएफइवैल
| उपलब्ध नहीं | उपलब्ध नहीं |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
वैश्विक MMLU (लाइट)
| - | - |
MathVista
| - | - |
मोबाइल एप्लिकेशन | - |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2025 All Right Reserved.