
ओपनएआई o3 ओपनएआई का सबसे उन्नत तर्क मॉडल है, जिसे जटिल, उच्च-संज्ञानात्मक कार्यों को संभालने के लिए विशेष रूप से बनाया गया है। अप्रैल 2025 में लॉन्च किया गया, यह सॉफ्टवेयर इंजीनियरिंग, गणित और वैज्ञानिक समस्या-समाधान में असाधारण प्रदर्शन प्रदान करता है। मॉडल तर्क प्रयास के तीन स्तर प्रस्तुत करता है - कम, मध्यम और उच्च - जो उपयोगकर्ताओं को कार्य की जटिलता के आधार पर विलंबता और तर्क की गहराई के बीच संतुलन बनाने की अनुमति देता है। o3 डेवलपर्स के लिए आवश्यक टूल्स को सपोर्ट करता है, जिनमें फंक्शन कॉलिंग, संरचित आउटपुट और सिस्टम-स्तरीय मैसेजिंग शामिल हैं। अंतर्निहित विजन क्षमताओं के साथ, o3 छवियों की व्याख्या और विश्लेषण कर सकता है, जो इसे मल्टीमोडल अनुप्रयोगों के लिए उपयुक्त बनाता है। यह चैट कंप्लीशन्स एपीआई, असिस्टेंट्स एपीआई और बैच एपीआई के माध्यम से उपलब्ध है, जिससे एंटरप्राइज और शोध वर्कफ़्लो में लचीला एकीकरण संभव होता है।
Qwen2-VL के रिलीज के बाद पिछले पांच महीनों में, डेवलपर्स ने इस पर आधारित नए मॉडल बनाए हैं, जिन्होंने मूल्यवान फीडबैक दिया है। अब, Qwen2.5-VL में छवियों, पाठ और चार्ट का सटीक विश्लेषण, साथ ही संरचित JSON आउटपुट के साथ वस्तु स्थानीकरण जैसी उन्नत क्षमताएं शामिल हैं। यह लंबे वीडियो को समझता है, प्रमुख घटनाओं की पहचान करता है और एक एजेंट के रूप में कार्य करते हुए कंप्यूटर और फोन पर टूल्स के साथ इंटरैक्ट करता है। मॉडल की आर्किटेक्चर में गति और सटीकता में सुधार के लिए डायनामिक वीडियो प्रोसेसिंग और एक ऑप्टिमाइज्ड ViT एनकोडर शामिल है।
| o3 | Qwen2.5-VL-32B | |
|---|---|---|
वेबसाइट
| ||
प्रदाता
| ||
चैट
| ||
रिलीज तिथि
| ||
मोडलिटीज
| टेक्स्ट छवियां | टेक्स्ट छवियां वीडियो |
एपीआई प्रदाता
| OpenAI API | - |
ज्ञान समाप्ति तिथि
| - | अज्ञात |
ओपन सोर्स
| नहीं | हां (स्रोत) |
मूल्य निर्धारण इनपुट
| $10.00 प्रति मिलियन टोकन | $0 |
मूल्य निर्धारण आउटपुट
| $40.00 प्रति मिलियन टोकन | $0 |
एमएमएलयू
| 82.9% स्रोत | 78.4% स्रोत |
एमएमएलयू-प्रो
| - | 49.5% |
एमएमएमयू
| - | 70% |
हेलास्वैग
| - | उपलब्ध नहीं |
ह्यूमनएवैल
| - | उपलब्ध नहीं |
मैथ
| - | 82.2% |
जीपीक्यूए
| 83.3% Diamond, no tools स्रोत | 46.0% Diamond |
आईएफइवैल
| - | उपलब्ध नहीं |
SimpleQA
| - | - |
AIME 2024 | 91.6% स्रोत | - |
AIME 2025 | 88.9% स्रोत | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
वैश्विक MMLU (लाइट)
| - | - |
MathVista
| - | - |
मोबाइल एप्लिकेशन | - | |
MathArena | ||
| औसत स्कोर | 86% | - |
AIME 2025 अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | 89% | - |
HMMT February 2025 फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | 78% | - |
BRUMO 2025 | 96% | - |
SMT 2025 2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | 88% | - |
CMIMC 2025 2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | 78% | - |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2026 All Right Reserved.