o3

ओपनएआई o3 ओपनएआई का सबसे उन्नत तर्क मॉडल है, जिसे जटिल, उच्च-संज्ञानात्मक कार्यों को संभालने के लिए विशेष रूप से बनाया गया है। अप्रैल 2025 में लॉन्च किया गया, यह सॉफ्टवेयर इंजीनियरिंग, गणित और वैज्ञानिक समस्या-समाधान में असाधारण प्रदर्शन प्रदान करता है। मॉडल तर्क प्रयास के तीन स्तर प्रस्तुत करता है - कम, मध्यम और उच्च - जो उपयोगकर्ताओं को कार्य की जटिलता के आधार पर विलंबता और तर्क की गहराई के बीच संतुलन बनाने की अनुमति देता है। o3 डेवलपर्स के लिए आवश्यक टूल्स को सपोर्ट करता है, जिनमें फंक्शन कॉलिंग, संरचित आउटपुट और सिस्टम-स्तरीय मैसेजिंग शामिल हैं। अंतर्निहित विजन क्षमताओं के साथ, o3 छवियों की व्याख्या और विश्लेषण कर सकता है, जो इसे मल्टीमोडल अनुप्रयोगों के लिए उपयुक्त बनाता है। यह चैट कंप्लीशन्स एपीआई, असिस्टेंट्स एपीआई और बैच एपीआई के माध्यम से उपलब्ध है, जिससे एंटरप्राइज और शोध वर्कफ़्लो में लचीला एकीकरण संभव होता है।

Qwen2.5-VL-32B

Qwen2-VL के रिलीज के बाद पिछले पांच महीनों में, डेवलपर्स ने इस पर आधारित नए मॉडल बनाए हैं, जिन्होंने मूल्यवान फीडबैक दिया है। अब, Qwen2.5-VL में छवियों, पाठ और चार्ट का सटीक विश्लेषण, साथ ही संरचित JSON आउटपुट के साथ वस्तु स्थानीकरण जैसी उन्नत क्षमताएं शामिल हैं। यह लंबे वीडियो को समझता है, प्रमुख घटनाओं की पहचान करता है और एक एजेंट के रूप में कार्य करते हुए कंप्यूटर और फोन पर टूल्स के साथ इंटरैक्ट करता है। मॉडल की आर्किटेक्चर में गति और सटीकता में सुधार के लिए डायनामिक वीडियो प्रोसेसिंग और एक ऑप्टिमाइज्ड ViT एनकोडर शामिल है।

o3Qwen2.5-VL-32B
वेबसाइट ?
प्रदाता ?
चैट ?
रिलीज तिथि ?
मोडलिटीज ?
टेक्स्ट ?
छवियां ?
टेक्स्ट ?
छवियां ?
वीडियो ?
एपीआई प्रदाता ?
OpenAI API
-
ज्ञान समाप्ति तिथि ?
-
अज्ञात
ओपन सोर्स ?
नहीं
हां (स्रोत)
मूल्य निर्धारण इनपुट ?
$10.00 प्रति मिलियन टोकन
$0
मूल्य निर्धारण आउटपुट ?
$40.00 प्रति मिलियन टोकन
$0
एमएमएलयू ?
82.9%
स्रोत
78.4%
स्रोत
एमएमएलयू-प्रो ?
-
49.5%
एमएमएमयू ?
-
70%
हेलास्वैग ?
-
उपलब्ध नहीं
ह्यूमनएवैल ?
-
उपलब्ध नहीं
मैथ ?
-
82.2%
जीपीक्यूए ?
83.3%
Diamond, no tools
स्रोत
46.0%
Diamond
आईएफइवैल ?
-
उपलब्ध नहीं
SimpleQA ?
-
-
AIME 2024
91.6%
स्रोत
-
AIME 2025
88.9%
स्रोत
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
वैश्विक MMLU (लाइट) ?
-
-
MathVista ?
-
-
मोबाइल एप्लिकेशन
-

MathArena ?

औसत स्कोर
86%
-
AIME 2025
अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
89%
-
HMMT February 2025
फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
78%
-
BRUMO 2025
96%
-
SMT 2025
2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
88%
-
CMIMC 2025
2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
78%
-

एलएलएम की तुलना करें

टिप्पणी जोड़ें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।