
ग्रोक 3 xAI का सबसे उन्नत मॉडल है, जिसे कोलोसस सुपरक्लस्टर पर प्रशिक्षित किया गया है जिसमें पिछले अत्याधुनिक मॉडल्स की तुलना में 10 गुना अधिक कम्प्यूटेशनल पावर है। इसमें 1M-टोकन की कंटेक्स्ट विंडो और उन्नत तर्क क्षमताएं हैं, जिसे बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से बढ़ाया गया है, जो जटिल समस्याओं को हल करने के लिए कुछ सेकंड से लेकर मिनटों तक की गहन सोच प्रक्रिया को सक्षम बनाता है। यह मॉडल शैक्षणिक बेंचमार्क और वास्तविक दुनिया के उपयोगकर्ता मूल्यांकनों में शीर्ष-स्तरीय प्रदर्शन प्राप्त करता है, और चैटबॉट एरीना में 1402 का एलो स्कोर अर्जित करता है। इसे ग्रोक 3 मिनी के साथ जारी किया गया था, जो स्ट्रीमलाइन्ड तर्क के लिए अनुकूलित एक लागत-कुशल वेरिएंट है।
ओपनएआई o4-मिनी o-सीरीज़ का नवीनतम हल्का मॉडल है, जिसे टेक्स्ट और विजुअल कार्यों में कुशल और सक्षम तर्क के लिए इंजीनियर किया गया है। गति और प्रदर्शन के लिए अनुकूलित, यह कोड जनरेशन और इमेज-आधारित समझ में उत्कृष्ट प्रदर्शन करता है, जबकि विलंबता और तर्क की गहराई के बीच संतुलन बनाए रखता है। मॉडल 200,000-टोकन की संदर्भ विंडो को 100,000 आउटपुट टोकन तक सपोर्ट करता है, जो इसे विस्तारित, उच्च-मात्रा वाली इंटरैक्शन के लिए उपयुक्त बनाता है। यह टेक्स्ट और इमेज दोनों इनपुट को संभालता है, जो उन्नत तर्क क्षमताओं के साथ पाठ्य आउटपुट उत्पन्न करता है। अपनी कॉम्पैक्ट आर्किटेक्चर और बहुमुखी प्रदर्शन के साथ, o4-मिनी वास्तविक दुनिया के उन अनुप्रयोगों के लिए आदर्श है जिनमें तेज, लागत-प्रभावी बुद्धिमत्ता की आवश्यकता होती है।
| Grok 3 Beta | o4-mini | |
|---|---|---|
वेबसाइट
| ||
प्रदाता
| ||
चैट
| ||
रिलीज तिथि
| ||
मोडलिटीज
| टेक्स्ट छवियां वीडियो | टेक्स्ट छवियां |
एपीआई प्रदाता
| xAI | OpenAI API |
ज्ञान समाप्ति तिथि
| 2025-01 | - |
ओपन सोर्स
| नहीं | नहीं |
मूल्य निर्धारण इनपुट
| उपलब्ध नहीं | $1.10 प्रति मिलियन टोकन |
मूल्य निर्धारण आउटपुट
| उपलब्ध नहीं | $4.40 प्रति मिलियन टोकन |
एमएमएलयू
| उपलब्ध नहीं | fort |
एमएमएलयू-प्रो
| 79.9% Base model स्रोत | - |
एमएमएमयू
| 78% With Think mode स्रोत | 81.6% स्रोत |
हेलास्वैग
| उपलब्ध नहीं | - |
ह्यूमनएवैल
| उपलब्ध नहीं | 14.28% स्रोत |
मैथ
| उपलब्ध नहीं | - |
जीपीक्यूए
| 84.6% With Think mode, Diamond स्रोत | 81.4% स्रोत |
आईएफइवैल
| उपलब्ध नहीं | - |
SimpleQA
| - | - |
AIME 2024 | - | 93.4% स्रोत |
AIME 2025 | - | 92.7% स्रोत |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
वैश्विक MMLU (लाइट)
| - | - |
MathVista
| - | - |
मोबाइल एप्लिकेशन | ||
MathArena | ||
| औसत स्कोर | - | 87% |
AIME 2025 अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | - | 92% |
HMMT February 2025 फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | - | 83% |
BRUMO 2025 | - | 87% |
SMT 2025 2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | - | 89% |
CMIMC 2025 2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है। | - | 84% |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2026 All Right Reserved.
टिप्पणियां (1)
Pierre
09 अप्रैल 2026Ziet er goed uit