ग्रोक 3 xAI का सबसे उन्नत मॉडल है, जिसे कोलोसस सुपरक्लस्टर पर प्रशिक्षित किया गया है जिसमें पिछले अत्याधुनिक मॉडल्स की तुलना में 10 गुना अधिक कम्प्यूटेशनल पावर है। इसमें 1M-टोकन की कंटेक्स्ट विंडो और उन्नत तर्क क्षमताएं हैं, जिसे बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से बढ़ाया गया है, जो जटिल समस्याओं को हल करने के लिए कुछ सेकंड से लेकर मिनटों तक की गहन सोच प्रक्रिया को सक्षम बनाता है। यह मॉडल शैक्षणिक बेंचमार्क और वास्तविक दुनिया के उपयोगकर्ता मूल्यांकनों में शीर्ष-स्तरीय प्रदर्शन प्राप्त करता है, और चैटबॉट एरीना में 1402 का एलो स्कोर अर्जित करता है। इसे ग्रोक 3 मिनी के साथ जारी किया गया था, जो स्ट्रीमलाइन्ड तर्क के लिए अनुकूलित एक लागत-कुशल वेरिएंट है।
जेमिनी 2.5 प्रो गूगल का सबसे उन्नत एआई मॉडल है, जिसे गहन तर्क और विचारशील प्रतिक्रिया जनरेशन के लिए इंजीनियर किया गया है। यह प्रमुख बेंचमार्क पर बेहतर प्रदर्शन करता है, असाधारण तर्क और कोडिंग दक्षता प्रदर्शित करता है। डायनामिक वेब एप्लिकेशन, स्वायत्त कोड सिस्टम और कोड अनुकूलन के निर्माण के लिए अनुकूलित, यह उच्च-स्तरीय प्रदर्शन प्रदान करता है। अंतर्निहित मल्टीमोडल क्षमताओं और विस्तारित संदर्भ विंडो के साथ, मॉडल बड़े डेटासेट को कुशलतापूर्वक प्रोसेस करता है और जटिल चुनौतियों से निपटने के लिए विविध सूचना स्रोतों को एकीकृत करता है।
Grok 3 Beta | Gemini 2.5 Pro | |
---|---|---|
वेबसाइट
| ||
प्रदाता
| ||
चैट
| ||
रिलीज तिथि
| ||
मोडलिटीज
| टेक्स्ट छवियां वीडियो | टेक्स्ट छवियां आवाज वीडियो |
एपीआई प्रदाता
| xAI | Google AI Studio, Vertex AI, Gemini app |
ज्ञान समाप्ति तिथि
| 2025-01 | - |
ओपन सोर्स
| नहीं | नहीं |
मूल्य निर्धारण इनपुट
| उपलब्ध नहीं | उपलब्ध नहीं |
मूल्य निर्धारण आउटपुट
| उपलब्ध नहीं | उपलब्ध नहीं |
एमएमएलयू
| उपलब्ध नहीं | उपलब्ध नहीं |
एमएमएलयू-प्रो
| 79.9% Base model स्रोत | उपलब्ध नहीं |
एमएमएमयू
| 78% With Think mode स्रोत | 81.7% स्रोत |
हेलास्वैग
| उपलब्ध नहीं | उपलब्ध नहीं |
ह्यूमनएवैल
| उपलब्ध नहीं | उपलब्ध नहीं |
मैथ
| उपलब्ध नहीं | उपलब्ध नहीं |
जीपीक्यूए
| 84.6% With Think mode, Diamond स्रोत | 84.0% Diamond Science स्रोत |
आईएफइवैल
| उपलब्ध नहीं | उपलब्ध नहीं |
SimpleQA
| - | 52.9% |
AIME 2024 | - | 92.0% |
AIME 2025 | - | 86.7% |
Aider Polyglot
| - | 74.0% / 68.6% |
LiveCodeBench v5
| - | 70.4% |
वैश्विक MMLU (लाइट)
| - | 89.8% |
MathVista
| - | - |
मोबाइल एप्लिकेशन | ||
VideoGameBench | ||
कुल स्कोर | - | 0.48% |
Doom II | - | 0% |
Dream DX | - | 4.8% |
Awakening DX | - | 0% |
Civilization I | - | 0% |
Pokemon Crystal | - | 0% |
The Need for Speed | - | 0% |
The Incredible Machine | - | 0% |
Secret Game 1 | - | 0% |
Secret Game 2 | - | 0% |
Secret Game 3 | - | 0% |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2025 All Right Reserved.