Grok 3 Beta

ग्रोक 3 xAI का सबसे उन्नत मॉडल है, जिसे कोलोसस सुपरक्लस्टर पर प्रशिक्षित किया गया है जिसमें पिछले अत्याधुनिक मॉडल्स की तुलना में 10 गुना अधिक कम्प्यूटेशनल पावर है। इसमें 1M-टोकन की कंटेक्स्ट विंडो और उन्नत तर्क क्षमताएं हैं, जिसे बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से बढ़ाया गया है, जो जटिल समस्याओं को हल करने के लिए कुछ सेकंड से लेकर मिनटों तक की गहन सोच प्रक्रिया को सक्षम बनाता है। यह मॉडल शैक्षणिक बेंचमार्क और वास्तविक दुनिया के उपयोगकर्ता मूल्यांकनों में शीर्ष-स्तरीय प्रदर्शन प्राप्त करता है, और चैटबॉट एरीना में 1402 का एलो स्कोर अर्जित करता है। इसे ग्रोक 3 मिनी के साथ जारी किया गया था, जो स्ट्रीमलाइन्ड तर्क के लिए अनुकूलित एक लागत-कुशल वेरिएंट है।

Claude 3.7 Sonnet - Extended Thinking

क्लॉड 3.7 सॉनेट एन्थ्रोपिक का अब तक का सबसे उन्नत एआई मॉडल है और बाजार में पहला हाइब्रिड रीजनिंग सिस्टम है। यह स्टैंडर्ड और एक्सटेंडेड थिंकिंग मोड दोनों प्रदान करता है, जिसमें बाद वाला पारदर्शी, चरण-दर-चरण तर्क प्रदान करता है। यह मॉडल कोडिंग और फ्रंट-एंड वेब डेवलपमेंट में महत्वपूर्ण सुधार प्रदर्शित करता है, और SWE-बेंच वेरिफाइड और TAU-बेंच पर अत्याधुनिक परिणाम प्राप्त करता है। क्लॉड.एआई, एन्थ्रोपिक एपीआई, अमेज़न बेडरॉक और गूगल क्लाउड के वर्टेक्स एआई के माध्यम से उपलब्ध, यह इंटेलिजेंट एआई-पावर्ड समस्या-समाधान के लिए एक नया मानक स्थापित करता है।

Grok 3 BetaClaude 3.7 Sonnet - Extended Thinking
वेबसाइट ?
प्रदाता ?
चैट ?
रिलीज तिथि ?
मोडलिटीज ?
टेक्स्ट ?
छवियां ?
वीडियो ?
टेक्स्ट ?
छवियां ?
एपीआई प्रदाता ?
xAI
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
ज्ञान समाप्ति तिथि ?
2025-01
-
ओपन सोर्स ?
नहीं
नहीं
मूल्य निर्धारण इनपुट ?
उपलब्ध नहीं
$3.00 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट ?
उपलब्ध नहीं
$15.00 प्रति मिलियन टोकन
एमएमएलयू ?
उपलब्ध नहीं
उपलब्ध नहीं
एमएमएलयू-प्रो ?
79.9%
Base model
स्रोत
उपलब्ध नहीं
एमएमएमयू ?
78%
With Think mode
स्रोत
75%
स्रोत
हेलास्वैग ?
उपलब्ध नहीं
उपलब्ध नहीं
ह्यूमनएवैल ?
उपलब्ध नहीं
उपलब्ध नहीं
मैथ ?
उपलब्ध नहीं
96.2%
स्रोत
जीपीक्यूए ?
84.6%
With Think mode, Diamond
स्रोत
84.8%
Diamond
स्रोत
आईएफइवैल ?
उपलब्ध नहीं
93.2%
स्रोत
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
वैश्विक MMLU (लाइट) ?
-
-
MathVista ?
-
-
मोबाइल एप्लिकेशन

एलएलएम की तुलना करें

टिप्पणी जोड़ें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।