Grok 3 Beta vs o4-mini - एलएलएम की तुलना करें

Grok 3 Beta

ग्रोक 3 xAI का सबसे उन्नत मॉडल है, जिसे कोलोसस सुपरक्लस्टर पर प्रशिक्षित किया गया है जिसमें पिछले अत्याधुनिक मॉडल्स की तुलना में 10 गुना अधिक कम्प्यूटेशनल पावर है। इसमें 1M-टोकन की कंटेक्स्ट विंडो और उन्नत तर्क क्षमताएं हैं, जिसे बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से बढ़ाया गया है, जो जटिल समस्याओं को हल करने के लिए कुछ सेकंड से लेकर मिनटों तक की गहन सोच प्रक्रिया को सक्षम बनाता है। यह मॉडल शैक्षणिक बेंचमार्क और वास्तविक दुनिया के उपयोगकर्ता मूल्यांकनों में शीर्ष-स्तरीय प्रदर्शन प्राप्त करता है, और चैटबॉट एरीना में 1402 का एलो स्कोर अर्जित करता है। इसे ग्रोक 3 मिनी के साथ जारी किया गया था, जो स्ट्रीमलाइन्ड तर्क के लिए अनुकूलित एक लागत-कुशल वेरिएंट है।

o4-mini

ओपनएआई o4-मिनी o-सीरीज़ का नवीनतम हल्का मॉडल है, जिसे टेक्स्ट और विजुअल कार्यों में कुशल और सक्षम तर्क के लिए इंजीनियर किया गया है। गति और प्रदर्शन के लिए अनुकूलित, यह कोड जनरेशन और इमेज-आधारित समझ में उत्कृष्ट प्रदर्शन करता है, जबकि विलंबता और तर्क की गहराई के बीच संतुलन बनाए रखता है। मॉडल 200,000-टोकन की संदर्भ विंडो को 100,000 आउटपुट टोकन तक सपोर्ट करता है, जो इसे विस्तारित, उच्च-मात्रा वाली इंटरैक्शन के लिए उपयुक्त बनाता है। यह टेक्स्ट और इमेज दोनों इनपुट को संभालता है, जो उन्नत तर्क क्षमताओं के साथ पाठ्य आउटपुट उत्पन्न करता है। अपनी कॉम्पैक्ट आर्किटेक्चर और बहुमुखी प्रदर्शन के साथ, o4-मिनी वास्तविक दुनिया के उन अनुप्रयोगों के लिए आदर्श है जिनमें तेज, लागत-प्रभावी बुद्धिमत्ता की आवश्यकता होती है।

	Grok 3 Beta	o4-mini
वेबसाइट ?	Open	Open
प्रदाता ?	xAI	OpenAI
चैट ?
रिलीज तिथि ?
मोडलिटीज ?	टेक्स्ट ? छवियां ? वीडियो ?	टेक्स्ट ? छवियां ?
एपीआई प्रदाता ?	xAI	OpenAI API
ज्ञान समाप्ति तिथि ?	2025-01	-
ओपन सोर्स ?	नहीं	नहीं
मूल्य निर्धारण इनपुट ?	उपलब्ध नहीं	$1.10 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट ?	उपलब्ध नहीं	$4.40 प्रति मिलियन टोकन
एमएमएलयू ?	उपलब्ध नहीं	fort
एमएमएलयू-प्रो ?	79.9% Base model स्रोत	-
एमएमएमयू ?	78% With Think mode स्रोत	81.6% स्रोत
हेलास्वैग ?	उपलब्ध नहीं	-
ह्यूमनएवैल ?	उपलब्ध नहीं	14.28% स्रोत
मैथ ?	उपलब्ध नहीं	-
जीपीक्यूए ?	84.6% With Think mode, Diamond स्रोत	81.4% स्रोत
आईएफइवैल ?	उपलब्ध नहीं	-
SimpleQA ?	-	-
AIME 2024	-	93.4% स्रोत
AIME 2025	-	92.7% स्रोत
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
वैश्विक MMLU (लाइट) ?	-	-
MathVista ?	-	-
मोबाइल एप्लिकेशन	Google Play Apple Apps	Google Play Apple Apps
MathArena ?
औसत स्कोर	-	87%
AIME 2025 अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	-	92%
HMMT February 2025 फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	-	83%
BRUMO 2025	-	87%
SMT 2025 2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	-	89%
CMIMC 2025 2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	-	84%

Grok 3 Beta

o4-mini

वेबसाइट ?

Open

प्रदाता ?

xAI

OpenAI

चैट ?

रिलीज तिथि ?

मोडलिटीज ?

टेक्स्ट ?
छवियां ?
वीडियो ?

टेक्स्ट ?
छवियां ?

एपीआई प्रदाता ?

xAI

OpenAI API

ज्ञान समाप्ति तिथि ?

2025-01

ओपन सोर्स ?

नहीं

मूल्य निर्धारण इनपुट ?

उपलब्ध नहीं

$1.10 प्रति मिलियन टोकन

मूल्य निर्धारण आउटपुट ?

उपलब्ध नहीं

$4.40 प्रति मिलियन टोकन

एमएमएलयू ?

उपलब्ध नहीं

fort

एमएमएलयू-प्रो ?

79.9%
Base model
स्रोत

एमएमएमयू ?

78%
With Think mode
स्रोत

81.6%
स्रोत

हेलास्वैग ?

उपलब्ध नहीं

ह्यूमनएवैल ?

उपलब्ध नहीं

14.28%
स्रोत

मैथ ?

उपलब्ध नहीं

जीपीक्यूए ?

84.6%
With Think mode, Diamond
स्रोत

81.4%
स्रोत

आईएफइवैल ?

उपलब्ध नहीं

SimpleQA ?

AIME 2024

93.4%
स्रोत

AIME 2025

92.7%
स्रोत

Aider Polyglot ?

LiveCodeBench v5 ?

वैश्विक MMLU (लाइट) ?

MathVista ?

मोबाइल एप्लिकेशन

Google Play
Apple Apps

MathArena ?

औसत स्कोर

87%

AIME 2025

अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।

92%

HMMT February 2025

फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।

83%

BRUMO 2025

87%

SMT 2025

2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।

89%

CMIMC 2025

2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।

84%

एलएलएम की तुलना करें
Grok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

MathArena ?

एलएलएम की तुलना करें

टिप्पणियां (1)

Pierre

टिप्पणी जोड़ें

एलएलएम की तुलना करेंGrok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

MathArena ?

एलएलएम की तुलना करें

टिप्पणियां (1)

Pierre

टिप्पणी जोड़ें

एलएलएम की तुलना करें
Grok 3 Beta vs o4-mini