DeepSeek-R1

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

Gemini 2.0 Flash Thinking

जेमिनी 2.0 फ्लैश थिंकिंग एक उन्नत तर्क मॉडल है जिसे प्रदर्शन और व्याख्यात्मकता को बढ़ाने के लिए डिज़ाइन किया गया है जिससे इसकी विचार प्रक्रिया दृश्यमान होती है। यह जटिल समस्या-समाधान, कोडिंग चुनौतियों और गणितीय तर्क में उत्कृष्ट प्रदर्शन करता है, चरण-दर-चरण समाधान प्रदर्शित करता है। विस्तृत स्पष्टीकरण और तार्किक विश्लेषण की मांग वाले कार्यों के लिए अनुकूलित, यह मॉडल कोड एक्सीक्यूशन और गूगल सर्च क्षमताओं सहित नेटिव टूल इंटीग्रेशन भी प्रदान करता है।

DeepSeek-R1Gemini 2.0 Flash Thinking
वेबसाइट ?
प्रदाता ?
चैट ?
रिलीज तिथि ?
मोडलिटीज ?
टेक्स्ट ?
टेक्स्ट ?
छवियां ?
एपीआई प्रदाता ?
DeepSeek, HuggingFace
Google AI Studio, Vertex AI, Gemini API
ज्ञान समाप्ति तिथि ?
अज्ञात
04.2024
ओपन सोर्स ?
हां
नहीं
मूल्य निर्धारण इनपुट ?
$0.55 प्रति मिलियन टोकन
उपलब्ध नहीं
मूल्य निर्धारण आउटपुट ?
$2.19 प्रति मिलियन टोकन
उपलब्ध नहीं
एमएमएलयू ?
90.8%
Pass@1
स्रोत
उपलब्ध नहीं
एमएमएलयू-प्रो ?
84%
EM
स्रोत
उपलब्ध नहीं
एमएमएमयू ?
-
75.4%
स्रोत
हेलास्वैग ?
-
उपलब्ध नहीं
ह्यूमनएवैल ?
-
उपलब्ध नहीं
मैथ ?
-
उपलब्ध नहीं
जीपीक्यूए ?
71.5%
Pass@1
स्रोत
74.2%
Diamond Science
स्रोत
आईएफइवैल ?
83.3%
Prompt Strict
स्रोत
उपलब्ध नहीं
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
वैश्विक MMLU (लाइट) ?
-
-
MathVista ?
-
-
मोबाइल एप्लिकेशन

एलएलएम की तुलना करें

टिप्पणी जोड़ें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।