DeepSeek-R1

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

Nova Micro

अमेज़न नोवा माइक्रो एक टेक्स्ट-ऑनली मॉडल है जो लागत और गति के लिए अनुकूलित है। 128K टोकन्स की कंटेक्स्ट विंडो के साथ, यह टेक्स्ट सारांशीकरण, अनुवाद, इंटरएक्टिव चैट और बेसिक कोडिंग जैसे कार्यों में उत्कृष्ट प्रदर्शन करता है। अमेज़न नोवा फाउंडेशन मॉडल्स के हिस्से के रूप में जारी, यह प्रोप्राइटरी डेटा पर कस्टमाइजेशन के लिए फाइन-ट्यूनिंग और डिस्टिलेशन को सपोर्ट करता है।

DeepSeek-R1Nova Micro
वेबसाइट ?
प्रदाता ?
चैट ?
रिलीज तिथि ?
मोडलिटीज ?
टेक्स्ट ?
टेक्स्ट ?
एपीआई प्रदाता ?
DeepSeek, HuggingFace
Amazon Bedrock
ज्ञान समाप्ति तिथि ?
अज्ञात
जानबूझकर प्रकट नहीं किया गया
ओपन सोर्स ?
हां
नहीं
मूल्य निर्धारण इनपुट ?
$0.55 प्रति मिलियन टोकन
$0.04 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट ?
$2.19 प्रति मिलियन टोकन
$0.14 प्रति मिलियन टोकन
एमएमएलयू ?
90.8%
Pass@1
स्रोत
77.6%
CoT
स्रोत
एमएमएलयू-प्रो ?
84%
EM
स्रोत
-
एमएमएमयू ?
-
-
हेलास्वैग ?
-
-
ह्यूमनएवैल ?
-
81.1%
pass@1
स्रोत
मैथ ?
-
69.3%
CoT
स्रोत
जीपीक्यूए ?
71.5%
Pass@1
स्रोत
40%
Main
स्रोत
आईएफइवैल ?
83.3%
Prompt Strict
स्रोत
87.2%
स्रोत
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
वैश्विक MMLU (लाइट) ?
-
-
MathVista ?
-
-
मोबाइल एप्लिकेशन
-

एलएलएम की तुलना करें

टिप्पणी जोड़ें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।