DeepSeek-R1

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

Mistral Large 2

मिस्ट्राल लार्ज 2, मिस्ट्राल द्वारा विकसित, 128के-टोकन कंटेक्स्ट विंडो प्रदान करता है और इसकी कीमत $3.00 प्रति मिलियन इनपुट टोकन और $9.00 प्रति मिलियन आउटपुट टोकन पर निर्धारित है। 24 जुलाई, 2024 को जारी किया गया, यह मॉडल 5-शॉट मूल्यांकन में एमएमएलयू बेंचमार्क पर 84.0 स्कोर करता है, जो विविध कार्यों में मजबूत प्रदर्शन प्रदर्शित करता है।

DeepSeek-R1Mistral Large 2
वेबसाइट ?
प्रदाता ?
चैट ?
रिलीज तिथि ?
मोडलिटीज ?
टेक्स्ट ?
टेक्स्ट ?
एपीआई प्रदाता ?
DeepSeek, HuggingFace
Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
ज्ञान समाप्ति तिथि ?
अज्ञात
अज्ञात
ओपन सोर्स ?
हां
हां
मूल्य निर्धारण इनपुट ?
$0.55 प्रति मिलियन टोकन
$3.00 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट ?
$2.19 प्रति मिलियन टोकन
$9.00 प्रति मिलियन टोकन
एमएमएलयू ?
90.8%
Pass@1
स्रोत
84%
5-shot
स्रोत
एमएमएलयू-प्रो ?
84%
EM
स्रोत
50.69%
स्रोत
एमएमएमयू ?
-
उपलब्ध नहीं
हेलास्वैग ?
-
उपलब्ध नहीं
ह्यूमनएवैल ?
-
उपलब्ध नहीं
मैथ ?
-
1.13%
स्रोत
जीपीक्यूए ?
71.5%
Pass@1
स्रोत
24.94%
आईएफइवैल ?
83.3%
Prompt Strict
स्रोत
84.01%
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
वैश्विक MMLU (लाइट) ?
-
-
MathVista ?
-
-
मोबाइल एप्लिकेशन
-

एलएलएम की तुलना करें

टिप्पणी जोड़ें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।