DeepSeek-R1 एआई तकनीकी विशिष्टताएं और समीक्षा

DeepSeek-R1

टिप्पणियां: 1

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

1224

कुल रैंकिंग में स्थिति
जुलाई 2026 तक

उपयोगकर्ता रेटिंग
https://compare-ai.foundtt.com

4.2

मॉडल अवलोकन

वेबसाइट एआई मॉडल वेब पेज	Open
प्रदाता इस मॉडल को प्रदान करने वाली इकाई।	DeepSeek
चैट चैट शुरू करने के लिए एक संदेश दर्ज करें	-
रिलीज तिथि मॉडल पहली बार कब रिलीज हुआ था।	1 वर्ष ago जन 21, 2025
मोडलिटीज इस मॉडल द्वारा संसाधित किए जा सकने वाले डेटा के प्रकार	टेक्स्ट ?
एपीआई प्रदाता वे प्रदाता जो इस मॉडल को प्रदान करते हैं। (यह एक पूर्ण सूची नहीं है।)	DeepSeek, HuggingFace
ज्ञान समाप्ति तिथि मॉडल का ज्ञान अंतिम बार कब अपडेट किया गया था।	अज्ञात
ओपन सोर्स क्या मॉडल का कोड सार्वजनिक उपयोग के लिए उपलब्ध है।	हां
मूल्य निर्धारण इनपुट आपके प्रॉम्प्ट में टोकन प्रोसेसिंग की लागत	$0.55 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट मॉडल द्वारा उत्पन्न टोकन की लागत	$2.19 प्रति मिलियन टोकन
एमएमएलयू मैसिव मल्टीटास्क भाषा समझ - गणित, इतिहास, कानून और अन्य सहित 57 विषयों में ज्ञान का परीक्षण	90.8% Pass@1 स्रोत
एमएमएलयू-प्रो अधिक मजबूत एमएमएलयू बेंचमार्क जिसमें कठिन, तर्क-केंद्रित प्रश्न, बड़ा विकल्प सेट, और कम प्रॉम्प्ट संवेदनशीलता शामिल है	84% EM स्रोत
एमएमएमयू मैसिव मल्टीटास्क मल्टीमॉडल समझ - टेक्स्ट, छवियों, ऑडियो और वीडियो में समझ का परीक्षण	-
हेलास्वैग एक चुनौतीपूर्ण वाक्य पूर्णता बेंचमार्क	-
ह्यूमनएवैल कोड जनरेशन और समस्या-समाधान क्षमताओं का मूल्यांकन करता है	-
मैथ विभिन्न कठिनाई स्तरों पर गणितीय समस्या-समाधान क्षमताओं का परीक्षण	-
जीपीक्यूए रसायन विज्ञान, जीव विज्ञान और भौतिकी में पीएचडी-स्तर के ज्ञान का बहुविकल्पीय प्रश्नों के माध्यम से परीक्षण जो गहरे डोमेन विशेषज्ञता की आवश्यकता रखते हैं	71.5% Pass@1 स्रोत
आईएफइवैल मॉडल की स्पष्ट स्वरूपण निर्देशों का सटीक पालन करने, उपयुक्त आउटपुट उत्पन्न करने, और विभिन्न कार्यों में लगातार निर्देश अनुपालन बनाए रखने की क्षमता का परीक्षण	83.3% Prompt Strict स्रोत
SimpleQA साधारण प्रश्नों की सटीकता का आकलन	-
AIME 2024	-
AIME 2025	-
Aider Polyglot बहुभाषी प्रोग्रामिंग बेंचमार्क।	-
LiveCodeBench v5 रीयल-टाइम प्रोग्रामिंग के लिए बेंचमार्क	-
वैश्विक MMLU (लाइट) वैश्विक स्तर पर मॉडलों की सार्वभौमिकता का आकलन करने के लिए बेंचमार्क का सरलीकृत संस्करण।	-
MathVista दृश्य संदर्भों में AI मॉडलों की गणितीय तर्क क्षमताओं का मूल्यांकन	-
मोबाइल एप्लिकेशन	Google Play Apple Apps
MathArena ?
औसत स्कोर	82%
AIME 2025 अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	89%
HMMT February 2025 फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	77%
BRUMO 2025	92%
SMT 2025 2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	83%
CMIMC 2025 2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।	69%

टिप्पणियां (1)

Jacquie
27 जनवरी 2026
Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

DeepSeek-R1 विशिष्टताएं, समीक्षा और तुलना

DeepSeek-R1

मॉडल अवलोकन

MathArena ?

टिप्पणियां (1)

Jacquie

टिप्पणी जोड़ें

एलएलएम की तुलना करें