DeepSeek-R1

टिप्पणियां: 1
DeepSeek-R1 #0
DeepSeek-R1 #1
DeepSeek-R1 #2

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

1224
21

कुल रैंकिंग में स्थिति
जून 2026 तक
5
उपयोगकर्ता रेटिंग
https://compare-ai.foundtt.com
4.2

मॉडल अवलोकन

वेबसाइट
एआई मॉडल वेब पेज
प्रदाता
इस मॉडल को प्रदान करने वाली इकाई।
चैट
चैट शुरू करने के लिए एक संदेश दर्ज करें
-
रिलीज तिथि
मॉडल पहली बार कब रिलीज हुआ था।
1 वर्ष ago
जन 21, 2025
मोडलिटीज
इस मॉडल द्वारा संसाधित किए जा सकने वाले डेटा के प्रकार
टेक्स्ट ?
एपीआई प्रदाता
वे प्रदाता जो इस मॉडल को प्रदान करते हैं। (यह एक पूर्ण सूची नहीं है।)
DeepSeek, HuggingFace
ज्ञान समाप्ति तिथि
मॉडल का ज्ञान अंतिम बार कब अपडेट किया गया था।
अज्ञात
ओपन सोर्स
क्या मॉडल का कोड सार्वजनिक उपयोग के लिए उपलब्ध है।
हां
मूल्य निर्धारण इनपुट
आपके प्रॉम्प्ट में टोकन प्रोसेसिंग की लागत
$0.55 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट
मॉडल द्वारा उत्पन्न टोकन की लागत
$2.19 प्रति मिलियन टोकन
एमएमएलयू
मैसिव मल्टीटास्क भाषा समझ - गणित, इतिहास, कानून और अन्य सहित 57 विषयों में ज्ञान का परीक्षण
90.8%
Pass@1
स्रोत
एमएमएलयू-प्रो
अधिक मजबूत एमएमएलयू बेंचमार्क जिसमें कठिन, तर्क-केंद्रित प्रश्न, बड़ा विकल्प सेट, और कम प्रॉम्प्ट संवेदनशीलता शामिल है
84%
EM
स्रोत
एमएमएमयू
मैसिव मल्टीटास्क मल्टीमॉडल समझ - टेक्स्ट, छवियों, ऑडियो और वीडियो में समझ का परीक्षण
-
हेलास्वैग
एक चुनौतीपूर्ण वाक्य पूर्णता बेंचमार्क
-
ह्यूमनएवैल
कोड जनरेशन और समस्या-समाधान क्षमताओं का मूल्यांकन करता है
-
मैथ
विभिन्न कठिनाई स्तरों पर गणितीय समस्या-समाधान क्षमताओं का परीक्षण
-
जीपीक्यूए
रसायन विज्ञान, जीव विज्ञान और भौतिकी में पीएचडी-स्तर के ज्ञान का बहुविकल्पीय प्रश्नों के माध्यम से परीक्षण जो गहरे डोमेन विशेषज्ञता की आवश्यकता रखते हैं
71.5%
Pass@1
स्रोत
आईएफइवैल
मॉडल की स्पष्ट स्वरूपण निर्देशों का सटीक पालन करने, उपयुक्त आउटपुट उत्पन्न करने, और विभिन्न कार्यों में लगातार निर्देश अनुपालन बनाए रखने की क्षमता का परीक्षण
83.3%
Prompt Strict
स्रोत
SimpleQA
साधारण प्रश्नों की सटीकता का आकलन
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
बहुभाषी प्रोग्रामिंग बेंचमार्क।
-
LiveCodeBench v5
रीयल-टाइम प्रोग्रामिंग के लिए बेंचमार्क
-
वैश्विक MMLU (लाइट)
वैश्विक स्तर पर मॉडलों की सार्वभौमिकता का आकलन करने के लिए बेंचमार्क का सरलीकृत संस्करण।
-
MathVista
दृश्य संदर्भों में AI मॉडलों की गणितीय तर्क क्षमताओं का मूल्यांकन
-
मोबाइल एप्लिकेशन

MathArena ?

औसत स्कोर82%
AIME 2025
अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
89%
HMMT February 2025
फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
77%
BRUMO 202592%
SMT 2025
2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
83%
CMIMC 2025
2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
69%

टिप्पणियां (1)

  1. Jacquie

    27 जनवरी 2026

    Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

टिप्पणी जोड़ें

एलएलएम की तुलना करें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।