DeepSeek-R1

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

Claude 3.5 Haiku

क्लॉड 3.5 हाइकू, एन्थ्रोपिक द्वारा विकसित, 200,000-टोकन की कंटेक्स्ट विंडो प्रदान करता है। कीमत $1 प्रति मिलियन इनपुट टोकन और $5 प्रति मिलियन आउटपुट टोकन पर निर्धारित है, जिसमें प्रॉम्प्ट कैशिंग के माध्यम से 90% तक और मैसेज बैचेस एपीआई के माध्यम से 50% तक की बचत संभव है। 4 नवंबर, 2024 को जारी, यह मॉडल कोड पूर्णता, इंटरएक्टिव चैटबॉट्स, डेटा निष्कर्षण और लेबलिंग, साथ ही रियल-टाइम कंटेंट मॉडरेशन में उत्कृष्ट प्रदर्शन करता है।

DeepSeek-R1Claude 3.5 Haiku
वेबसाइट ?
प्रदाता ?
चैट ?
रिलीज तिथि ?
मोडलिटीज ?
टेक्स्ट ?
टेक्स्ट ?
एपीआई प्रदाता ?
DeepSeek, HuggingFace
Anthropic, AWS Bedrock, Vertex AI
ज्ञान समाप्ति तिथि ?
अज्ञात
01.04.2024
ओपन सोर्स ?
हां
नहीं
मूल्य निर्धारण इनपुट ?
$0.55 प्रति मिलियन टोकन
$0.80 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट ?
$2.19 प्रति मिलियन टोकन
$4.00
एमएमएलयू ?
90.8%
Pass@1
स्रोत
उपलब्ध नहीं
एमएमएलयू-प्रो ?
84%
EM
स्रोत
65%
0-shot CoT
स्रोत
एमएमएमयू ?
-
उपलब्ध नहीं
हेलास्वैग ?
-
उपलब्ध नहीं
ह्यूमनएवैल ?
-
88.1%
0-shot
स्रोत
मैथ ?
-
69.4%
0-shot CoT
स्रोत
जीपीक्यूए ?
71.5%
Pass@1
स्रोत
उपलब्ध नहीं
आईएफइवैल ?
83.3%
Prompt Strict
स्रोत
उपलब्ध नहीं
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
वैश्विक MMLU (लाइट) ?
-
-
MathVista ?
-
-
मोबाइल एप्लिकेशन

एलएलएम की तुलना करें

टिप्पणी जोड़ें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।