DeepSeek-R1 vs Llama 3.3 70B Instruct - एलएलएम की तुलना करें

DeepSeek-R1

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

Llama 3.3 70B Instruct

मेटा द्वारा निर्मित लामा 3.3 70बी इंस्ट्रक्ट, एक बहुभाषी बड़ा भाषा मॉडल है जिसे विशेष रूप से निर्देश-आधारित कार्यों के लिए फाइन-ट्यून किया गया है और वार्तालाप अनुप्रयोगों के लिए अनुकूलित किया गया है। यह 128,000 टोकन तक का समर्थन करने वाली कंटेक्स्ट विंडो के साथ कई भाषाओं में टेक्स्ट को प्रोसेस और जनरेट करने में सक्षम है। 6 दिसंबर, 2024 को लॉन्च किया गया, यह मॉडल विभिन्न उद्योग बेंचमार्क में कई ओपन-सोर्स और प्रोप्राइटरी चैट मॉडल्स को पार करता है। यह स्केलेबिलिटी को बेहतर बनाने के लिए ग्रुप्ड-क्वेरी अटेंशन (जीक्यूए) का उपयोग करता है और सार्वजनिक रूप से उपलब्ध स्रोतों से 15 ट्रिलियन से अधिक टोकन के विविध डेटासेट पर प्रशिक्षित किया गया है। मॉडल का ज्ञान दिसंबर 2023 तक अद्यतन है।

	DeepSeek-R1	Llama 3.3 70B Instruct
वेबसाइट ?	Open	Open
प्रदाता ?	DeepSeek	Meta
चैट ?
रिलीज तिथि ?
मोडलिटीज ?	टेक्स्ट ?	टेक्स्ट ?
एपीआई प्रदाता ?	DeepSeek, HuggingFace	Fireworks, Together, DeepInfra, Hyperbolic
ज्ञान समाप्ति तिथि ?	अज्ञात	12.2024
ओपन सोर्स ?	हां	हां
मूल्य निर्धारण इनपुट ?	$0.55 प्रति मिलियन टोकन	$0.23 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट ?	$2.19 प्रति मिलियन टोकन	$0.40 प्रति मिलियन टोकन
एमएमएलयू ?	90.8% Pass@1 स्रोत	86% 0-shot, CoT स्रोत
एमएमएलयू-प्रो ?	84% EM स्रोत	68.9% 5-shot, CoT स्रोत
एमएमएमयू ?	-	उपलब्ध नहीं
हेलास्वैग ?	-	उपलब्ध नहीं
ह्यूमनएवैल ?	-	88.4% pass@1 स्रोत
मैथ ?	-	77% 0-shot, CoT स्रोत
जीपीक्यूए ?	71.5% Pass@1 स्रोत	50.5% 0-shot, CoT स्रोत
आईएफइवैल ?	83.3% Prompt Strict स्रोत	92.1% स्रोत
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
वैश्विक MMLU (लाइट) ?	-	-
MathVista ?	-	-
मोबाइल एप्लिकेशन	Google Play Apple Apps	-

DeepSeek-R1

Llama 3.3 70B Instruct

वेबसाइट ?

Open

प्रदाता ?

DeepSeek

एलएलएम की तुलना करें
DeepSeek-R1 vs Llama 3.3 70B Instruct

DeepSeek-R1

Llama 3.3 70B Instruct

एलएलएम की तुलना करें

टिप्पणी जोड़ें

एलएलएम की तुलना करेंDeepSeek-R1 vs Llama 3.3 70B Instruct

DeepSeek-R1

Llama 3.3 70B Instruct

एलएलएम की तुलना करें

टिप्पणी जोड़ें

एलएलएम की तुलना करें
DeepSeek-R1 vs Llama 3.3 70B Instruct