डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।
अमेज़न नोवा लाइट एक बहुमुखी मल्टीमोडल मॉडल है जो टेक्स्ट, इमेज और वीडियो इनपुट्स को प्रोसेस करने के लिए डिज़ाइन किया गया है, जो टेक्स्ट-आधारित आउटपुट्स उत्पन्न करता है। 300K-टोकन की कंटेक्स्ट विंडो के साथ, यह रियल-टाइम इंटरैक्शन्स, डॉक्यूमेंट एनालिसिस और विजुअल क्वेश्चन आंसरिंग के लिए उपयुक्त है। अमेज़न नोवा फाउंडेशन मॉडल्स के हिस्से के रूप में, यह फाइन-ट्यूनिंग और डिस्टिलेशन को सपोर्ट करता है, जिससे उन्नत कस्टमाइजेशन संभव होता है।
DeepSeek-R1 | Nova Lite | |
---|---|---|
वेबसाइट
| - | |
प्रदाता
| ||
चैट
| ||
रिलीज तिथि
| ||
मोडलिटीज
| टेक्स्ट | टेक्स्ट छवियां वीडियो |
एपीआई प्रदाता
| DeepSeek, HuggingFace | Amazon Bedrock |
ज्ञान समाप्ति तिथि
| अज्ञात | जानबूझकर प्रकट नहीं किया गया |
ओपन सोर्स
| हां | नहीं |
मूल्य निर्धारण इनपुट
| $0.55 प्रति मिलियन टोकन | $0.06 प्रति मिलियन टोकन |
मूल्य निर्धारण आउटपुट
| $2.19 प्रति मिलियन टोकन | $0.24 प्रति मिलियन टोकन |
एमएमएलयू
| 90.8% Pass@1 स्रोत | 80.5% CoT स्रोत |
एमएमएलयू-प्रो
| 84% EM स्रोत | उपलब्ध नहीं |
एमएमएमयू
| - | उपलब्ध नहीं |
हेलास्वैग
| - | उपलब्ध नहीं |
ह्यूमनएवैल
| - | 85.4% pass@1 स्रोत |
मैथ
| - | 73.3% CoT स्रोत |
जीपीक्यूए
| 71.5% Pass@1 स्रोत | 42% Main स्रोत |
आईएफइवैल
| 83.3% Prompt Strict स्रोत | 89.7% स्रोत |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
वैश्विक MMLU (लाइट)
| - | - |
MathVista
| - | - |
मोबाइल एप्लिकेशन | - |
Compare AI. Test. Benchmarks. मोबाइल ऐप्स चैटबॉट्स, Sketch
Copyright © 2025 All Right Reserved.