DeepSeek-R1

डीपसीक-आर1 एक 671B पैरामीटर वाला मिश्रण-विशेषज्ञ (MoE) मॉडल है जिसमें प्रति टोकन 37B सक्रिय पैरामीटर हैं, जिसे तर्क क्षमताओं पर ध्यान केंद्रित करते हुए बड़े पैमाने पर रीइन्फोर्समेंट लर्निंग के माध्यम से प्रशिक्षित किया गया है। यह बेहतर तर्क पैटर्न खोजने और मानव प्राथमिकताओं के साथ संरेखित करने के लिए दो आरएल चरणों के साथ-साथ तर्क और गैर-तर्क क्षमताओं को बीजित करने के लिए दो एसएफटी चरणों को शामिल करता है। यह मॉडल गणित, कोड और तर्क कार्यों में OpenAI-o1 के बराबर प्रदर्शन प्राप्त करता है।

Qwen2.5-VL-32B

Qwen2-VL के रिलीज के बाद पिछले पांच महीनों में, डेवलपर्स ने इस पर आधारित नए मॉडल बनाए हैं, जिन्होंने मूल्यवान फीडबैक दिया है। अब, Qwen2.5-VL में छवियों, पाठ और चार्ट का सटीक विश्लेषण, साथ ही संरचित JSON आउटपुट के साथ वस्तु स्थानीकरण जैसी उन्नत क्षमताएं शामिल हैं। यह लंबे वीडियो को समझता है, प्रमुख घटनाओं की पहचान करता है और एक एजेंट के रूप में कार्य करते हुए कंप्यूटर और फोन पर टूल्स के साथ इंटरैक्ट करता है। मॉडल की आर्किटेक्चर में गति और सटीकता में सुधार के लिए डायनामिक वीडियो प्रोसेसिंग और एक ऑप्टिमाइज्ड ViT एनकोडर शामिल है।

DeepSeek-R1Qwen2.5-VL-32B
वेबसाइट ?
प्रदाता ?
चैट ?
रिलीज तिथि ?
मोडलिटीज ?
टेक्स्ट ?
टेक्स्ट ?
छवियां ?
वीडियो ?
एपीआई प्रदाता ?
DeepSeek, HuggingFace
-
ज्ञान समाप्ति तिथि ?
अज्ञात
अज्ञात
ओपन सोर्स ?
हां
हां (स्रोत)
मूल्य निर्धारण इनपुट ?
$0.55 प्रति मिलियन टोकन
$0
मूल्य निर्धारण आउटपुट ?
$2.19 प्रति मिलियन टोकन
$0
एमएमएलयू ?
90.8%
Pass@1
स्रोत
78.4%
स्रोत
एमएमएलयू-प्रो ?
84%
EM
स्रोत
49.5%
एमएमएमयू ?
-
70%
हेलास्वैग ?
-
उपलब्ध नहीं
ह्यूमनएवैल ?
-
उपलब्ध नहीं
मैथ ?
-
82.2%
जीपीक्यूए ?
71.5%
Pass@1
स्रोत
46.0%
Diamond
आईएफइवैल ?
83.3%
Prompt Strict
स्रोत
उपलब्ध नहीं
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
वैश्विक MMLU (लाइट) ?
-
-
MathVista ?
-
-
मोबाइल एप्लिकेशन
-

MathArena ?

औसत स्कोर
82%
-
AIME 2025
अमेरिकन इनविटेशनल मैथमेटिक्स एग्जामिनेशन (American Invitational Mathematics Examination) के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
89%
-
HMMT February 2025
फरवरी 2025 हार्वर्ड-MIT गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
77%
-
BRUMO 2025
92%
-
SMT 2025
2025 स्टैनफोर्ड गणित टूर्नामेंट के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
83%
-
CMIMC 2025
2025 कैनेडियन मैथमैटिकल ओलंपियाड के प्रश्नों पर आधारित परीक्षण, मॉडल की गणितीय क्षमताओं को परखने के लिए बनाया गया है।
69%
-

एलएलएम की तुलना करें

टिप्पणियां (1)

  1. Jacquie

    27 जनवरी 2026

    Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

टिप्पणी जोड़ें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।