Llama 3.3 70B Instruct

टिप्पणियां: 0
Llama 3.3 70B Instruct #0
Llama 3.3 70B Instruct #1
Llama 3.3 70B Instruct #2
Llama 3.3 70B Instruct #3

मेटा द्वारा निर्मित लामा 3.3 70बी इंस्ट्रक्ट, एक बहुभाषी बड़ा भाषा मॉडल है जिसे विशेष रूप से निर्देश-आधारित कार्यों के लिए फाइन-ट्यून किया गया है और वार्तालाप अनुप्रयोगों के लिए अनुकूलित किया गया है। यह 128,000 टोकन तक का समर्थन करने वाली कंटेक्स्ट विंडो के साथ कई भाषाओं में टेक्स्ट को प्रोसेस और जनरेट करने में सक्षम है। 6 दिसंबर, 2024 को लॉन्च किया गया, यह मॉडल विभिन्न उद्योग बेंचमार्क में कई ओपन-सोर्स और प्रोप्राइटरी चैट मॉडल्स को पार करता है। यह स्केलेबिलिटी को बेहतर बनाने के लिए ग्रुप्ड-क्वेरी अटेंशन (जीक्यूए) का उपयोग करता है और सार्वजनिक रूप से उपलब्ध स्रोतों से 15 ट्रिलियन से अधिक टोकन के विविध डेटासेट पर प्रशिक्षित किया गया है। मॉडल का ज्ञान दिसंबर 2023 तक अद्यतन है।

3691
542

कुल रैंकिंग में स्थिति
जून 2026 तक
29
उपयोगकर्ता रेटिंग
https://compare-ai.foundtt.com
3.9

मॉडल अवलोकन

वेबसाइट
एआई मॉडल वेब पेज
प्रदाता
इस मॉडल को प्रदान करने वाली इकाई।
चैट
चैट शुरू करने के लिए एक संदेश दर्ज करें
-
रिलीज तिथि
मॉडल पहली बार कब रिलीज हुआ था।
1 वर्ष ago
दिस 06, 2024
मोडलिटीज
इस मॉडल द्वारा संसाधित किए जा सकने वाले डेटा के प्रकार
टेक्स्ट ?
एपीआई प्रदाता
वे प्रदाता जो इस मॉडल को प्रदान करते हैं। (यह एक पूर्ण सूची नहीं है।)
Fireworks, Together, DeepInfra, Hyperbolic
ज्ञान समाप्ति तिथि
मॉडल का ज्ञान अंतिम बार कब अपडेट किया गया था।
12.2024
ओपन सोर्स
क्या मॉडल का कोड सार्वजनिक उपयोग के लिए उपलब्ध है।
हां
मूल्य निर्धारण इनपुट
आपके प्रॉम्प्ट में टोकन प्रोसेसिंग की लागत
$0.23 प्रति मिलियन टोकन
मूल्य निर्धारण आउटपुट
मॉडल द्वारा उत्पन्न टोकन की लागत
$0.40 प्रति मिलियन टोकन
एमएमएलयू
मैसिव मल्टीटास्क भाषा समझ - गणित, इतिहास, कानून और अन्य सहित 57 विषयों में ज्ञान का परीक्षण
86%
0-shot, CoT
स्रोत
एमएमएलयू-प्रो
अधिक मजबूत एमएमएलयू बेंचमार्क जिसमें कठिन, तर्क-केंद्रित प्रश्न, बड़ा विकल्प सेट, और कम प्रॉम्प्ट संवेदनशीलता शामिल है
68.9%
5-shot, CoT
स्रोत
एमएमएमयू
मैसिव मल्टीटास्क मल्टीमॉडल समझ - टेक्स्ट, छवियों, ऑडियो और वीडियो में समझ का परीक्षण
उपलब्ध नहीं
हेलास्वैग
एक चुनौतीपूर्ण वाक्य पूर्णता बेंचमार्क
उपलब्ध नहीं
ह्यूमनएवैल
कोड जनरेशन और समस्या-समाधान क्षमताओं का मूल्यांकन करता है
88.4%
pass@1
स्रोत
मैथ
विभिन्न कठिनाई स्तरों पर गणितीय समस्या-समाधान क्षमताओं का परीक्षण
77%
0-shot, CoT
स्रोत
जीपीक्यूए
रसायन विज्ञान, जीव विज्ञान और भौतिकी में पीएचडी-स्तर के ज्ञान का बहुविकल्पीय प्रश्नों के माध्यम से परीक्षण जो गहरे डोमेन विशेषज्ञता की आवश्यकता रखते हैं
50.5%
0-shot, CoT
स्रोत
आईएफइवैल
मॉडल की स्पष्ट स्वरूपण निर्देशों का सटीक पालन करने, उपयुक्त आउटपुट उत्पन्न करने, और विभिन्न कार्यों में लगातार निर्देश अनुपालन बनाए रखने की क्षमता का परीक्षण
92.1%
स्रोत
SimpleQA
साधारण प्रश्नों की सटीकता का आकलन
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
बहुभाषी प्रोग्रामिंग बेंचमार्क।
-
LiveCodeBench v5
रीयल-टाइम प्रोग्रामिंग के लिए बेंचमार्क
-
वैश्विक MMLU (लाइट)
वैश्विक स्तर पर मॉडलों की सार्वभौमिकता का आकलन करने के लिए बेंचमार्क का सरलीकृत संस्करण।
-
MathVista
दृश्य संदर्भों में AI मॉडलों की गणितीय तर्क क्षमताओं का मूल्यांकन
-
मोबाइल एप्लिकेशन
-

टिप्पणी जोड़ें

एलएलएम की तुलना करें


10%
हमारी साइट कुकीज़ का उपयोग करती है।

गोपनीयता और कुकी नीति: यह साइट कुकीज़ का उपयोग करती है। साइट का उपयोग जारी रखते हुए, आप उनके उपयोग के लिए सहमत होते हैं।