
Llama 3.3 70B Instruct، من تطوير Meta، هو نموذج لغوي كبير متعدد اللغات تم ضبطه خصيصًا للمهام القائمة على التعليمات ومُحسّن للتطبيقات المحادثة. يمكنه معالجة وإنشاء نصوص بلغات متعددة، مع نافذة سياقية تدعم حتى 128,000 وحدة. تم إطلاقه في 6 ديسمبر 2024، ويتفوق النموذج على العديد من نماذج الدردشة مفتوحة المصدر والخاصة في معايير الصناعة المختلفة. يستخدم الانتباه الاستعلامي المجمع (GQA) لتحسين قابلية التوسع، وتم تدريبه على مجموعة بيانات متنوعة تضم أكثر من 15 تريليون وحدة من مصادر متاحة للجمهور. معرفة النموذج محدثة حتى ديسمبر 2023.
| Grok 4 | Llama 3.3 70B Instruct | |
|---|---|---|
موقع الويب
| ||
المزود
| ||
الدردشة
| ||
تاريخ الإصدار
| ||
الوسائط
| نص صور صوت فيديو | نص |
مزودو API
| xAI | Fireworks, Together, DeepInfra, Hyperbolic |
تاريخ قطع المعرفة
| - | 12.2024 |
مفتوح المصدر
| لا | نعم |
تسعير الإدخال
| $3.00 لكل مليون رمز | $0.23 لكل مليون رمز |
تسعير الإخراج
| $15.00 لكل مليون رمز | $0.40 لكل مليون رمز |
MMLU
| - | 86% 0-shot, CoT المصدر |
MMLU-Pro
| - | 68.9% 5-shot, CoT المصدر |
MMMU
| - | غير متاح |
HellaSwag
| - | غير متاح |
HumanEval
| - | 88.4% pass@1 المصدر |
MATH
| - | 77% 0-shot, CoT المصدر |
GPQA
| 87.5% Science المصدر | 50.5% 0-shot, CoT المصدر |
IFEval
| - | 92.1% المصدر |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | 91.7% Competition Math المصدر | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| 79% Competitive Coding المصدر | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
تطبيق الجوال | - | |
MathArena | ||
| المعدل المتوسط | 89% | - |
AIME 2025 اختبار قائم على مسائل من مسابقة الرياضيات (American Invitational Mathematics Examination) يهدف إلى تقييم المهارات الرياضية للنماذج. | 91% | - |
HMMT February 2025 اختبار قائم على مسائل من بطولة هارفارد-MIT للرياضيات، فبراير 2025، يهدف إلى تقييم المهارات الرياضية للنماذج. | 92% | - |
BRUMO 2025 | 95% | - |
SMT 2025 اختبار قائم على مسائل من بطولة ستانفورد للرياضيات، 2025، يهدف إلى تقييم المهارات الرياضية للنماذج. | 86% | - |
CMIMC 2025 اختبار قائم على مسائل من أولمبياد الرياضيات الكندي، 2025، يهدف إلى تقييم المهارات الرياضية للنماذج. | 83% | - |
Compare AI. Test. Benchmarks. تطبيبات دردشة الجوال, Sketch
Copyright © 2026 All Right Reserved.