




جروك 3 هو أحدث نموذج من xAI، تم تدريبه على مجموعة الحواسيب الفائقة كولوسس بقوة حسابية تبلغ 10 أضعاف النماذج المتطورة السابقة. يتميز بنافذة سياقية تبلغ 1 مليون وحدة وقدرات استدلالية متقدمة، معززة من خلال تعلم تعزيزي واسع النطاق، مما يمكنه من عمليات تفكير عميقة تتراوح من ثوانٍ إلى دقائق لحل المشكلات المعقدة. يحقق النموذج أداءً من الطراز الأول في الاختبارات الأكاديمية وتقييمات المستخدمين الواقعية، حيث حصل على درجة إيلو 1402 في ساحة الدردشة الآلية. تم إصداره جنبًا إلى جنب مع جروك 3 ميني، وهو نموذج اقتصادي مُحسّن للاستدلال المبسط.
موقع الويب صفحة نموذج الذكاء الاصطناعي على الويب | |
المزود الكيان الذي يوفر هذا النموذج. | |
الدردشة أدخل رسالة لبدء الدردشة | |
تاريخ الإصدار تاريخ الإصدار الأول للنموذج. | 1 سنة ago ينا 19, 2025 |
الوسائط أنواع البيانات التي يمكن لهذا النموذج معالجتها | نص صور فيديو |
مزودو API المزودون الذين يقدمون هذا النموذج. (هذه ليست قائمة شاملة.) | xAI |
تاريخ قطع المعرفة تاريخ آخر تحديث لمعرفة النموذج. | 2025-01 |
مفتوح المصدر ما إذا كان كود النموذج متاحًا للاستخدام العام. | لا |
تسعير الإدخال تكلفة معالجة الرموز في مطالباتك | غير متاح |
تسعير الإخراج تكلفة الرموز التي يولدها النموذج | غير متاح |
MMLU فهم اللغة متعدد المهام الضخم - يختبر المعرفة عبر 57 موضوعًا بما في ذلك الرياضيات والتاريخ والقانون والمزيد | غير متاح |
MMLU-Pro معيار MMLU أكثر قوة مع أسئلة أكثر صعوبة تركز على التفكير، ومجموعة اختيار أكبر، وتقليل حساسية المطالبة | 79.9% Base model المصدر |
MMMU فهم متعدد المهام والوسائط الضخم - يختبر الفهم عبر النصوص والصور والصوت والفيديو | 78% With Think mode المصدر |
HellaSwag معيار إكمال الجمل الصعب | غير متاح |
HumanEval يقيم قدرات توليد الكود وحل المشكلات | غير متاح |
MATH يختبر قدرات حل المشكلات الرياضية عبر مستويات صعوبة مختلفة | غير متاح |
GPQA يختبر المعرفة على مستوى الدكتوراه في الكيمياء والأحياء والفيزياء من خلال أسئلة متعددة الخيارات تتطلب خبرة عميقة في المجال | 84.6% With Think mode, Diamond المصدر |
IFEval يختبر قدرة النموذج على اتباع تعليمات التنسيق الصريحة بدقة، وتوليد مخرجات مناسبة، والحفاظ على الالتزام بالتعليمات عبر مهام مختلفة | غير متاح |
SimpleQA تقييم دقة الأسئلة البسيطة | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot معيار البرمجة متعدد اللغات. | - |
LiveCodeBench v5 معيار للبرمجة في الوقت الحقيقي | - |
Global MMLU (Lite) نسخة مبسطة من المعيار لتقييم عالمية النماذج على المستوى العالمي. | - |
MathVista تقييم قدرات التفكير الرياضي لنماذج الذكاء الاصطناعي في سياقات بصرية | - |
تطبيق الجوال |
Compare AI. Test. Benchmarks. تطبيبات دردشة الجوال, Sketch
Copyright © 2026 All Right Reserved.
تعليقات (1)
Pierre
09 أبريل 2026Ziet er goed uit