Mistral Large 2

تعليقات: 0
Mistral Large 2 #0
Mistral Large 2 #1
Mistral Large 2 #2
Mistral Large 2 #3

ميسترال لارج 2، المطور من قبل ميسترال، يوفر نافذة سياقية تبلغ 128 ألف وحدة وسعرها 3.00 دولار لكل مليون وحدة إدخال و9.00 دولار لكل مليون وحدة إخراج. تم إصداره في 24 يوليو 2024، وحقق النموذج درجة 84.0 في اختبار MMLU بتقييم 5-shot، مما يظهر أداءً قويًا في مهام متنوعة.

4923
871

المركز في التصنيف العام اعتبارًا من
يونيو 2026
34
تقييم المستخدمين
https://compare-ai.foundtt.com
3.8

نظرة عامة على النموذج

موقع الويب
صفحة نموذج الذكاء الاصطناعي على الويب
المزود
الكيان الذي يوفر هذا النموذج.
الدردشة
أدخل رسالة لبدء الدردشة
-
تاريخ الإصدار
تاريخ الإصدار الأول للنموذج.
1 سنة ago
يون 24, 2024
الوسائط
أنواع البيانات التي يمكن لهذا النموذج معالجتها
نص ?
مزودو API
المزودون الذين يقدمون هذا النموذج. (هذه ليست قائمة شاملة.)
Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex
تاريخ قطع المعرفة
تاريخ آخر تحديث لمعرفة النموذج.
غير معروف
مفتوح المصدر
ما إذا كان كود النموذج متاحًا للاستخدام العام.
نعم
تسعير الإدخال
تكلفة معالجة الرموز في مطالباتك
$3.00 لكل مليون رمز
تسعير الإخراج
تكلفة الرموز التي يولدها النموذج
$9.00 لكل مليون رمز
MMLU
فهم اللغة متعدد المهام الضخم - يختبر المعرفة عبر 57 موضوعًا بما في ذلك الرياضيات والتاريخ والقانون والمزيد
84%
5-shot
المصدر
MMLU-Pro
معيار MMLU أكثر قوة مع أسئلة أكثر صعوبة تركز على التفكير، ومجموعة اختيار أكبر، وتقليل حساسية المطالبة
50.69%
المصدر
MMMU
فهم متعدد المهام والوسائط الضخم - يختبر الفهم عبر النصوص والصور والصوت والفيديو
غير متاح
HellaSwag
معيار إكمال الجمل الصعب
غير متاح
HumanEval
يقيم قدرات توليد الكود وحل المشكلات
غير متاح
MATH
يختبر قدرات حل المشكلات الرياضية عبر مستويات صعوبة مختلفة
1.13%
المصدر
GPQA
يختبر المعرفة على مستوى الدكتوراه في الكيمياء والأحياء والفيزياء من خلال أسئلة متعددة الخيارات تتطلب خبرة عميقة في المجال
24.94%
IFEval
يختبر قدرة النموذج على اتباع تعليمات التنسيق الصريحة بدقة، وتوليد مخرجات مناسبة، والحفاظ على الالتزام بالتعليمات عبر مهام مختلفة
84.01%
SimpleQA
تقييم دقة الأسئلة البسيطة
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
معيار البرمجة متعدد اللغات.
-
LiveCodeBench v5
معيار للبرمجة في الوقت الحقيقي
-
Global MMLU (Lite)
نسخة مبسطة من المعيار لتقييم عالمية النماذج على المستوى العالمي.
-
MathVista
تقييم قدرات التفكير الرياضي لنماذج الذكاء الاصطناعي في سياقات بصرية
-
تطبيق الجوال
-

إضافة تعليق

مقارنة نماذج LLM


10%
يستخدم موقعنا ملفات تعريف الارتباط.

سياسة الخصوصية وملفات تعريف الارتباط: يستخدم هذا الموقع ملفات تعريف الارتباط. باستخدامك المستمر للموقع، فإنك توافق على استخدامها.