
أو4-ميني من OpenAI هو أحدث نموذج خفيف الوزن في سلسلة o، مصمم للاستدلال الفعال والقادر عبر مهام النصوص والصور. محسن للسرعة والأداء، يتفوق في توليد الأكواد والفهم القائم على الصور، مع الحفاظ على التوازن بين زمن الاستجابة وعمق الاستدلال. يدعم النموذج نافذة سياق تصل إلى 200,000 وحدة مع إخراج يصل إلى 100,000 وحدة، مما يجعله مناسبًا للتفاعلات الممتدة عالية الحجم. يتعامل مع مدخلات النصوص والصور معًا، وينتج مخرجات نصية بقدرات استدلالية متقدمة. بفضل بنيته المدمجة وأدائه المتعدد الاستخدامات، يعتبر o4-mini مثاليًا لمجموعة واسعة من التطبيقات الواقعية التي تتطلب ذكاءً سريعًا وفعالًا من حيث التكلفة.
ميسترال لارج 2، المطور من قبل ميسترال، يوفر نافذة سياقية تبلغ 128 ألف وحدة وسعرها 3.00 دولار لكل مليون وحدة إدخال و9.00 دولار لكل مليون وحدة إخراج. تم إصداره في 24 يوليو 2024، وحقق النموذج درجة 84.0 في اختبار MMLU بتقييم 5-shot، مما يظهر أداءً قويًا في مهام متنوعة.
| o4-mini | Mistral Large 2 | |
|---|---|---|
موقع الويب
| ||
المزود
| ||
الدردشة
| ||
تاريخ الإصدار
| ||
الوسائط
| نص صور | نص |
مزودو API
| OpenAI API | Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex |
تاريخ قطع المعرفة
| - | غير معروف |
مفتوح المصدر
| لا | نعم |
تسعير الإدخال
| $1.10 لكل مليون رمز | $3.00 لكل مليون رمز |
تسعير الإخراج
| $4.40 لكل مليون رمز | $9.00 لكل مليون رمز |
MMLU
| fort | 84% 5-shot المصدر |
MMLU-Pro
| - | 50.69% المصدر |
MMMU
| 81.6% المصدر | غير متاح |
HellaSwag
| - | غير متاح |
HumanEval
| 14.28% المصدر | غير متاح |
MATH
| - | 1.13% المصدر |
GPQA
| 81.4% المصدر | 24.94% |
IFEval
| - | 84.01% |
SimpleQA
| - | - |
AIME 2024 | 93.4% المصدر | - |
AIME 2025 | 92.7% المصدر | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
تطبيق الجوال | - | |
MathArena | ||
| المعدل المتوسط | 87% | - |
AIME 2025 اختبار قائم على مسائل من مسابقة الرياضيات (American Invitational Mathematics Examination) يهدف إلى تقييم المهارات الرياضية للنماذج. | 92% | - |
HMMT February 2025 اختبار قائم على مسائل من بطولة هارفارد-MIT للرياضيات، فبراير 2025، يهدف إلى تقييم المهارات الرياضية للنماذج. | 83% | - |
BRUMO 2025 | 87% | - |
SMT 2025 اختبار قائم على مسائل من بطولة ستانفورد للرياضيات، 2025، يهدف إلى تقييم المهارات الرياضية للنماذج. | 89% | - |
CMIMC 2025 اختبار قائم على مسائل من أولمبياد الرياضيات الكندي، 2025، يهدف إلى تقييم المهارات الرياضية للنماذج. | 84% | - |
Compare AI. Test. Benchmarks. تطبيبات دردشة الجوال, Sketch
Copyright © 2026 All Right Reserved.