Grok 3 Beta vs o4-mini - مقارنة نماذج LLM

Grok 3 Beta

جروك 3 هو أحدث نموذج من xAI، تم تدريبه على مجموعة الحواسيب الفائقة كولوسس بقوة حسابية تبلغ 10 أضعاف النماذج المتطورة السابقة. يتميز بنافذة سياقية تبلغ 1 مليون وحدة وقدرات استدلالية متقدمة، معززة من خلال تعلم تعزيزي واسع النطاق، مما يمكنه من عمليات تفكير عميقة تتراوح من ثوانٍ إلى دقائق لحل المشكلات المعقدة. يحقق النموذج أداءً من الطراز الأول في الاختبارات الأكاديمية وتقييمات المستخدمين الواقعية، حيث حصل على درجة إيلو 1402 في ساحة الدردشة الآلية. تم إصداره جنبًا إلى جنب مع جروك 3 ميني، وهو نموذج اقتصادي مُحسّن للاستدلال المبسط.

o4-mini

أو4-ميني من OpenAI هو أحدث نموذج خفيف الوزن في سلسلة o، مصمم للاستدلال الفعال والقادر عبر مهام النصوص والصور. محسن للسرعة والأداء، يتفوق في توليد الأكواد والفهم القائم على الصور، مع الحفاظ على التوازن بين زمن الاستجابة وعمق الاستدلال. يدعم النموذج نافذة سياق تصل إلى 200,000 وحدة مع إخراج يصل إلى 100,000 وحدة، مما يجعله مناسبًا للتفاعلات الممتدة عالية الحجم. يتعامل مع مدخلات النصوص والصور معًا، وينتج مخرجات نصية بقدرات استدلالية متقدمة. بفضل بنيته المدمجة وأدائه المتعدد الاستخدامات، يعتبر o4-mini مثاليًا لمجموعة واسعة من التطبيقات الواقعية التي تتطلب ذكاءً سريعًا وفعالًا من حيث التكلفة.

	Grok 3 Beta	o4-mini
موقع الويب ?	Open	Open
المزود ?	xAI	OpenAI
الدردشة ?
تاريخ الإصدار ?
الوسائط ?	نص ? صور ? فيديو ?	نص ? صور ?
مزودو API ?	xAI	OpenAI API
تاريخ قطع المعرفة ?	2025-01	-
مفتوح المصدر ?	لا	لا
تسعير الإدخال ?	غير متاح	$1.10 لكل مليون رمز
تسعير الإخراج ?	غير متاح	$4.40 لكل مليون رمز
MMLU ?	غير متاح	fort
MMLU-Pro ?	79.9% Base model المصدر	-
MMMU ?	78% With Think mode المصدر	81.6% المصدر
HellaSwag ?	غير متاح	-
HumanEval ?	غير متاح	14.28% المصدر
MATH ?	غير متاح	-
GPQA ?	84.6% With Think mode, Diamond المصدر	81.4% المصدر
IFEval ?	غير متاح	-
SimpleQA ?	-	-
AIME 2024	-	93.4% المصدر
AIME 2025	-	92.7% المصدر
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
تطبيق الجوال	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

o4-mini

موقع الويب ?

Open

المزود ?

xAI

OpenAI

الدردشة ?

تاريخ الإصدار ?

الوسائط ?

نص ?
صور ?
فيديو ?

نص ?
صور ?

مزودو API ?

xAI

OpenAI API

تاريخ قطع المعرفة ?

2025-01

مفتوح المصدر ?

لا

تسعير الإدخال ?

غير متاح

$1.10 لكل مليون رمز

تسعير الإخراج ?

غير متاح

$4.40 لكل مليون رمز

MMLU ?

غير متاح

fort

MMLU-Pro ?

79.9%
Base model
المصدر

MMMU ?

78%
With Think mode
المصدر

81.6%
المصدر

HellaSwag ?

غير متاح

HumanEval ?

غير متاح

14.28%
المصدر

MATH ?

غير متاح

GPQA ?

84.6%
With Think mode, Diamond
المصدر

81.4%
المصدر

IFEval ?

غير متاح

SimpleQA ?

AIME 2024

93.4%
المصدر

AIME 2025

92.7%
المصدر

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

تطبيق الجوال

Google Play
Apple Apps

مقارنة نماذج LLM
Grok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

مقارنة نماذج LLM

إضافة تعليق

مقارنة نماذج LLMGrok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

مقارنة نماذج LLM

إضافة تعليق

مقارنة نماذج LLM
Grok 3 Beta vs o4-mini