Grok 3 Beta vs Qwen2.5-VL-32B - مقارنة نماذج LLM

Grok 3 Beta

جروك 3 هو أحدث نموذج من xAI، تم تدريبه على مجموعة الحواسيب الفائقة كولوسس بقوة حسابية تبلغ 10 أضعاف النماذج المتطورة السابقة. يتميز بنافذة سياقية تبلغ 1 مليون وحدة وقدرات استدلالية متقدمة، معززة من خلال تعلم تعزيزي واسع النطاق، مما يمكنه من عمليات تفكير عميقة تتراوح من ثوانٍ إلى دقائق لحل المشكلات المعقدة. يحقق النموذج أداءً من الطراز الأول في الاختبارات الأكاديمية وتقييمات المستخدمين الواقعية، حيث حصل على درجة إيلو 1402 في ساحة الدردشة الآلية. تم إصداره جنبًا إلى جنب مع جروك 3 ميني، وهو نموذج اقتصادي مُحسّن للاستدلال المبسط.

Qwen2.5-VL-32B

خلال الأشهر الخمسة الماضية منذ إصدار Qwen2-VL، قام المطورون ببناء نماذج جديدة بناءً عليه، مقدّمين ملاحظات قيّمة. الآن، يقدم Qwen2.5-VL قدرات محسّنة، تشمل التحليل الدقيق للصور والنصوص والرسوم البيانية، بالإضافة إلى تحديد المواقع للكائنات مع مخرجات JSON منظمة. يفهم مقاطع الفيديو الطويلة، ويحدد الأحداث الرئيسية، ويعمل كعميل يتفاعل مع الأدوات على أجهزة الكمبيوتر والهواتف. يتميز هيكل النموذج بمعالجة ديناميكية للفيديو ومشفر ViT مُحسّن لتحسين السرعة والدقة.

	Grok 3 Beta	Qwen2.5-VL-32B
موقع الويب ?	Open	Open
المزود ?	xAI	Alibaba
الدردشة ?
تاريخ الإصدار ?
الوسائط ?	نص ? صور ? فيديو ?	نص ? صور ? فيديو ?
مزودو API ?	xAI	-
تاريخ قطع المعرفة ?	2025-01	غير معروف
مفتوح المصدر ?	لا	نعم (المصدر)
تسعير الإدخال ?	غير متاح	$0
تسعير الإخراج ?	غير متاح	$0
MMLU ?	غير متاح	78.4% المصدر
MMLU-Pro ?	79.9% Base model المصدر	49.5%
MMMU ?	78% With Think mode المصدر	70%
HellaSwag ?	غير متاح	غير متاح
HumanEval ?	غير متاح	غير متاح
MATH ?	غير متاح	82.2%
GPQA ?	84.6% With Think mode, Diamond المصدر	46.0% Diamond
IFEval ?	غير متاح	غير متاح
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
تطبيق الجوال	Google Play Apple Apps	-

Grok 3 Beta

Qwen2.5-VL-32B

موقع الويب ?

Open

المزود ?

xAI

Alibaba

الدردشة ?

تاريخ الإصدار ?

الوسائط ?

نص ?
صور ?
فيديو ?

مزودو API ?

xAI

تاريخ قطع المعرفة ?

2025-01

غير معروف

مفتوح المصدر ?

لا

نعم (المصدر)

تسعير الإدخال ?

غير متاح

تسعير الإخراج ?

غير متاح

MMLU ?

غير متاح

78.4%
المصدر

MMLU-Pro ?

79.9%
Base model
المصدر

49.5%

MMMU ?

78%
With Think mode
المصدر

70%

HellaSwag ?

غير متاح

HumanEval ?

غير متاح

MATH ?

غير متاح

82.2%

GPQA ?

84.6%
With Think mode, Diamond
المصدر

46.0%
Diamond

IFEval ?

غير متاح

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

تطبيق الجوال

Google Play
Apple Apps

مقارنة نماذج LLM
Grok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

Qwen2.5-VL-32B

مقارنة نماذج LLM

إضافة تعليق

مقارنة نماذج LLMGrok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

Qwen2.5-VL-32B

مقارنة نماذج LLM

إضافة تعليق

مقارنة نماذج LLM
Grok 3 Beta vs Qwen2.5-VL-32B