Grok 3 Beta vs Gemini 2.0 Flash Thinking - مقارنة نماذج LLM

Grok 3 Beta

جروك 3 هو أحدث نموذج من xAI، تم تدريبه على مجموعة الحواسيب الفائقة كولوسس بقوة حسابية تبلغ 10 أضعاف النماذج المتطورة السابقة. يتميز بنافذة سياقية تبلغ 1 مليون وحدة وقدرات استدلالية متقدمة، معززة من خلال تعلم تعزيزي واسع النطاق، مما يمكنه من عمليات تفكير عميقة تتراوح من ثوانٍ إلى دقائق لحل المشكلات المعقدة. يحقق النموذج أداءً من الطراز الأول في الاختبارات الأكاديمية وتقييمات المستخدمين الواقعية، حيث حصل على درجة إيلو 1402 في ساحة الدردشة الآلية. تم إصداره جنبًا إلى جنب مع جروك 3 ميني، وهو نموذج اقتصادي مُحسّن للاستدلال المبسط.

Gemini 2.0 Flash Thinking

جيميني 2.0 فلاش ثينكينج هو نموذج استدلالي متقدم مصمم لتعزيز الأداء والقدرة على الشرح من خلال جعل عملية تفكيره مرئية. يتفوق في حل المشكلات المعقدة، وتحديات البرمجة، والاستدلال الرياضي، مع إظهار حلول خطوة بخطوة. محسن للمهام التي تتطلب تفسيرات مفصلة وتحليلاً منطقيًا، ويتميز أيضًا بتكامل أدوات أصيلة، بما في ذلك تنفيذ الأكواد وإمكانيات البحث في جوجل.

	Grok 3 Beta	Gemini 2.0 Flash Thinking
موقع الويب ?	Open	Open
المزود ?	xAI	Google
الدردشة ?
تاريخ الإصدار ?
الوسائط ?	نص ? صور ? فيديو ?	نص ? صور ?
مزودو API ?	xAI	Google AI Studio, Vertex AI, Gemini API
تاريخ قطع المعرفة ?	2025-01	04.2024
مفتوح المصدر ?	لا	لا
تسعير الإدخال ?	غير متاح	غير متاح
تسعير الإخراج ?	غير متاح	غير متاح
MMLU ?	غير متاح	غير متاح
MMLU-Pro ?	79.9% Base model المصدر	غير متاح
MMMU ?	78% With Think mode المصدر	75.4% المصدر
HellaSwag ?	غير متاح	غير متاح
HumanEval ?	غير متاح	غير متاح
MATH ?	غير متاح	غير متاح
GPQA ?	84.6% With Think mode, Diamond المصدر	74.2% Diamond Science المصدر
IFEval ?	غير متاح	غير متاح
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
تطبيق الجوال	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

Gemini 2.0 Flash Thinking

موقع الويب ?

Open

المزود ?

xAI

Google

الدردشة ?

تاريخ الإصدار ?

الوسائط ?

نص ?
صور ?
فيديو ?

نص ?
صور ?

مزودو API ?

xAI

Google AI Studio, Vertex AI, Gemini API

تاريخ قطع المعرفة ?

2025-01

04.2024

مفتوح المصدر ?

لا

تسعير الإدخال ?

غير متاح

تسعير الإخراج ?

غير متاح

MMLU ?

غير متاح

MMLU-Pro ?

79.9%
Base model
المصدر

غير متاح

MMMU ?

78%
With Think mode
المصدر

75.4%
المصدر

HellaSwag ?

غير متاح

HumanEval ?

غير متاح

MATH ?

غير متاح

GPQA ?

84.6%
With Think mode, Diamond
المصدر

74.2%
Diamond Science
المصدر

IFEval ?

غير متاح

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

تطبيق الجوال

Google Play
Apple Apps

مقارنة نماذج LLM
Grok 3 Beta vs Gemini 2.0 Flash Thinking

Grok 3 Beta

Gemini 2.0 Flash Thinking

مقارنة نماذج LLM

إضافة تعليق

مقارنة نماذج LLMGrok 3 Beta vs Gemini 2.0 Flash Thinking

Grok 3 Beta

Gemini 2.0 Flash Thinking

مقارنة نماذج LLM

إضافة تعليق

مقارنة نماذج LLM
Grok 3 Beta vs Gemini 2.0 Flash Thinking