Grok 3 Beta vs Llama 4 Maverick - LLM Karşılaştırması

Grok 3 Beta

Grok 3, xAI'nin en gelişmiş modeli olup, önceki son teknoloji modellerin hesaplama gücünün 10 katına sahip Colossus süper kümesinde eğitilmiştir. 1M token bağlam penceresi ve gelişmiş akıl yürütme yetenekleri sunar; büyük ölçekli pekiştirmeli öğrenme sayesinde saniyelerden dakikalara uzanan derin düşünme süreçlerini destekleyerek karmaşık problemleri çözme kabiliyetini artırır. Model, akademik ölçütler ve gerçek dünya kullanıcı değerlendirmelerinde en üst seviyede performans göstererek Chatbot Arena'da 1402 Elo puanı kazanmıştır. Grok 3 Mini ile birlikte piyasaya sürülmüştür; bu varyant, optimize edilmiş akıl yürütme süreçleri için maliyet açısından verimli bir seçenektir.

Llama 4 Maverick

LLaMA 4 Maverick, 17 milyar aktif parametreye sahip olup, 128 uzman içeren Mixture-of-Experts mimarisiyle toplamda 400 milyar parametre barındıran son teknoloji bir çok modlu modeldir. GPT-4o ve Gemini 2.0 Flash gibi modelleri birçok ölçütte geride bırakarak sınıfında lider konuma gelmiştir ve akıl yürütme ile kodlama görevlerinde DeepSeek V3 ile eşleşirken, bunu yarısından daha az aktif parametre kullanarak başarmaktadır. Verimlilik ve ölçeklenebilirlik için tasarlanan Maverick, en iyi performans-maliyet oranını sunarak, deneysel sohbet varyantı LMArena'da 1417 ELO puanı elde etmiştir. Ölçeğine rağmen, tek bir NVIDIA H100 ana sunucusunda çalışarak basit ve pratik bir dağıtım sağlamaktadır.

	Grok 3 Beta	Llama 4 Maverick
Web Sitesi ?	Open	Open
Sağlayıcı ?	xAI	Meta
Sohbet ?
Yayın Tarihi ?
Modallikler ?	metin ? görseller ? video ?	metin ? görseller ? video ?
API Sağlayıcıları ?	xAI	Meta AI, Hugging Face, Fireworks, Together, DeepInfra
Bilgi Kesim Tarihi ?	2025-01	2024-08
Açık Kaynak ?	Hayır	Evet (Kaynak)
Fiyatlandırma Girdisi ?	Mevcut değil	Mevcut değil
Fiyatlandırma Çıktısı ?	Mevcut değil	Mevcut değil
MMLU ?	Mevcut değil	Mevcut değil
MMLU-Pro ?	79.9% Base model Kaynak	80.5% Kaynak
MMMU ?	78% With Think mode Kaynak	73.4% Kaynak
HellaSwag ?	Mevcut değil	Mevcut değil
HumanEval ?	Mevcut değil	Mevcut değil
MATH ?	Mevcut değil	Mevcut değil
GPQA ?	84.6% With Think mode, Diamond Kaynak	69.8% Diamond Kaynak
IFEval ?	Mevcut değil	Mevcut değil
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobil Uygulama	Google Play Apple Apps	-
VideoGameBench ?
Toplam puan	-	0%
Doom II	-	0%
Dream DX	-	0%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	%0
Secret Game 2	-	0%
Secret Game 3	-	0%

Grok 3 Beta

Llama 4 Maverick

Web Sitesi ?

Open

Sağlayıcı ?

xAI

VideoGameBench ?

Toplam puan

Doom II

Dream DX

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

LLM Karşılaştırması
Grok 3 Beta vs Llama 4 Maverick

Grok 3 Beta

Llama 4 Maverick

VideoGameBench ?

LLM Karşılaştırması

Yorum Ekle

LLM KarşılaştırmasıGrok 3 Beta vs Llama 4 Maverick

Grok 3 Beta

Llama 4 Maverick

VideoGameBench ?

LLM Karşılaştırması

Yorum Ekle

LLM Karşılaştırması
Grok 3 Beta vs Llama 4 Maverick