Grok 3 Beta

Grok 3, xAI'nin en gelişmiş modeli olup, önceki son teknoloji modellerin hesaplama gücünün 10 katına sahip Colossus süper kümesinde eğitilmiştir. 1M token bağlam penceresi ve gelişmiş akıl yürütme yetenekleri sunar; büyük ölçekli pekiştirmeli öğrenme sayesinde saniyelerden dakikalara uzanan derin düşünme süreçlerini destekleyerek karmaşık problemleri çözme kabiliyetini artırır. Model, akademik ölçütler ve gerçek dünya kullanıcı değerlendirmelerinde en üst seviyede performans göstererek Chatbot Arena'da 1402 Elo puanı kazanmıştır. Grok 3 Mini ile birlikte piyasaya sürülmüştür; bu varyant, optimize edilmiş akıl yürütme süreçleri için maliyet açısından verimli bir seçenektir.

Claude 3.5 Haiku

Anthropic tarafından geliştirilen Claude 3.5 Haiku, 200.000 token'lık bir bağlam penceresi sunar. Girdi başına milyon token için $1 ve çıktı başına $5 ücretlendirme ile gelir; prompt önbellekleme ile %90’a, Message Batches API ile %50’ye varan tasarruf sağlanabilir. 4 Kasım 2024’te yayımlanan bu model, kod tamamlama, etkileşimli sohbet botları, veri çıkarımı ve etiketleme ile gerçek zamanlı içerik denetiminde üstün performans sunar.

Grok 3 BetaClaude 3.5 Haiku
Web Sitesi ?
Sağlayıcı ?
Sohbet ?
Yayın Tarihi ?
Modallikler ?
metin ?
görseller ?
video ?
metin ?
API Sağlayıcıları ?
xAI
Anthropic, AWS Bedrock, Vertex AI
Bilgi Kesim Tarihi ?
2025-01
01.04.2024
Açık Kaynak ?
Hayır
Hayır
Fiyatlandırma Girdisi ?
Mevcut değil
$0.80 milyon belirteç başına
Fiyatlandırma Çıktısı ?
Mevcut değil
$4.00
MMLU ?
Mevcut değil
Mevcut değil
MMLU-Pro ?
79.9%
Base model
Kaynak
65%
0-shot CoT
Kaynak
MMMU ?
78%
With Think mode
Kaynak
Mevcut değil
HellaSwag ?
Mevcut değil
Mevcut değil
HumanEval ?
Mevcut değil
88.1%
0-shot
Kaynak
MATH ?
Mevcut değil
69.4%
0-shot CoT
Kaynak
GPQA ?
84.6%
With Think mode, Diamond
Kaynak
Mevcut değil
IFEval ?
Mevcut değil
Mevcut değil
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobil Uygulama

LLM Karşılaştırması

Yorum Ekle


10%
Sitemiz çerez kullanmaktadır.

Gizlilik ve Çerez Politikası: Bu site çerez kullanır. Siteyi kullanmaya devam ederek, kullanımını kabul etmiş olursunuz.