Grok 3 Beta

Grok 3, xAI'nin en gelişmiş modeli olup, önceki son teknoloji modellerin hesaplama gücünün 10 katına sahip Colossus süper kümesinde eğitilmiştir. 1M token bağlam penceresi ve gelişmiş akıl yürütme yetenekleri sunar; büyük ölçekli pekiştirmeli öğrenme sayesinde saniyelerden dakikalara uzanan derin düşünme süreçlerini destekleyerek karmaşık problemleri çözme kabiliyetini artırır. Model, akademik ölçütler ve gerçek dünya kullanıcı değerlendirmelerinde en üst seviyede performans göstererek Chatbot Arena'da 1402 Elo puanı kazanmıştır. Grok 3 Mini ile birlikte piyasaya sürülmüştür; bu varyant, optimize edilmiş akıl yürütme süreçleri için maliyet açısından verimli bir seçenektir.

Llama 3.1 Nemotron 70B Instruct

NVIDIA’nın Llama 3.1 Nemotron 70B modeli, doğru ve bilgilendirici yanıtlar sunmak üzere optimize edilmiş güçlü bir dil modelidir. Llama 3.1 70B mimarisi üzerine inşa edilmiş olup, İnsan Geribildirimli Pekiştirmeli Öğrenme (RLHF) ile geliştirilmiştir ve otomatik hizalama kıyaslamalarında en üst performansa ulaşır. Yanıt üretiminde yüksek hassasiyet ve fayda gerektiren uygulamalar için tasarlanmış bu model, çok çeşitli alanlarda kullanıcı sorgularına yanıt verebilir.

Grok 3 BetaLlama 3.1 Nemotron 70B Instruct
Web Sitesi ?
Sağlayıcı ?
Sohbet ?
Yayın Tarihi ?
Modallikler ?
metin ?
görseller ?
video ?
metin ?
API Sağlayıcıları ?
xAI
OpenRouter
Bilgi Kesim Tarihi ?
2025-01
-
Açık Kaynak ?
Hayır
Evet
Fiyatlandırma Girdisi ?
Mevcut değil
$0.35 milyon belirteç başına
Fiyatlandırma Çıktısı ?
Mevcut değil
$0.40 milyon belirteç başına
MMLU ?
Mevcut değil
85%
5-shot
Kaynak
MMLU-Pro ?
79.9%
Base model
Kaynak
Mevcut değil
MMMU ?
78%
With Think mode
Kaynak
Mevcut değil
HellaSwag ?
Mevcut değil
Mevcut değil
HumanEval ?
Mevcut değil
75%
Kaynak
MATH ?
Mevcut değil
71%
Kaynak
GPQA ?
84.6%
With Think mode, Diamond
Kaynak
Mevcut değil
IFEval ?
Mevcut değil
Mevcut değil
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobil Uygulama
-

LLM Karşılaştırması

Yorum Ekle


10%
Sitemiz çerez kullanmaktadır.

Gizlilik ve Çerez Politikası: Bu site çerez kullanır. Siteyi kullanmaya devam ederek, kullanımını kabul etmiş olursunuz.