Grok 3, xAI'nin en gelişmiş modeli olup, önceki son teknoloji modellerin hesaplama gücünün 10 katına sahip Colossus süper kümesinde eğitilmiştir. 1M token bağlam penceresi ve gelişmiş akıl yürütme yetenekleri sunar; büyük ölçekli pekiştirmeli öğrenme sayesinde saniyelerden dakikalara uzanan derin düşünme süreçlerini destekleyerek karmaşık problemleri çözme kabiliyetini artırır. Model, akademik ölçütler ve gerçek dünya kullanıcı değerlendirmelerinde en üst seviyede performans göstererek Chatbot Arena'da 1402 Elo puanı kazanmıştır. Grok 3 Mini ile birlikte piyasaya sürülmüştür; bu varyant, optimize edilmiş akıl yürütme süreçleri için maliyet açısından verimli bir seçenektir.
Command R+, Cohere’in en ileri düzey üretken yapay zeka modeli olup, hız, güvenlik ve çıktı kalitesinin kritik olduğu kurumsal düzeyde performans için tasarlanmıştır. Minimum altyapıyla verimli çalışacak şekilde geliştirilmiş olup, hem yetenek hem de maliyet açısından GPT-4o ve DeepSeek-V3 gibi üst düzey modelleri geride bırakmaktadır. 256K token bağlam penceresi sunarak çoğu lider modelin iki katı genişlikte bir bağlam sağlamakta ve modern iş operasyonları için hayati öneme sahip karmaşık çok dilli ve ajan tabanlı görevlerde üstün performans sergilemektedir. Gücüne rağmen yalnızca iki GPU üzerinde çalıştırılabilir, bu da onu oldukça erişilebilir kılmaktadır. 156 token/saniye gibi son derece hızlı veri işleme kapasitesine sahiptir—GPT-4o’dan yaklaşık 1,75 kat daha hızlı—Command R+, doğruluk veya derinlikten ödün vermeden olağanüstü verimlilik sunmaktadır.
Grok 3 Beta | Command A | |
---|---|---|
Web Sitesi
| ||
Sağlayıcı
| ||
Sohbet
| ||
Yayın Tarihi
| ||
Modallikler
| metin görseller video | metin |
API Sağlayıcıları
| xAI | Cohere, Hugging Face, Major cloud providers |
Bilgi Kesim Tarihi
| 2025-01 | - |
Açık Kaynak
| Hayır | Evet |
Fiyatlandırma Girdisi
| Mevcut değil | $2.50 milyon belirteç başına |
Fiyatlandırma Çıktısı
| Mevcut değil | $10.00 milyon belirteç başına |
MMLU
| Mevcut değil | 85.5% Kaynak |
MMLU-Pro
| 79.9% Base model Kaynak | Mevcut değil |
MMMU
| 78% With Think mode Kaynak | Mevcut değil |
HellaSwag
| Mevcut değil | Mevcut değil |
HumanEval
| Mevcut değil | Mevcut değil |
MATH
| Mevcut değil | 80% Kaynak |
GPQA
| 84.6% With Think mode, Diamond Kaynak | 50.8% Kaynak |
IFEval
| Mevcut değil | 90.9% Kaynak |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Mobil Uygulama | - |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2025 All Right Reserved.