Grok 3, xAI'nin en gelişmiş modeli olup, önceki son teknoloji modellerin hesaplama gücünün 10 katına sahip Colossus süper kümesinde eğitilmiştir. 1M token bağlam penceresi ve gelişmiş akıl yürütme yetenekleri sunar; büyük ölçekli pekiştirmeli öğrenme sayesinde saniyelerden dakikalara uzanan derin düşünme süreçlerini destekleyerek karmaşık problemleri çözme kabiliyetini artırır. Model, akademik ölçütler ve gerçek dünya kullanıcı değerlendirmelerinde en üst seviyede performans göstererek Chatbot Arena'da 1402 Elo puanı kazanmıştır. Grok 3 Mini ile birlikte piyasaya sürülmüştür; bu varyant, optimize edilmiş akıl yürütme süreçleri için maliyet açısından verimli bir seçenektir.
Gemini 2.0 Pro, şimdiye kadarki en gelişmiş Google modelidir; olağanüstü kodlama performansı ve karmaşık komutlarla başa çıkma yeteneği sunar. Yerel araç entegrasyonu, görsel üretim ve konuşma sentezi gibi gelişmiş özelliklerle donatılmıştır. Gelişmiş akıl yürütme için tasarlanmış bu model, metin, görsel, video ve ses dahil olmak üzere çok modlu girdileri destekler. Google AI Studio ve Vertex AI üzerinden erişilebilen model, önceki sürümlere kıyasla önemli performans iyileştirmeleri sunarken yüksek verimliliğini korur.
Grok 3 Beta | Gemini 2.0 Pro | |
---|---|---|
Web Sitesi
| ||
Sağlayıcı
| ||
Sohbet
| ||
Yayın Tarihi
| ||
Modallikler
| metin görseller video | metin görseller ses video |
API Sağlayıcıları
| xAI | Google AI Studio, Vertex AI |
Bilgi Kesim Tarihi
| 2025-01 | 08.2024 |
Açık Kaynak
| Hayır | Hayır |
Fiyatlandırma Girdisi
| Mevcut değil | $0.10 milyon belirteç başına |
Fiyatlandırma Çıktısı
| Mevcut değil | $0.40 milyon belirteç başına |
MMLU
| Mevcut değil | Mevcut değil |
MMLU-Pro
| 79.9% Base model Kaynak | 79.1% Kaynak |
MMMU
| 78% With Think mode Kaynak | 72.7% Kaynak |
HellaSwag
| Mevcut değil | Mevcut değil |
HumanEval
| Mevcut değil | Mevcut değil |
MATH
| Mevcut değil | 91.8% Kaynak |
GPQA
| 84.6% With Think mode, Diamond Kaynak | 64.7% Diamond Kaynak |
IFEval
| Mevcut değil | Mevcut değil |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Mobil Uygulama |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2025 All Right Reserved.