



Web Sitesi Yapay Zeka Modeli Web Sayfası | |
Sağlayıcı Bu modeli sağlayan kuruluş. | |
Sohbet Sohbete başlamak için bir mesaj yazın | |
Yayın Tarihi Modelin ilk kez ne zaman yayınlandığı. | 11 ay ago Haz 17, 2025 |
Modallikler Bu modelin işleyebileceği veri türleri | metin görseller ses video |
API Sağlayıcıları Bu modeli sunan sağlayıcılar. (Bu liste tamamlayıcı değildir.) | Google AI Studio, Vertex AI, Gemini app |
Bilgi Kesim Tarihi Modelin bilgileri en son ne zaman güncellendi. | - |
Açık Kaynak Modelin kodunun kamuya açık olup olmadığı. | Hayır |
Fiyatlandırma Girdisi Komutlarınızdaki belirteçlerin işlenme maliyeti | $0.10 milyon belirteç başına |
Fiyatlandırma Çıktısı Model tarafından üretilen belirteçlerin maliyeti | $0.40 milyon belirteç başına |
MMLU Massive Multitask Language Understanding – Matematik, tarih, hukuk ve daha fazlası dahil 57 konuda bilgi testi | 81.1% Kaynak |
MMLU-Pro Daha zorlu, akıl yürütmeye odaklanan sorular, daha geniş seçenek seti ve azaltılmış yönlendirme hassasiyeti ile geliştirilmiş MMLU kıyaslaması | - |
MMMU Massive Multitask Multimodal Understanding – Metin, görsel, ses ve video üzerinden anlama testi | 72.9% Kaynak |
HellaSwag Zorlu bir cümle tamamlama kıyaslaması | - |
HumanEval Kod üretimi ve problem çözme yeteneklerini değerlendirir | - |
MATH Farklı zorluk seviyelerinde matematiksel problem çözme yeteneklerini test eder | - |
GPQA Kimya, biyoloji ve fizikte doktora düzeyindeki bilgiyi çoktan seçmeli sorularla test eder; derin alan uzmanlığı gerektirir | 64.6% Diamond Kaynak |
IFEval Modelin açık biçimlendirme talimatlarını doğru bir şekilde takip etme, uygun çıktılar üretme ve farklı görevlerde tutarlı talimat uyumu sağlama yeteneğini test eder | - |
SimpleQA Basit soruların doğruluğunu değerlendirme | 13% Kaynak |
AIME 2024 | - |
AIME 2025 | 49.8% Kaynak |
Aider Polyglot Çok dilli programlama karşılaştırma testi. | - |
LiveCodeBench v5 Gerçek zamanlı programlama karşılaştırma testi | - |
Global MMLU (Lite) Modellerin evrenselliğini küresel ölçekte değerlendirmek için sadeleştirilmiş karşılaştırma testi. | - |
MathVista Yapay zeka modellerinin görsel bağlamlardaki matematiksel akıl yürütme yetilerini değerlendirir | - |
Mobil Uygulama |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2026 All Right Reserved.