


Web Sitesi Yapay Zeka Modeli Web Sayfası | |
Sağlayıcı Bu modeli sağlayan kuruluş. | |
Sohbet Sohbete başlamak için bir mesaj yazın | |
Yayın Tarihi Modelin ilk kez ne zaman yayınlandığı. | 1 yıl ago May 22, 2025 |
Modallikler Bu modelin işleyebileceği veri türleri | metin görseller |
API Sağlayıcıları Bu modeli sunan sağlayıcılar. (Bu liste tamamlayıcı değildir.) | Anthropic API, Amazon Bedrock, Google Cloud's Vertex AI |
Bilgi Kesim Tarihi Modelin bilgileri en son ne zaman güncellendi. | Bilinmiyor |
Açık Kaynak Modelin kodunun kamuya açık olup olmadığı. | Hayır |
Fiyatlandırma Girdisi Komutlarınızdaki belirteçlerin işlenme maliyeti | $3 milyon belirteç başına |
Fiyatlandırma Çıktısı Model tarafından üretilen belirteçlerin maliyeti | $15 milyon belirteç başına |
MMLU Massive Multitask Language Understanding – Matematik, tarih, hukuk ve daha fazlası dahil 57 konuda bilgi testi | 86.5% Kaynak |
MMLU-Pro Daha zorlu, akıl yürütmeye odaklanan sorular, daha geniş seçenek seti ve azaltılmış yönlendirme hassasiyeti ile geliştirilmiş MMLU kıyaslaması | - |
MMMU Massive Multitask Multimodal Understanding – Metin, görsel, ses ve video üzerinden anlama testi | 74.4% Kaynak |
HellaSwag Zorlu bir cümle tamamlama kıyaslaması | - |
HumanEval Kod üretimi ve problem çözme yeteneklerini değerlendirir | - |
MATH Farklı zorluk seviyelerinde matematiksel problem çözme yeteneklerini test eder | - |
GPQA Kimya, biyoloji ve fizikte doktora düzeyindeki bilgiyi çoktan seçmeli sorularla test eder; derin alan uzmanlığı gerektirir | 75.4% Diamond Kaynak |
IFEval Modelin açık biçimlendirme talimatlarını doğru bir şekilde takip etme, uygun çıktılar üretme ve farklı görevlerde tutarlı talimat uyumu sağlama yeteneğini test eder | - |
SimpleQA Basit soruların doğruluğunu değerlendirme | - |
AIME 2024 | - |
AIME 2025 | 75.5% Kaynak |
Aider Polyglot Çok dilli programlama karşılaştırma testi. | - |
LiveCodeBench v5 Gerçek zamanlı programlama karşılaştırma testi | - |
Global MMLU (Lite) Modellerin evrenselliğini küresel ölçekte değerlendirmek için sadeleştirilmiş karşılaştırma testi. | - |
MathVista Yapay zeka modellerinin görsel bağlamlardaki matematiksel akıl yürütme yetilerini değerlendirir | - |
Mobil Uygulama |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2026 All Right Reserved.