



Son beş ay içinde, Qwen2-VL'nin piyasaya sürülmesinden bu yana geliştiriciler, yeni modeller oluşturup değerli geri bildirimlerde bulundu. Şimdi, Qwen2.5-VL gelişmiş yetenekler sunuyor; görüntüleri, metinleri ve grafikleri hassas bir şekilde analiz edebilir ve yapılandırılmış JSON çıktılarıyla nesne konumlandırma sağlayabilir. Uzun videoları anlayabilir, kilit olayları belirleyebilir ve bilgisayarlar ile telefonlardaki araçlarla etkileşime giren bir ajan olarak işlev görebilir. Modelin mimarisi, dinamik video işleme ve optimize edilmiş ViT kodlayıcı ile daha yüksek hız ve doğruluk sunar.
Web Sitesi Yapay Zeka Modeli Web Sayfası | |
Sağlayıcı Bu modeli sağlayan kuruluş. | |
Sohbet Sohbete başlamak için bir mesaj yazın | - |
Yayın Tarihi Modelin ilk kez ne zaman yayınlandığı. | 1 yıl ago Mar 25, 2025 |
Modallikler Bu modelin işleyebileceği veri türleri | metin görseller video |
API Sağlayıcıları Bu modeli sunan sağlayıcılar. (Bu liste tamamlayıcı değildir.) | - |
Bilgi Kesim Tarihi Modelin bilgileri en son ne zaman güncellendi. | Bilinmiyor |
Açık Kaynak Modelin kodunun kamuya açık olup olmadığı. | Evet (Kaynak) |
Fiyatlandırma Girdisi Komutlarınızdaki belirteçlerin işlenme maliyeti | $0 |
Fiyatlandırma Çıktısı Model tarafından üretilen belirteçlerin maliyeti | $0 |
MMLU Massive Multitask Language Understanding – Matematik, tarih, hukuk ve daha fazlası dahil 57 konuda bilgi testi | 78.4% Kaynak |
MMLU-Pro Daha zorlu, akıl yürütmeye odaklanan sorular, daha geniş seçenek seti ve azaltılmış yönlendirme hassasiyeti ile geliştirilmiş MMLU kıyaslaması | 49.5% |
MMMU Massive Multitask Multimodal Understanding – Metin, görsel, ses ve video üzerinden anlama testi | 70% |
HellaSwag Zorlu bir cümle tamamlama kıyaslaması | Mevcut değil |
HumanEval Kod üretimi ve problem çözme yeteneklerini değerlendirir | Mevcut değil |
MATH Farklı zorluk seviyelerinde matematiksel problem çözme yeteneklerini test eder | 82.2% |
GPQA Kimya, biyoloji ve fizikte doktora düzeyindeki bilgiyi çoktan seçmeli sorularla test eder; derin alan uzmanlığı gerektirir | 46.0% Diamond |
IFEval Modelin açık biçimlendirme talimatlarını doğru bir şekilde takip etme, uygun çıktılar üretme ve farklı görevlerde tutarlı talimat uyumu sağlama yeteneğini test eder | Mevcut değil |
SimpleQA Basit soruların doğruluğunu değerlendirme | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Çok dilli programlama karşılaştırma testi. | - |
LiveCodeBench v5 Gerçek zamanlı programlama karşılaştırma testi | - |
Global MMLU (Lite) Modellerin evrenselliğini küresel ölçekte değerlendirmek için sadeleştirilmiş karşılaştırma testi. | - |
MathVista Yapay zeka modellerinin görsel bağlamlardaki matematiksel akıl yürütme yetilerini değerlendirir | - |
Mobil Uygulama | - |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2026 All Right Reserved.