Son beş ay içinde, Qwen2-VL'nin piyasaya sürülmesinden bu yana geliştiriciler, yeni modeller oluşturup değerli geri bildirimlerde bulundu. Şimdi, Qwen2.5-VL gelişmiş yetenekler sunuyor; görüntüleri, metinleri ve grafikleri hassas bir şekilde analiz edebilir ve yapılandırılmış JSON çıktılarıyla nesne konumlandırma sağlayabilir. Uzun videoları anlayabilir, kilit olayları belirleyebilir ve bilgisayarlar ile telefonlardaki araçlarla etkileşime giren bir ajan olarak işlev görebilir. Modelin mimarisi, dinamik video işleme ve optimize edilmiş ViT kodlayıcı ile daha yüksek hız ve doğruluk sunar.
Meta tarafından geliştirilen Llama 3.3 70B Instruct, özellikle talimat temelli görevler için ince ayar yapılmış çok dilli büyük bir dil modelidir ve sohbet uygulamaları için optimize edilmiştir. 128.000 token’a kadar destekleyen bir bağlam penceresiyle birçok dili işleyip üretebilir. 6 Aralık 2024’te piyasaya sürülen model, çeşitli sektör kıyaslamalarında birçok açık kaynaklı ve özel sohbet modelini geride bırakmıştır. Ölçeklenebilirliği artırmak için Grup Sorgu Dikkati (GQA) kullanır ve 15 trilyon token’dan fazla halka açık verilerden oluşan çeşitli bir veri kümesiyle eğitilmiştir. Modelin bilgi kapsamı Aralık 2023’e kadardır.
Qwen2.5-VL-32B | Llama 3.3 70B Instruct | |
---|---|---|
Web Sitesi
| ||
Sağlayıcı
| ||
Sohbet
| ||
Yayın Tarihi
| ||
Modallikler
| metin görseller video | metin |
API Sağlayıcıları
| - | Fireworks, Together, DeepInfra, Hyperbolic |
Bilgi Kesim Tarihi
| Bilinmiyor | 12.2024 |
Açık Kaynak
| Evet (Kaynak) | Evet |
Fiyatlandırma Girdisi
| $0 | $0.23 milyon belirteç başına |
Fiyatlandırma Çıktısı
| $0 | $0.40 milyon belirteç başına |
MMLU
| 78.4% Kaynak | 86% 0-shot, CoT Kaynak |
MMLU-Pro
| 49.5% | 68.9% 5-shot, CoT Kaynak |
MMMU
| 70% | Mevcut değil |
HellaSwag
| Mevcut değil | Mevcut değil |
HumanEval
| Mevcut değil | 88.4% pass@1 Kaynak |
MATH
| 82.2% | 77% 0-shot, CoT Kaynak |
GPQA
| 46.0% Diamond | 50.5% 0-shot, CoT Kaynak |
IFEval
| Mevcut değil | 92.1% Kaynak |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Mobil Uygulama | - | - |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2025 All Right Reserved.