



DeepSeek-R1, token başına 37B etkin parametreye sahip 671B parametreli bir Uzman Karışımı (MoE) modelidir ve büyük ölçekli pekiştirmeli öğrenme ile özellikle akıl yürütme yeteneklerine odaklanılarak eğitilmiştir. Model, geliştirilmiş akıl yürütme kalıplarını keşfetmek ve insan tercihleriyle uyum sağlamak için iki RL aşaması ile birlikte akıl yürütme ve diğer yetenekleri başlatmak üzere iki SFT aşaması içerir. Matematik, kodlama ve akıl yürütme görevlerinde OpenAI-o1 ile karşılaştırılabilir performans sergiler.
Web Sitesi Yapay Zeka Modeli Web Sayfası | |
Sağlayıcı Bu modeli sağlayan kuruluş. | |
Sohbet Sohbete başlamak için bir mesaj yazın | - |
Yayın Tarihi Modelin ilk kez ne zaman yayınlandığı. | 1 yıl ago Oca 21, 2025 |
Modallikler Bu modelin işleyebileceği veri türleri | metin |
API Sağlayıcıları Bu modeli sunan sağlayıcılar. (Bu liste tamamlayıcı değildir.) | DeepSeek, HuggingFace |
Bilgi Kesim Tarihi Modelin bilgileri en son ne zaman güncellendi. | Bilinmiyor |
Açık Kaynak Modelin kodunun kamuya açık olup olmadığı. | Evet |
Fiyatlandırma Girdisi Komutlarınızdaki belirteçlerin işlenme maliyeti | $0.55 milyon belirteç başına |
Fiyatlandırma Çıktısı Model tarafından üretilen belirteçlerin maliyeti | $2.19 milyon belirteç başına |
MMLU Massive Multitask Language Understanding – Matematik, tarih, hukuk ve daha fazlası dahil 57 konuda bilgi testi | 90.8% Pass@1 Kaynak |
MMLU-Pro Daha zorlu, akıl yürütmeye odaklanan sorular, daha geniş seçenek seti ve azaltılmış yönlendirme hassasiyeti ile geliştirilmiş MMLU kıyaslaması | 84% EM Kaynak |
MMMU Massive Multitask Multimodal Understanding – Metin, görsel, ses ve video üzerinden anlama testi | - |
HellaSwag Zorlu bir cümle tamamlama kıyaslaması | - |
HumanEval Kod üretimi ve problem çözme yeteneklerini değerlendirir | - |
MATH Farklı zorluk seviyelerinde matematiksel problem çözme yeteneklerini test eder | - |
GPQA Kimya, biyoloji ve fizikte doktora düzeyindeki bilgiyi çoktan seçmeli sorularla test eder; derin alan uzmanlığı gerektirir | 71.5% Pass@1 Kaynak |
IFEval Modelin açık biçimlendirme talimatlarını doğru bir şekilde takip etme, uygun çıktılar üretme ve farklı görevlerde tutarlı talimat uyumu sağlama yeteneğini test eder | 83.3% Prompt Strict Kaynak |
SimpleQA Basit soruların doğruluğunu değerlendirme | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Çok dilli programlama karşılaştırma testi. | - |
LiveCodeBench v5 Gerçek zamanlı programlama karşılaştırma testi | - |
Global MMLU (Lite) Modellerin evrenselliğini küresel ölçekte değerlendirmek için sadeleştirilmiş karşılaştırma testi. | - |
MathVista Yapay zeka modellerinin görsel bağlamlardaki matematiksel akıl yürütme yetilerini değerlendirir | - |
Mobil Uygulama | |
MathArena | |
| Ortalama puan | 82% |
| AIME 2025 American Invitational Mathematics Examination sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | 89% |
| HMMT February 2025 Şubat 2025 Harvard-MIT Mathematics Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | 77% |
| BRUMO 2025 | 92% |
| SMT 2025 2025 Stanford Math Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | 83% |
| CMIMC 2025 2025 Canadian Mathematical Olympiad sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır. | 69% |
Compare AI. Test. Benchmarks. Mobil Uygulamalar Sohbet Botları, Sketch
Copyright © 2026 All Right Reserved.
Yorumlar (1)
Jacquie
27 Ocak 2026Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar