DeepSeek-R1

Yorumlar: 1
DeepSeek-R1 #0
DeepSeek-R1 #1
DeepSeek-R1 #2

DeepSeek-R1, token başına 37B etkin parametreye sahip 671B parametreli bir Uzman Karışımı (MoE) modelidir ve büyük ölçekli pekiştirmeli öğrenme ile özellikle akıl yürütme yeteneklerine odaklanılarak eğitilmiştir. Model, geliştirilmiş akıl yürütme kalıplarını keşfetmek ve insan tercihleriyle uyum sağlamak için iki RL aşaması ile birlikte akıl yürütme ve diğer yetenekleri başlatmak üzere iki SFT aşaması içerir. Matematik, kodlama ve akıl yürütme görevlerinde OpenAI-o1 ile karşılaştırılabilir performans sergiler.

1224
21

genel sıralamadaki konumu
Haziran 2026 itibarıyla
5
Kullanıcı puanı
https://compare-ai.foundtt.com
4.2

Model Genel Bilgisi

Web Sitesi
Yapay Zeka Modeli Web Sayfası
Sağlayıcı
Bu modeli sağlayan kuruluş.
Sohbet
Sohbete başlamak için bir mesaj yazın
-
Yayın Tarihi
Modelin ilk kez ne zaman yayınlandığı.
1 yıl ago
Oca 21, 2025
Modallikler
Bu modelin işleyebileceği veri türleri
metin ?
API Sağlayıcıları
Bu modeli sunan sağlayıcılar. (Bu liste tamamlayıcı değildir.)
DeepSeek, HuggingFace
Bilgi Kesim Tarihi
Modelin bilgileri en son ne zaman güncellendi.
Bilinmiyor
Açık Kaynak
Modelin kodunun kamuya açık olup olmadığı.
Evet
Fiyatlandırma Girdisi
Komutlarınızdaki belirteçlerin işlenme maliyeti
$0.55 milyon belirteç başına
Fiyatlandırma Çıktısı
Model tarafından üretilen belirteçlerin maliyeti
$2.19 milyon belirteç başına
MMLU
Massive Multitask Language Understanding – Matematik, tarih, hukuk ve daha fazlası dahil 57 konuda bilgi testi
90.8%
Pass@1
Kaynak
MMLU-Pro
Daha zorlu, akıl yürütmeye odaklanan sorular, daha geniş seçenek seti ve azaltılmış yönlendirme hassasiyeti ile geliştirilmiş MMLU kıyaslaması
84%
EM
Kaynak
MMMU
Massive Multitask Multimodal Understanding – Metin, görsel, ses ve video üzerinden anlama testi
-
HellaSwag
Zorlu bir cümle tamamlama kıyaslaması
-
HumanEval
Kod üretimi ve problem çözme yeteneklerini değerlendirir
-
MATH
Farklı zorluk seviyelerinde matematiksel problem çözme yeteneklerini test eder
-
GPQA
Kimya, biyoloji ve fizikte doktora düzeyindeki bilgiyi çoktan seçmeli sorularla test eder; derin alan uzmanlığı gerektirir
71.5%
Pass@1
Kaynak
IFEval
Modelin açık biçimlendirme talimatlarını doğru bir şekilde takip etme, uygun çıktılar üretme ve farklı görevlerde tutarlı talimat uyumu sağlama yeteneğini test eder
83.3%
Prompt Strict
Kaynak
SimpleQA
Basit soruların doğruluğunu değerlendirme
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Çok dilli programlama karşılaştırma testi.
-
LiveCodeBench v5
Gerçek zamanlı programlama karşılaştırma testi
-
Global MMLU (Lite)
Modellerin evrenselliğini küresel ölçekte değerlendirmek için sadeleştirilmiş karşılaştırma testi.
-
MathVista
Yapay zeka modellerinin görsel bağlamlardaki matematiksel akıl yürütme yetilerini değerlendirir
-
Mobil Uygulama

MathArena ?

Ortalama puan82%
AIME 2025
American Invitational Mathematics Examination sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
89%
HMMT February 2025
Şubat 2025 Harvard-MIT Mathematics Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
77%
BRUMO 202592%
SMT 2025
2025 Stanford Math Tournament sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
83%
CMIMC 2025
2025 Canadian Mathematical Olympiad sorularına dayalı test, modellerin matematik becerilerini değerlendirmek amacıyla hazırlanmıştır.
69%

Yorumlar (1)

  1. Jacquie

    27 Ocak 2026

    Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

Yorum Ekle

LLM Karşılaştırması


10%
Sitemiz çerez kullanmaktadır.

Gizlilik ve Çerez Politikası: Bu site çerez kullanır. Siteyi kullanmaya devam ederek, kullanımını kabul etmiş olursunuz.