DeepSeek-R1

DeepSeek-R1, token başına 37B etkin parametreye sahip 671B parametreli bir Uzman Karışımı (MoE) modelidir ve büyük ölçekli pekiştirmeli öğrenme ile özellikle akıl yürütme yeteneklerine odaklanılarak eğitilmiştir. Model, geliştirilmiş akıl yürütme kalıplarını keşfetmek ve insan tercihleriyle uyum sağlamak için iki RL aşaması ile birlikte akıl yürütme ve diğer yetenekleri başlatmak üzere iki SFT aşaması içerir. Matematik, kodlama ve akıl yürütme görevlerinde OpenAI-o1 ile karşılaştırılabilir performans sergiler.

Llama 4 Maverick

LLaMA 4 Maverick, 17 milyar aktif parametreye sahip olup, 128 uzman içeren Mixture-of-Experts mimarisiyle toplamda 400 milyar parametre barındıran son teknoloji bir çok modlu modeldir. GPT-4o ve Gemini 2.0 Flash gibi modelleri birçok ölçütte geride bırakarak sınıfında lider konuma gelmiştir ve akıl yürütme ile kodlama görevlerinde DeepSeek V3 ile eşleşirken, bunu yarısından daha az aktif parametre kullanarak başarmaktadır. Verimlilik ve ölçeklenebilirlik için tasarlanan Maverick, en iyi performans-maliyet oranını sunarak, deneysel sohbet varyantı LMArena'da 1417 ELO puanı elde etmiştir. Ölçeğine rağmen, tek bir NVIDIA H100 ana sunucusunda çalışarak basit ve pratik bir dağıtım sağlamaktadır.

DeepSeek-R1Llama 4 Maverick
Web Sitesi ?
Sağlayıcı ?
Sohbet ?
Yayın Tarihi ?
Modallikler ?
metin ?
metin ?
görseller ?
video ?
API Sağlayıcıları ?
DeepSeek, HuggingFace
Meta AI, Hugging Face, Fireworks, Together, DeepInfra
Bilgi Kesim Tarihi ?
Bilinmiyor
2024-08
Açık Kaynak ?
Evet
Evet (Kaynak)
Fiyatlandırma Girdisi ?
$0.55 milyon belirteç başına
Mevcut değil
Fiyatlandırma Çıktısı ?
$2.19 milyon belirteç başına
Mevcut değil
MMLU ?
90.8%
Pass@1
Kaynak
Mevcut değil
MMLU-Pro ?
84%
EM
Kaynak
80.5%
Kaynak
MMMU ?
-
73.4%
Kaynak
HellaSwag ?
-
Mevcut değil
HumanEval ?
-
Mevcut değil
MATH ?
-
Mevcut değil
GPQA ?
71.5%
Pass@1
Kaynak
69.8%
Diamond
Kaynak
IFEval ?
83.3%
Prompt Strict
Kaynak
Mevcut değil
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobil Uygulama
-

VideoGameBench ?

Toplam puan
-
0%
Doom II
-
0%
Dream DX
-
0%
Awakening DX
-
0%
Civilization I
-
0%
Pokemon Crystal
-
0%
The Need for Speed
-
0%
The Incredible Machine
-
0%
Secret Game 1
-
%0
Secret Game 2
-
0%
Secret Game 3
-
0%

LLM Karşılaştırması

Yorum Ekle


10%
Sitemiz çerez kullanmaktadır.

Gizlilik ve Çerez Politikası: Bu site çerez kullanır. Siteyi kullanmaya devam ederek, kullanımını kabul etmiş olursunuz.