DeepSeek-R1 AI Technische Specificaties en Review

DeepSeek-R1

Reacties: 1

DeepSeek-R1 is een Mixture-of-Experts (MoE)-model met 671B parameters en 37B geactiveerde parameters per token, getraind via grootschalige reinforcement learning met een focus op redeneervaardigheden. Het omvat twee RL-fasen voor het ontdekken van verbeterde redeneerpatronen en afstemming op menselijke voorkeuren, evenals twee SFT-fasen voor het ontwikkelen van redeneer- en niet-redeneervaardigheden. Het model bereikt prestaties die vergelijkbaar zijn met OpenAI-o1 op het gebied van wiskunde, code en redeneertaken.

1224

Positie in de algemene ranglijst vanaf
Juli 2026

Gebruikersbeoordeling
https://compare-ai.foundtt.com

4.2

Modeloverzicht

Website AI Model Webpagina	Open
Aanbieder De entiteit die dit model aanbiedt.	DeepSeek
Chat Voer een bericht in om te beginnen met chatten	-
Releasedatum Wanneer het model voor het eerst is vrijgegeven.	1 jaar ago Jan 21, 2025
Modaliteiten Soorten gegevens die dit model kan verwerken	tekst ?
API-Aanbieders De aanbieders die dit model leveren. (Dit is geen uitputtende lijst.)	DeepSeek, HuggingFace
Kennisafsluitdatum Wanneer de kennis van het model voor het laatst is bijgewerkt.	Onbekend
Open Source Of de code van het model beschikbaar is voor publiek gebruik.	Ja
Prijzen Invoer Kosten voor het verwerken van tokens in uw prompts	$0.55 per miljoen tokens
Prijzen Uitvoer Kosten voor tokens gegenereerd door het model	$2.19 per miljoen tokens
MMLU Massive Multitask Language Understanding - Test kennis over 57 onderwerpen, waaronder wiskunde, geschiedenis, recht en meer	90.8% Pass@1 Bron
MMLU-Pro Een robuustere MMLU-benchmark met moeilijkere, op redenering gerichte vragen, een grotere keuzeset en verminderde gevoeligheid voor prompts	84% EM Bron
MMMU Massive Multitask Multimodal Understanding - Test begrip van tekst, afbeeldingen, audio en video	-
HellaSwag Een uitdagende benchmark voor zinsvoltooiing	-
HumanEval Evalueert codegeneratie en probleemoplossende vaardigheden	-
MATH Test wiskundige probleemoplossende vaardigheden op verschillende moeilijkheidsniveaus	-
GPQA Test PhD-niveau kennis in scheikunde, biologie en natuurkunde door meerkeuzevragen die diepgaande domeinkennis vereisen	71.5% Pass@1 Bron
IFEval Test het vermogen van het model om expliciete opmaakinstructies nauwkeurig te volgen, geschikte uitvoer te genereren en consistente instructienaleving te behouden bij verschillende taken	83.3% Prompt Strict Bron
SimpleQA Evaluatie van de nauwkeurigheid van eenvoudige vragen	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Meertalige programmeerbenchmark.	-
LiveCodeBench v5 Benchmark voor realtime programmeren	-
Global MMLU (Lite) Een vereenvoudigde versie van de benchmark om de universaliteit van modellen op wereldwijd niveau te beoordelen.	-
MathVista Evalueert de wiskundige redeneervermogens van AI-modellen binnen visuele contexten	-
Mobiele applicatie	Google Play Apple Apps
MathArena ?
Gemiddelde score	82%
AIME 2025 Test gebaseerd op opgaven uit de wiskundewedstrijd (American Invitational Mathematics Examination),bedoeld om de wiskundige vaardigheden van modellen te testen.	89%
HMMT February 2025 Test gebaseerd op opgaven van het Harvard-MIT Mathematics Tournament, februari 2025, bedoeld om de wiskundige vaardigheden van modellen te testen.	77%
BRUMO 2025	92%
SMT 2025 Test gebaseerd op opgaven van het Stanford Math Tournament, 2025, bedoeld om de wiskundige vaardigheden van modellen te testen.	83%
CMIMC 2025 Test gebaseerd op opgaven van de Canadian Mathematical Olympiad, 2025, bedoeld om de wiskundige vaardigheden van modellen te testen.	69%

Reacties (1)

Jacquie
27 Januari 2026
Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

DeepSeek-R1 Specificaties, Review en Vergelijking

DeepSeek-R1

Modeloverzicht

MathArena ?

Reacties (1)

Jacquie

Voeg een reactie toe

Vergelijk LLMs