DeepSeek-R1 AI 기술 사양 및 리뷰

DeepSeek-R1

댓글: 1

DeepSeek-R1은 토큰당 370억 개의 활성 파라미터를 사용하는 6710억 파라미터의 Mixture-of-Experts(MoE) 모델로, 추론 능력에 초점을 맞춘 대규모 강화 학습을 통해 학습되었습니다. 향상된 추론 패턴 발견과 인간 선호도 정렬을 위한 두 단계의 RL, 추론/비추론 능력 생성을 위한 두 단계의 SFT가 포함되어 있으며, 수학, 코딩, 추론 작업에서 OpenAI-o1과 유사한 성능을 보입니다.

1224

종합 순위에서의 위치
7월 2026 기준

사용자 평점
https://compare-ai.foundtt.com

4.2

모델 개요

웹사이트 AI 모델 웹페이지	Open
제공자 이 모델을 제공하는 주체.	DeepSeek
채팅 채팅을 시작하려면 메시지를 입력하세요	-
출시일 모델이 처음 출시된 날짜.	1 년 ago 1월 21, 2025
모달리티 이 모델이 처리할 수 있는 데이터 유형	텍스트 ?
API 제공자 이 모델을 제공하는 업체들. (전체 목록이 아님)	DeepSeek, HuggingFace
지식 업데이트 종료일 모델의 지식이 마지막으로 업데이트된 날짜.	알 수 없음
오픈 소스 모델 코드가 공개적으로 사용 가능한지 여부.	예
입력 가격 프롬프트 토큰 처리 비용	$0.55 100만 토큰당
출력 가격 모델이 생성한 토큰 비용	$2.19 100만 토큰당
MMLU Massive Multitask Language Understanding - 수학, 역사, 법학 등 57개 과목에 걸친 지식 테스트	90.8% Pass@1 출처
MMLU-Pro 더 어렵고 추론 중심의 질문, 더 큰 선택지, 프롬프트 민감도 감소로 강화된 MMLU 벤치마크	84% EM 출처
MMMU Massive Multitask Multimodal Understanding - 텍스트, 이미지, 오디오, 비디오에 걸친 이해력 테스트	-
HellaSwag 도전적인 문장 완성 벤치마크	-
HumanEval 코드 생성 및 문제 해결 능력 평가	-
MATH 다양한 난이도의 수학 문제 해결 능력 테스트	-
GPQA 화학, 생물학, 물리학 분야의 박사 수준 지식을 깊은 전문성이 필요한 객관식 문제로 테스트	71.5% Pass@1 출처
IFEval 모델이 명시적 형식 지침을 정확히 따르고 적절한 출력을 생성하며 다양한 작업에서 일관된 지침 준수를 유지하는 능력 테스트	83.3% Prompt Strict 출처
SimpleQA 간단한 질문의 정확성 평가	-
AIME 2024	-
AIME 2025	-
Aider Polyglot 다국어 프로그래밍 벤치마크.	-
LiveCodeBench v5 실시간 프로그래밍 벤치마크	-
Global MMLU (Lite) 전 세계적으로 모델의 범용성을 평가하기 위한 간소화된 벤치마크 버전.	-
MathVista 시각적 맥락에서 AI 모델의 수학적 추론 능력을 평가합니다	-
모바일 앱	Google Play Apple Apps
MathArena ?
평균 점수	82%
AIME 2025 American Invitational Mathematics Examination의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.	89%
HMMT February 2025 2025년 2월 Harvard-MIT Mathematics Tournament의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.	77%
BRUMO 2025	92%
SMT 2025 2025년 Stanford Math Tournament의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.	83%
CMIMC 2025 2025년 Canadian Mathematical Olympiad의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.	69%

Jacquie
27 1월 2026
Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

DeepSeek-R1 사양, 리뷰 및 비교

DeepSeek-R1

모델 개요

MathArena ?

댓글 (1)

Jacquie

댓글 추가

LLM 비교