DeepSeek-R1

댓글: 1
DeepSeek-R1 #0
DeepSeek-R1 #1
DeepSeek-R1 #2

DeepSeek-R1은 토큰당 370억 개의 활성 파라미터를 사용하는 6710억 파라미터의 Mixture-of-Experts(MoE) 모델로, 추론 능력에 초점을 맞춘 대규모 강화 학습을 통해 학습되었습니다. 향상된 추론 패턴 발견과 인간 선호도 정렬을 위한 두 단계의 RL, 추론/비추론 능력 생성을 위한 두 단계의 SFT가 포함되어 있으며, 수학, 코딩, 추론 작업에서 OpenAI-o1과 유사한 성능을 보입니다.

1224
21

종합 순위에서의 위치
6월 2026 기준
5
사용자 평점
https://compare-ai.foundtt.com
4.2

모델 개요

웹사이트
AI 모델 웹페이지
제공자
이 모델을 제공하는 주체.
채팅
채팅을 시작하려면 메시지를 입력하세요
-
출시일
모델이 처음 출시된 날짜.
1 년 ago
1월 21, 2025
모달리티
이 모델이 처리할 수 있는 데이터 유형
텍스트 ?
API 제공자
이 모델을 제공하는 업체들. (전체 목록이 아님)
DeepSeek, HuggingFace
지식 업데이트 종료일
모델의 지식이 마지막으로 업데이트된 날짜.
알 수 없음
오픈 소스
모델 코드가 공개적으로 사용 가능한지 여부.
입력 가격
프롬프트 토큰 처리 비용
$0.55 100만 토큰당
출력 가격
모델이 생성한 토큰 비용
$2.19 100만 토큰당
MMLU
Massive Multitask Language Understanding - 수학, 역사, 법학 등 57개 과목에 걸친 지식 테스트
90.8%
Pass@1
출처
MMLU-Pro
더 어렵고 추론 중심의 질문, 더 큰 선택지, 프롬프트 민감도 감소로 강화된 MMLU 벤치마크
84%
EM
출처
MMMU
Massive Multitask Multimodal Understanding - 텍스트, 이미지, 오디오, 비디오에 걸친 이해력 테스트
-
HellaSwag
도전적인 문장 완성 벤치마크
-
HumanEval
코드 생성 및 문제 해결 능력 평가
-
MATH
다양한 난이도의 수학 문제 해결 능력 테스트
-
GPQA
화학, 생물학, 물리학 분야의 박사 수준 지식을 깊은 전문성이 필요한 객관식 문제로 테스트
71.5%
Pass@1
출처
IFEval
모델이 명시적 형식 지침을 정확히 따르고 적절한 출력을 생성하며 다양한 작업에서 일관된 지침 준수를 유지하는 능력 테스트
83.3%
Prompt Strict
출처
SimpleQA
간단한 질문의 정확성 평가
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
다국어 프로그래밍 벤치마크.
-
LiveCodeBench v5
실시간 프로그래밍 벤치마크
-
Global MMLU (Lite)
전 세계적으로 모델의 범용성을 평가하기 위한 간소화된 벤치마크 버전.
-
MathVista
시각적 맥락에서 AI 모델의 수학적 추론 능력을 평가합니다
-
모바일 앱

MathArena ?

평균 점수82%
AIME 2025
American Invitational Mathematics Examination의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.
89%
HMMT February 2025
2025년 2월 Harvard-MIT Mathematics Tournament의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.
77%
BRUMO 202592%
SMT 2025
2025년 Stanford Math Tournament의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.
83%
CMIMC 2025
2025년 Canadian Mathematical Olympiad의 문제를 기반으로 한 테스트로, 모델의 수학적 능력을 검증하기 위해 설계되었습니다.
69%

댓글 (1)

  1. Jacquie

    27 1월 2026

    Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

댓글 추가

LLM 비교


10%
당사 웹사이트는 쿠키를 사용합니다.

개인정보 및 쿠키 정책: 본 사이트는 쿠키를 사용합니다. 사이트를 계속 이용하면 쿠키 사용에 동의하는 것으로 간주됩니다.