DeepSeek-R1 Технические характеристики и обзор ИИ

DeepSeek-R1

Комментарии: 1

DeepSeek-R1 — это модель типа Mixture-of-Experts (MoE) с 671 млрд параметров, из которых 37 млрд активируются на каждый токен. Обучена с использованием масштабного обучения с подкреплением (RL) с упором на развитие навыков рассуждения. Включает два этапа RL для выявления улучшенных схем рассуждения и согласования с предпочтениями человека, а также два этапа SFT для развития навыков, связанных и не связанных с рассуждением. По математическим, программным и логическим задачам модель демонстрирует производительность, сопоставимую с OpenAI-o1.

1224

Позиция в общем рейтинге на
Июль 2026

Рейтинг пользователей
https://compare-ai.foundtt.com

4.2

Обзор модели

Веб-сайт Страница модели ИИ	Open
Провайдер Организация, предоставляющая данную модель.	DeepSeek
Чат Введите сообщение, чтобы начать общение	-
Дата выпуска Когда модель была впервые выпущена.	1 год назад Янв 21, 2025
Модальности Типы данных, которые может обрабатывать модель	текст ?
Поставщики API Провайдеры, предлагающие данную модель. (Этот список не является исчерпывающим.)	DeepSeek, HuggingFace
Дата актуальности знаний Когда в последний раз обновлялись знания модели.	Неизвестно
Открытый исходный код Доступен ли исходный код модели для публичного использования.	Да
Стоимость ввода Стоимость обработки токенов в вашем запросе	$0.55 за миллион токенов
Стоимость вывода Стоимость токенов, сгенерированных моделью	$2.19 за миллион токенов
MMLU Massive Multitask Language Understanding – Тестирование знаний по 57 предметам, включая математику, историю, право и другие	90.8% Pass@1 Источник
MMLU-Pro Улучшенный бенчмарк MMLU с более сложными вопросами, ориентированными на рассуждение, увеличенным числом вариантов ответов и сниженной чувствительностью к подсказкам	84% EM Источник
MMMU Massive Multitask Multimodal Understanding – Тестирование понимания текста, изображений, аудио и видео	-
HellaSwag Сложный бенчмарк для завершения предложений	-
HumanEval Оценивает возможности генерации кода и решения задач	-
MATH Тестирование математических навыков на разных уровнях сложности	-
GPQA Тестирование знаний на уровне PhD в области химии, биологии и физики с помощью вопросов множественного выбора, требующих глубоких экспертных знаний	71.5% Pass@1 Источник
IFEval Оценивает способность модели точно следовать явным инструкциям по форматированию, генерировать соответствующие выходные данные и поддерживать последовательность инструкций в разных задачах	83.3% Prompt Strict Источник
SimpleQA Оценка точности простых вопросов	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Многоязычный программный бенчмарк.	-
LiveCodeBench v5 Бенчмарк для программирования в реальном времени	-
Global MMLU (Lite) Упрощенная версия бенчмарка для оценки универсальности моделей на глобальном уровне.	-
MathVista Оценивает способности математического мышления моделей ИИ в визуальных контекстах	-
Мобильное приложение	Google Play Apple Apps
MathArena ?
Средний балл	82%
AIME 2025 Тест, основанный на задачах из конкурса по математике (American Invitational Mathematics Examination),предназначен для проверки математических навыков моделей.	89%
HMMT February 2025 Тест, основанный на задачах из Harvard-MIT Mathematics Tournament, февраль 2025 года, предназначен для проверки математических навыков моделей.	77%
BRUMO 2025	92%
SMT 2025 Тест, основанный на задачах из Stanford Math Tournament, 2025 года, предназначен для проверки математических навыков моделей.	83%
CMIMC 2025 Тест, основанный на задачах из Canadian Mathematical Olympiad, 2025 года, предназначен для проверки математических навыков моделей.	69%

Комментарии (1)

Jacquie
27 Январь 2026
Digiturk paketler icinden size en uygun uyeligi kolayca secebilirsiniz. https://digiturkpaketler.com/kampanyalar

DeepSeek-R1 Характеристики, обзор и сравнение

DeepSeek-R1

Обзор модели

MathArena ?

Комментарии (1)

Jacquie

Добавить комментарий

Сравнение LLM