DeepSeek-R1 vs Qwen2.5-VL-32B

DeepSeek-R1

DeepSeek-R1 yra 671B parametrų Mišrios ekspertų (MoE) modelis su 37B aktyvuotais parametrais per žodį, apmokytas didelio masto sustiprinto mokymosi, sutelkiant dėmesį į mąstymo gebėjimus. Jis apima dvi sustiprinto mokymosi stadijas, skirtas atrasti patobulintas mąstymo schemas ir suderinti su žmogaus pageidavimais, taip pat dvi SFT stadijas, skirtas pritaikyti mąstymo ir nemąstymo gebėjimus. Modelis pasiekia našumą, panašų į OpenAI-o1, matematikos, kodo ir mąstymo užduotyse.

Qwen2.5-VL-32B

Per pastaruosius penkis mėnesius nuo Qwen2-VL išleidimo kūrėjai sukūrė naujus modelius, paremtus juo, suteikdami vertingų atsiliepimų. Dabar Qwen2.5-VL pristato patobulintas galimybes, įskaitant tikslų vaizdų, teksto ir diagramų analizę bei objektų lokalizavimą su struktūruotomis JSON išvestimis. Jis supranta ilgus vaizdo įrašus, nustato pagrindinius įvykius ir veikia kaip agentas, bendraujantis su įrankiais kompiuteriuose ir telefonuose. Modelio architektūra apima dinaminį vaizdo įrašų apdorojimą ir optimizuotą ViT kodavimo įrenginį, skirtą greičiui ir tikslumui padidinti.

	DeepSeek-R1	Qwen2.5-VL-32B
Tiekėjas	DeepSeek	Alibaba
Internetinė svetainė	Open	Open
Išleidimo data	Jan 21, 2025 3 mėnesiai ago	Mar 25, 2025 4 savaitės ago
Modalumai	tekstas ?	tekstas ? vaizdai ? vaizdo ?
API tiekėjai	DeepSeek, HuggingFace	-
Žinių nutraukimo data	Nežinoma	Nežinoma
Atvirojo kodo	Taip	Taip (Šaltinis)
Įvesties kaina	$0.55 už milijoną žodžių	$0
Išvesties kaina	$2.19 už milijoną žodžių	$0
MMLU	90.8% Pass@1 Šaltinis	78.4% Šaltinis
MMLU Pro	84% EM Šaltinis	49.5%
MMMU	-	70%
HellaSwag	-	Nėra prieinama
HumanEval	-	Nėra prieinama
MATH	-	82.2%
GPQA	71.5% Pass@1 Šaltinis	46.0% Diamond
IFEval	83.3% Prompt Strict Šaltinis	Nėra prieinama
Mobilioji programa	Google Play Apple Apps	-

DeepSeek-R1

Qwen2.5-VL-32B

Tiekėjas

DeepSeek

Alibaba

Internetinė svetainė

Open

Išleidimo data

Jan 21, 2025
3 mėnesiai ago

Mar 25, 2025
4 savaitės ago

Modalumai

tekstas ?

tekstas ?
vaizdai ?
vaizdo ?

API tiekėjai

DeepSeek, HuggingFace

Žinių nutraukimo data

Nežinoma

Atvirojo kodo

Taip

Taip (Šaltinis)

Įvesties kaina

$0.55 už milijoną žodžių

Išvesties kaina

$2.19 už milijoną žodžių

MMLU

90.8%
Pass@1
Šaltinis

78.4%
Šaltinis

MMLU Pro

84%
EM
Šaltinis

49.5%

MMMU

70%

HellaSwag

Nėra prieinama

HumanEval

Nėra prieinama

MATH

82.2%

GPQA

71.5%
Pass@1
Šaltinis

46.0%
Diamond

IFEval

83.3%
Prompt Strict
Šaltinis

Nėra prieinama

Mobilioji programa

Google Play
Apple Apps

Palyginti LLM
DeepSeek-R1 vs Qwen2.5-VL-32B

DeepSeek-R1

Qwen2.5-VL-32B

Palyginti LLM

Pridėti komentarą

Palyginti LLMDeepSeek-R1 vs Qwen2.5-VL-32B

DeepSeek-R1

Qwen2.5-VL-32B

Palyginti LLM

Pridėti komentarą

Palyginti LLM
DeepSeek-R1 vs Qwen2.5-VL-32B