GPT-OSS

Qwen2.5-VL-32B

Per pastaruosius penkis mėnesius nuo Qwen2-VL išleidimo kūrėjai sukūrė naujus modelius, paremtus juo, suteikdami vertingų atsiliepimų. Dabar Qwen2.5-VL pristato patobulintas galimybes, įskaitant tikslų vaizdų, teksto ir diagramų analizę bei objektų lokalizavimą su struktūruotomis JSON išvestimis. Jis supranta ilgus vaizdo įrašus, nustato pagrindinius įvykius ir veikia kaip agentas, bendraujantis su įrankiais kompiuteriuose ir telefonuose. Modelio architektūra apima dinaminį vaizdo įrašų apdorojimą ir optimizuotą ViT kodavimo įrenginį, skirtą greičiui ir tikslumui padidinti.

GPT-OSSQwen2.5-VL-32B
Internetinė svetainė ?
Tiekėjas ?
Pokalbiai ?
Išleidimo data ?
Modalumai ?
tekstas ?
tekstas ?
vaizdai ?
vaizdo ?
API tiekėjai ?
Self-hosted, Hugging Face, AWS, Azure, Databricks
-
Žinių nutraukimo data ?
-
Nežinoma
Atvirojo kodo ?
Taip
Taip (Šaltinis)
Įvesties kaina ?
$0.15 už milijoną žodžių
$0
Išvesties kaina ?
$0.60 už milijoną žodžių
$0
MMLU ?
82.7%
Šaltinis
78.4%
Šaltinis
MMLU-Pro ?
-
49.5%
MMMU ?
-
70%
HellaSwag ?
-
Nėra prieinama
HumanEval ?
-
Nėra prieinama
MATH ?
-
82.2%
GPQA ?
80.1%
Diamond
Šaltinis
46.0%
Diamond
IFEval ?
-
Nėra prieinama
SimpleQA ?
66.2%
Šaltinis
-
AIME 2024
69%
Šaltinis
-
AIME 2025
98.7%
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
42.7%
v5
Šaltinis
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilioji programa
-
-

Palyginti LLM

Pridėti komentarą


10%
Mūsų svetainė naudoja slapukus.

Privatumo ir slapukų politika: Ši svetainė naudoja slapukus. Tęsdami naudojimąsi svetaine, jūs sutinkate su jų naudojimu.