Qwen2.5-VL-32B

Az Qwen2-VL megjelenése után öt hónappal a fejlesztők új modelleket építettek rá, értékes visszajelzést nyújtva. Most az Qwen2.5-VL továbbfejlesztett képességeket mutat be, beleértve a képek, szövegek és diagramok pontos elemzését, valamint objektumok lokalizálását strukturált JSON kimenetekkel. Megérti a hosszú videókat, kulcseseményeket azonosít, és ügynökként működik, eszközökkel kommunikálva számítógépeken és telefonokon. A modell architektúrája dinamikus videofeldolgozást és optimalizált ViT kódolót tartalmaz a gyorsaság és pontosság javításáért.

Nova Lite

Az Amazon Nova Lite egy sokoldalú multimodális modell, amely szöveg-, kép- és videóbevitelt képes feldolgozni, és szövegalapú kimeneteket generál. 300 000 tokenes kontextusablakával kiválóan alkalmas valós idejű interakciókra, dokumentumelemzésre és vizuális kérdés-válasz feladatokra. Az Amazon Nova alappmodellek részeként támogatja a finomhangolást és a desztillációt, lehetővé téve a fejlett testreszabást.

Qwen2.5-VL-32BNova Lite
Szolgáltató
Weboldal
-
Kiadási Dátum
Mar 25, 2025
4 hetek ago
Dec 02, 2024
4 hónapok ago
Modalitások
szöveg ?
képek ?
videó ?
szöveg ?
képek ?
videó ?
API Szolgáltatók
-
Amazon Bedrock
Tudás Befejezési Dátuma
Ismeretlen
Szándékosan nem nyilvános
Nyílt Forráskódú
Igen (Forrás)
Nem
Bemeneti Árazás
$0
$0.06 millió tokenenként
Kimeneti Árazás
$0
$0.24 millió tokenenként
MMLU
78.4%
Forrás
80.5%
CoT
Forrás
MMLU Pro
49.5%
Nem elérhető
MMMU
70%
Nem elérhető
HellaSwag
Nem elérhető
Nem elérhető
HumanEval
Nem elérhető
85.4%
pass@1
Forrás
MATH
82.2%
73.3%
CoT
Forrás
GPQA
46.0%
Diamond
42%
Main
Forrás
IFEval
Nem elérhető
89.7%
Forrás
Mobilalkalmazás
-
-

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.