Qwen2.5-VL-32B

Az Qwen2-VL megjelenése után öt hónappal a fejlesztők új modelleket építettek rá, értékes visszajelzést nyújtva. Most az Qwen2.5-VL továbbfejlesztett képességeket mutat be, beleértve a képek, szövegek és diagramok pontos elemzését, valamint objektumok lokalizálását strukturált JSON kimenetekkel. Megérti a hosszú videókat, kulcseseményeket azonosít, és ügynökként működik, eszközökkel kommunikálva számítógépeken és telefonokon. A modell architektúrája dinamikus videofeldolgozást és optimalizált ViT kódolót tartalmaz a gyorsaság és pontosság javításáért.

Gemini 2.0 Pro

A Gemini 2.0 Pro a Google eddigi legfejlettebb modellje, amely kivételes kódolási teljesítményt nyújt, és könnyedén kezeli az összetett utasításokat. Fejlett funkciókkal rendelkezik, mint például a natív eszközintegráció, a képalkotás és a beszédszintézis. Fejlett érvelési képességekre tervezve a modell támogatja a multimodális bemeneteket, beleértve a szöveget, képeket, videót és hangot. Elérhető a Google AI Studio és a Vertex AI platformokon, és jelentős teljesítményjavulást kínál a korábbi verziókhoz képest, miközben magas hatékonyságot biztosít.

Qwen2.5-VL-32BGemini 2.0 Pro
Szolgáltató
Weboldal
Kiadási Dátum
Mar 25, 2025
4 hetek ago
Dec 11, 2024
4 hónapok ago
Modalitások
szöveg ?
képek ?
videó ?
szöveg ?
képek ?
hang ?
videó ?
API Szolgáltatók
-
Google AI Studio, Vertex AI
Tudás Befejezési Dátuma
Ismeretlen
08.2024
Nyílt Forráskódú
Igen (Forrás)
Nem
Bemeneti Árazás
$0
$0.10 millió tokenenként
Kimeneti Árazás
$0
$0.40 millió tokenenként
MMLU
78.4%
Forrás
Nem elérhető
MMLU Pro
49.5%
79.1%
Forrás
MMMU
70%
72.7%
Forrás
HellaSwag
Nem elérhető
Nem elérhető
HumanEval
Nem elérhető
Nem elérhető
MATH
82.2%
91.8%
Forrás
GPQA
46.0%
Diamond
64.7%
Diamond
Forrás
IFEval
Nem elérhető
Nem elérhető
Mobilalkalmazás
-

LLM-ek Összehasonlítása

Hozzászólás Hozzáadása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.