Qwen2.5-VL-32B

Počas piatich mesiacov od vydania Qwen2-VL vývojári vytvorili nové modely na jeho základe a poskytli cennú spätnú väzbu. Teraz Qwen2.5-VL prináša vylepšené schopnosti vrátane presnej analýzy obrázkov, textov a grafov, ako aj lokalizáciu objektov so štruktúrovanými JSON výstupmi. Rozumie dlhým videám, identifikuje kľúčové udalosti a funguje ako agent interagujúci s nástrojmi na počítačoch a telefónoch. Architektúra modelu zahŕňa dynamické spracovanie videa a optimalizovaný ViT enkodér pre vyššiu rýchlosť a presnosť.

Gemini 2.0 Flash

Gemini 2.0 Flash je vysoko výkonný model od Googlu s nízkym oneskorením, navrhnutý pre pokročilé agentové zážitky. Vybavený natívnou integráciou nástrojov podporuje multimodálne vstupy, vrátane textu, obrázkov, videa a zvuku. S výraznými vylepšeniami oproti predchádzajúcim verziám model kombinuje efektivitu, rýchlosť a rozšírené schopnosti pre plynulé interakcie v reálnom čase.

Qwen2.5-VL-32BGemini 2.0 Flash
Poskytovateľ
Webová stránka
Dátum vydania
Mar 25, 2025
1 mesiac ago
Dec 11, 2024
4 mesiace ago
Modality
text ?
obrázky ?
video ?
text ?
obrázky ?
hlas ?
video ?
Poskytovatelia API
-
Google AI Studio, Vertex AI
Dátum zastarania vedomostí
Neznáme
08.2024
Open Source
Áno (Zdroj)
Nie
Cena za vstup
$0
$0.10 za milión tokenov
Cena za výstup
$0
$0.40 za milión tokenov
MMLU
78.4%
Zdroj
Nie je k dispozícii
MMLU Pro
49.5%
77.6%
Zdroj
MMMU
70%
71.7%
Zdroj
HellaSwag
Nie je k dispozícii
Nie je k dispozícii
HumanEval
Nie je k dispozícii
Nie je k dispozícii
MATH
82.2%
90.9%
Zdroj
GPQA
46.0%
Diamond
60.1%
Diamond
Zdroj
IFEval
Nie je k dispozícii
Nie je k dispozícii
Mobilná aplikácia
-

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.