Qwen2.5-VL-32B

Počas piatich mesiacov od vydania Qwen2-VL vývojári vytvorili nové modely na jeho základe a poskytli cennú spätnú väzbu. Teraz Qwen2.5-VL prináša vylepšené schopnosti vrátane presnej analýzy obrázkov, textov a grafov, ako aj lokalizáciu objektov so štruktúrovanými JSON výstupmi. Rozumie dlhým videám, identifikuje kľúčové udalosti a funguje ako agent interagujúci s nástrojmi na počítačoch a telefónoch. Architektúra modelu zahŕňa dynamické spracovanie videa a optimalizovaný ViT enkodér pre vyššiu rýchlosť a presnosť.

Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking je pokročilý model logického myslenia navrhnutý na zvýšenie výkonu a zrozumiteľnosti tým, že sprístupňuje svoj myšlienkový proces. Vyniká pri riešení zložitých problémov, programátorských výziev a matematického uvažovania, pričom poskytuje riešenia krok za krokom. Model je optimalizovaný na úlohy vyžadujúce podrobné vysvetlenia a logickú analýzu a obsahuje natívnu integráciu nástrojov, vrátane vykonávania kódu a funkcií Google Search.

Qwen2.5-VL-32BGemini 2.0 Flash Thinking
Poskytovateľ
Webová stránka
Dátum vydania
Mar 25, 2025
1 mesiac ago
Dec 19, 2024
4 mesiace ago
Modality
text ?
obrázky ?
video ?
text ?
obrázky ?
Poskytovatelia API
-
Google AI Studio, Vertex AI, Gemini API
Dátum zastarania vedomostí
Neznáme
04.2024
Open Source
Áno (Zdroj)
Nie
Cena za vstup
$0
Nie je k dispozícii
Cena za výstup
$0
Nie je k dispozícii
MMLU
78.4%
Zdroj
Nie je k dispozícii
MMLU Pro
49.5%
Nie je k dispozícii
MMMU
70%
75.4%
Zdroj
HellaSwag
Nie je k dispozícii
Nie je k dispozícii
HumanEval
Nie je k dispozícii
Nie je k dispozícii
MATH
82.2%
Nie je k dispozícii
GPQA
46.0%
Diamond
74.2%
Diamond Science
Zdroj
IFEval
Nie je k dispozícii
Nie je k dispozícii
Mobilná aplikácia
-

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.