Qwen2.5-VL-32B

In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben Entwickler darauf basierende neue Modelle erstellt und wertvolles Feedback gegeben. Jetzt führt Qwen2.5-VL verbesserte Fähigkeiten ein, darunter präzise Analyse von Bildern, Texten und Diagrammen sowie Objektlokalisierung mit strukturierten JSON-Ausgaben. Es versteht lange Videos, erkennt Schlüsselereignisse und fungiert als Agent, der mit Tools auf Computern und Telefonen interagiert. Die Architektur des Modells umfasst dynamische Videoverarbeitung und einen optimierten ViT-Encoder für verbesserte Geschwindigkeit und Genauigkeit.

Qwen 3

Qwen2.5-VL-32BQwen 3
Anbieter
Webseite
Veröffentlichungsdatum
Mar 25, 2025
1 Monat ago
Apr 29, 2025
16 Stunden ago
Modalitäten
Text ?
Bilder ?
Video ?
-
API-Anbieter
-
-
Datum des Wissensstandes
Unbekannt
-
Open Source
Ja (Quelle)
Ja (Quelle)
Preisgestaltung Eingabe
$0
-
Preisgestaltung Ausgabe
$0
-
MMLU
78.4%
Quelle
-
MMLU Pro
49.5%
-
MMMU
70%
-
HellaSwag
Nicht verfügbar
-
HumanEval
Nicht verfügbar
-
MATH
82.2%
-
GPQA
46.0%
Diamond
-
IFEval
Nicht verfügbar
-
Mobile Anwendung
-
-

LLMs vergleichen

Kommentar hinzufügen


10%
Unsere Website verwendet Cookies.

Datenschutz und Cookie-Richtlinie: Diese Website verwendet Cookies. Wenn Sie die Seite weiter nutzen, stimmen Sie deren Verwendung zu.