Llama 4 Maverick

Qwen2.5-VL-32B

In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben Entwickler darauf basierende neue Modelle erstellt und wertvolles Feedback gegeben. Jetzt führt Qwen2.5-VL verbesserte Fähigkeiten ein, darunter präzise Analyse von Bildern, Texten und Diagrammen sowie Objektlokalisierung mit strukturierten JSON-Ausgaben. Es versteht lange Videos, erkennt Schlüsselereignisse und fungiert als Agent, der mit Tools auf Computern und Telefonen interagiert. Die Architektur des Modells umfasst dynamische Videoverarbeitung und einen optimierten ViT-Encoder für verbesserte Geschwindigkeit und Genauigkeit.

Llama 4 MaverickQwen2.5-VL-32B
Webseite ?
Anbieter ?
Chat ?
Veröffentlichungsdatum ?
Modalitäten ?
Text ?
Bilder ?
Video ?
Text ?
Bilder ?
Video ?
API-Anbieter ?
Meta AI, Hugging Face, Fireworks, Together, DeepInfra
-
Datum des Wissensstandes ?
2024-08
Unbekannt
Open Source ?
Ja (Quelle)
Ja (Quelle)
Preisgestaltung Eingabe ?
Nicht verfügbar
$0
Preisgestaltung Ausgabe ?
Nicht verfügbar
$0
MMLU ?
Nicht verfügbar
78.4%
Quelle
MMLU-Pro ?
80.5%
Quelle
49.5%
MMMU ?
73.4%
Quelle
70%
HellaSwag ?
Nicht verfügbar
Nicht verfügbar
HumanEval ?
Nicht verfügbar
Nicht verfügbar
MATH ?
Nicht verfügbar
82.2%
GPQA ?
69.8%
Diamond
Quelle
46.0%
Diamond
IFEval ?
Nicht verfügbar
Nicht verfügbar
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobile Anwendung
-
-

VideoGameBench ?

Gesamtpunktzahl
0%
-
Doom II
0%
-
Dream DX
0%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
%0
-
Secret Game 2
0%
-
Secret Game 3
0%
-

LLMs vergleichen

Kommentar hinzufügen


10%
Unsere Website verwendet Cookies.

Datenschutz und Cookie-Richtlinie: Diese Website verwendet Cookies. Wenn Sie die Seite weiter nutzen, stimmen Sie deren Verwendung zu.