Grok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

„Grok 3“ ist das fortschrittlichste Modell von xAI, trainiert auf dem Colossus-Supercluster mit der zehnfachen Rechenleistung früherer Spitzenmodelle. Es verfügt über ein Kontextfenster von 1 Million Token und fortgeschrittene Denkfähigkeiten, die durch groß angelegtes Reinforcement Learning verbessert wurden, sodass tiefgehende Denkprozesse von Sekunden bis zu Minuten für die Lösung komplexer Probleme möglich sind. Das Modell erzielt Spitzenleistungen in akademischen Benchmarks und realen Nutzertests und erreichte eine Elo-Bewertung von 1402 in der Chatbot Arena. Es wurde zusammen mit Grok 3 Mini veröffentlicht, einer kosteneffizienten Variante, die für optimierte Schlussfolgerungen entwickelt wurde.

Qwen2.5-VL-32B

In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben Entwickler darauf basierende neue Modelle erstellt und wertvolles Feedback gegeben. Jetzt führt Qwen2.5-VL verbesserte Fähigkeiten ein, darunter präzise Analyse von Bildern, Texten und Diagrammen sowie Objektlokalisierung mit strukturierten JSON-Ausgaben. Es versteht lange Videos, erkennt Schlüsselereignisse und fungiert als Agent, der mit Tools auf Computern und Telefonen interagiert. Die Architektur des Modells umfasst dynamische Videoverarbeitung und einen optimierten ViT-Encoder für verbesserte Geschwindigkeit und Genauigkeit.

	Grok 3 Beta	Qwen2.5-VL-32B
Anbieter	xAI	Alibaba
Webseite	Open	Open
Veröffentlichungsdatum	Jan 19, 2025 3 Monate ago	Mar 25, 2025 4 Wochen ago
Modalitäten	Text ? Bilder ? Video ?	Text ? Bilder ? Video ?
API-Anbieter	xAI	-
Datum des Wissensstandes	2025-01	Unbekannt
Open Source	Nein	Ja (Quelle)
Preisgestaltung Eingabe	Nicht verfügbar	$0
Preisgestaltung Ausgabe	Nicht verfügbar	$0
MMLU	Nicht verfügbar	78.4% Quelle
MMLU Pro	79.9% Base model Quelle	49.5%
MMMU	78% With Think mode Quelle	70%
HellaSwag	Nicht verfügbar	Nicht verfügbar
HumanEval	Nicht verfügbar	Nicht verfügbar
MATH	Nicht verfügbar	82.2%
GPQA	84.6% With Think mode, Diamond Quelle	46.0% Diamond
IFEval	Nicht verfügbar	Nicht verfügbar
Mobile Anwendung	Google Play Apple Apps	-

Grok 3 Beta

Qwen2.5-VL-32B

Anbieter

xAI

Alibaba

Webseite

Open

Veröffentlichungsdatum

Jan 19, 2025
3 Monate ago

Mar 25, 2025
4 Wochen ago

Modalitäten

Text ?
Bilder ?
Video ?

API-Anbieter

xAI

Datum des Wissensstandes

2025-01

Unbekannt

Open Source

Nein

Ja (Quelle)

Preisgestaltung Eingabe

Nicht verfügbar

Preisgestaltung Ausgabe

Nicht verfügbar

MMLU

Nicht verfügbar

78.4%
Quelle

MMLU Pro

79.9%
Base model
Quelle

49.5%

MMMU

78%
With Think mode
Quelle

70%

HellaSwag

Nicht verfügbar

HumanEval

Nicht verfügbar

MATH

Nicht verfügbar

82.2%

GPQA

84.6%
With Think mode, Diamond
Quelle

46.0%
Diamond

IFEval

Nicht verfügbar

Mobile Anwendung

Google Play
Apple Apps

LLMs vergleichen
Grok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

Qwen2.5-VL-32B

LLMs vergleichen

Kommentar hinzufügen

LLMs vergleichenGrok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

Qwen2.5-VL-32B

LLMs vergleichen

Kommentar hinzufügen

LLMs vergleichen
Grok 3 Beta vs Qwen2.5-VL-32B