Qwen 3 KI-Technische Spezifikationen und Bewertung

Qwen 3

Kommentare: 0

4507

122

Position im Gesamtranking zum Stand von
Juni 2026

Benutzerbewertung
https://compare-ai.foundtt.com

4.2

Modellübersicht

Webseite KI-Modell-Webseite	Open
Anbieter Die Entität, die dieses Modell bereitstellt.	Alibaba
Chat Geben Sie eine Nachricht ein, um zu chatten	Open
Veröffentlichungsdatum Wann das Modell erstmals veröffentlicht wurde.	1 Jahr ago Apr 29, 2025
Modalitäten Arten von Daten, die dieses Modell verarbeiten kann	-
API-Anbieter Die Anbieter, die dieses Modell anbieten. (Diese Liste ist nicht vollständig.)	-
Datum des Wissensstandes Wann das Wissen des Modells zuletzt aktualisiert wurde.	-
Open Source Ob der Code des Modells öffentlich verfügbar ist.	Ja (Quelle)
Preisgestaltung Eingabe Kosten für die Verarbeitung von Token in Ihren Eingaben	-
Preisgestaltung Ausgabe Kosten für vom Modell generierte Token	-
MMLU Massive Multitask Language Understanding – Testet Wissen in 57 Fächern, darunter Mathematik, Geschichte, Recht und mehr	-
MMLU-Pro Ein robusterer MMLU-Benchmark mit schwierigeren, auf logisches Denken fokussierten Fragen, einer größeren Auswahl an Antworten und geringerer Sensitivität für Eingabevariationen	-
MMMU Massive Multitask Multimodal Understanding – Testet das Verständnis über Text, Bilder, Audio und Video hinweg	-
HellaSwag Ein anspruchsvoller Benchmark für Satzvervollständigung	-
HumanEval Bewertet Codegenerierung und Problemlösungsfähigkeiten	-
MATH Testet mathematische Problemlösungsfähigkeiten auf verschiedenen Schwierigkeitsstufen	-
GPQA Testet Wissen auf PhD-Niveau in Chemie, Biologie und Physik durch Multiple-Choice-Fragen, die tiefgehendes Fachwissen erfordern	-
IFEval Testet die Fähigkeit des Modells, Formatierungsvorgaben genau zu befolgen, angemessene Ausgaben zu generieren und konsistente Instruktionsbefolgung über verschiedene Aufgaben hinweg zu gewährleisten	-
SimpleQA Bewertung der Genauigkeit einfacher Fragen	-
AIME 2024	Quelle
AIME 2025	Quelle
Aider Polyglot Mehrsprachige Programmier-Benchmark.	-
LiveCodeBench v5 Benchmark für Echtzeit-Programmierung	-
Global MMLU (Lite) Eine vereinfachte Version des Benchmarks zur Beurteilung der Universalität von Modellen auf globaler Ebene.	-
MathVista Bewertet die mathematischen Denkfähigkeiten von KI-Modellen in visuellen Kontexten	-
Mobile Anwendung	-

Qwen 3 Spezifikationen, Bewertung und Vergleich

Qwen 3

Modellübersicht

Kommentar hinzufügen

LLMs vergleichen