Qwen 3

Kommentare: 0
Qwen 3 #0
Qwen 3 #1
Qwen 3 #2
4507
122

Position im Gesamtranking zum Stand von
Juni 2026
10
Benutzerbewertung
https://compare-ai.foundtt.com
4.2

Modellübersicht

Webseite
KI-Modell-Webseite
Anbieter
Die Entität, die dieses Modell bereitstellt.
Chat
Geben Sie eine Nachricht ein, um zu chatten
Veröffentlichungsdatum
Wann das Modell erstmals veröffentlicht wurde.
1 Jahr ago
Apr 29, 2025
Modalitäten
Arten von Daten, die dieses Modell verarbeiten kann
-
API-Anbieter
Die Anbieter, die dieses Modell anbieten. (Diese Liste ist nicht vollständig.)
-
Datum des Wissensstandes
Wann das Wissen des Modells zuletzt aktualisiert wurde.
-
Open Source
Ob der Code des Modells öffentlich verfügbar ist.
Ja (Quelle)
Preisgestaltung Eingabe
Kosten für die Verarbeitung von Token in Ihren Eingaben
-
Preisgestaltung Ausgabe
Kosten für vom Modell generierte Token
-
MMLU
Massive Multitask Language Understanding – Testet Wissen in 57 Fächern, darunter Mathematik, Geschichte, Recht und mehr
-
MMLU-Pro
Ein robusterer MMLU-Benchmark mit schwierigeren, auf logisches Denken fokussierten Fragen, einer größeren Auswahl an Antworten und geringerer Sensitivität für Eingabevariationen
-
MMMU
Massive Multitask Multimodal Understanding – Testet das Verständnis über Text, Bilder, Audio und Video hinweg
-
HellaSwag
Ein anspruchsvoller Benchmark für Satzvervollständigung
-
HumanEval
Bewertet Codegenerierung und Problemlösungsfähigkeiten
-
MATH
Testet mathematische Problemlösungsfähigkeiten auf verschiedenen Schwierigkeitsstufen
-
GPQA
Testet Wissen auf PhD-Niveau in Chemie, Biologie und Physik durch Multiple-Choice-Fragen, die tiefgehendes Fachwissen erfordern
-
IFEval
Testet die Fähigkeit des Modells, Formatierungsvorgaben genau zu befolgen, angemessene Ausgaben zu generieren und konsistente Instruktionsbefolgung über verschiedene Aufgaben hinweg zu gewährleisten
-
SimpleQA
Bewertung der Genauigkeit einfacher Fragen
-
AIME 2024
Quelle
AIME 2025
Quelle
Aider Polyglot
Mehrsprachige Programmier-Benchmark.
-
LiveCodeBench v5
Benchmark für Echtzeit-Programmierung
-
Global MMLU (Lite)
Eine vereinfachte Version des Benchmarks zur Beurteilung der Universalität von Modellen auf globaler Ebene.
-
MathVista
Bewertet die mathematischen Denkfähigkeiten von KI-Modellen in visuellen Kontexten
-
Mobile Anwendung
-

Kommentar hinzufügen

LLMs vergleichen


10%
Unsere Website verwendet Cookies.

Datenschutz und Cookie-Richtlinie: Diese Website verwendet Cookies. Wenn Sie die Seite weiter nutzen, stimmen Sie deren Verwendung zu.