Qwen 3

Reacties: 0
Qwen 3 #0
Qwen 3 #1
Qwen 3 #2
4507
122

Positie in de algemene ranglijst vanaf
Juni 2026
10
Gebruikersbeoordeling
https://compare-ai.foundtt.com
4.2

Modeloverzicht

Website
AI Model Webpagina
Aanbieder
De entiteit die dit model aanbiedt.
Chat
Voer een bericht in om te beginnen met chatten
Releasedatum
Wanneer het model voor het eerst is vrijgegeven.
1 jaar ago
Apr 29, 2025
Modaliteiten
Soorten gegevens die dit model kan verwerken
-
API-Aanbieders
De aanbieders die dit model leveren. (Dit is geen uitputtende lijst.)
-
Kennisafsluitdatum
Wanneer de kennis van het model voor het laatst is bijgewerkt.
-
Open Source
Of de code van het model beschikbaar is voor publiek gebruik.
Ja (Bron)
Prijzen Invoer
Kosten voor het verwerken van tokens in uw prompts
-
Prijzen Uitvoer
Kosten voor tokens gegenereerd door het model
-
MMLU
Massive Multitask Language Understanding - Test kennis over 57 onderwerpen, waaronder wiskunde, geschiedenis, recht en meer
-
MMLU-Pro
Een robuustere MMLU-benchmark met moeilijkere, op redenering gerichte vragen, een grotere keuzeset en verminderde gevoeligheid voor prompts
-
MMMU
Massive Multitask Multimodal Understanding - Test begrip van tekst, afbeeldingen, audio en video
-
HellaSwag
Een uitdagende benchmark voor zinsvoltooiing
-
HumanEval
Evalueert codegeneratie en probleemoplossende vaardigheden
-
MATH
Test wiskundige probleemoplossende vaardigheden op verschillende moeilijkheidsniveaus
-
GPQA
Test PhD-niveau kennis in scheikunde, biologie en natuurkunde door meerkeuzevragen die diepgaande domeinkennis vereisen
-
IFEval
Test het vermogen van het model om expliciete opmaakinstructies nauwkeurig te volgen, geschikte uitvoer te genereren en consistente instructienaleving te behouden bij verschillende taken
-
SimpleQA
Evaluatie van de nauwkeurigheid van eenvoudige vragen
-
AIME 2024
Bron
AIME 2025
Bron
Aider Polyglot
Meertalige programmeerbenchmark.
-
LiveCodeBench v5
Benchmark voor realtime programmeren
-
Global MMLU (Lite)
Een vereenvoudigde versie van de benchmark om de universaliteit van modellen op wereldwijd niveau te beoordelen.
-
MathVista
Evalueert de wiskundige redeneervermogens van AI-modellen binnen visuele contexten
-
Mobiele applicatie
-

Voeg een reactie toe

Vergelijk LLMs


10%
Onze site gebruikt cookies.

Privacy- en cookiebeleid: Deze site maakt gebruik van cookies. Door de site te blijven gebruiken, gaat u akkoord met het gebruik ervan.