Qwen2.5-VL-32B

In de afgelopen vijf maanden sinds de release van Qwen2-VL hebben ontwikkelaars nieuwe modellen op basis hiervan gebouwd en waardevolle feedback geleverd. Nu introduceert Qwen2.5-VL verbeterde mogelijkheden, waaronder nauwkeurige analyse van afbeeldingen, tekst en grafieken, evenals objectlokalisatie met gestructureerde JSON-uitvoer. Het model begrijpt lange video's, identificeert belangrijke gebeurtenissen en functioneert als een agent die tools op computers en telefoons bedient. De architectuur van het model bevat dynamische videoprocessing en een geoptimaliseerde ViT-encoder voor verbeterde snelheid en nauwkeurigheid.

GPT-4.1 Nano

Qwen2.5-VL-32BGPT-4.1 Nano
Website ?
Aanbieder ?
Chat ?
Releasedatum ?
Modaliteiten ?
tekst ?
afbeeldingen ?
video ?
tekst ?
afbeeldingen ?
API-Aanbieders ?
-
OpenAI API
Kennisafsluitdatum ?
Onbekend
-
Open Source ?
Ja (Bron)
Nee
Prijzen Invoer ?
$0
$0.10 per miljoen tokens
Prijzen Uitvoer ?
$0
$0.40 per miljoen tokens
MMLU ?
78.4%
Bron
80.1%
Bron
MMLU-Pro ?
49.5%
-
MMMU ?
70%
55.4%
Bron
HellaSwag ?
Niet beschikbaar
-
HumanEval ?
Niet beschikbaar
-
MATH ?
82.2%
-
GPQA ?
46.0%
Diamond
50.3%
Diamond
Bron
IFEval ?
Niet beschikbaar
74.5%
Bron
SimpleQA ?
-
-
AIME 2024
-
29.4%
Bron
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
66.9%
Bron
MathVista ?
-
56.2%
Image Reasoning
Bron
Mobiele applicatie
-

Vergelijk LLMs

Voeg een reactie toe


10%
Onze site gebruikt cookies.

Privacy- en cookiebeleid: Deze site maakt gebruik van cookies. Door de site te blijven gebruiken, gaat u akkoord met het gebruik ervan.