In de afgelopen vijf maanden sinds de release van Qwen2-VL hebben ontwikkelaars nieuwe modellen op basis hiervan gebouwd en waardevolle feedback geleverd. Nu introduceert Qwen2.5-VL verbeterde mogelijkheden, waaronder nauwkeurige analyse van afbeeldingen, tekst en grafieken, evenals objectlokalisatie met gestructureerde JSON-uitvoer. Het model begrijpt lange video's, identificeert belangrijke gebeurtenissen en functioneert als een agent die tools op computers en telefoons bedient. De architectuur van het model bevat dynamische videoprocessing en een geoptimaliseerde ViT-encoder voor verbeterde snelheid en nauwkeurigheid.
Mistral Large 2, ontwikkeld door Mistral, biedt een contextvenster van 128K tokens en is geprijsd op $3,00 per miljoen invoertokens en $9,00 per miljoen uitvoertokens. Uitgebracht op 24 juli 2024, scoorde het model 84,0 op de MMLU-benchmark in een 5-shot evaluatie, wat sterke prestaties in diverse taken aantoont.
Qwen2.5-VL-32B | Mistral Large 2 | |
---|---|---|
Aanbieder | ||
Website | ||
Releasedatum | Mar 25, 2025 4 weken ago | Jun 24, 2024 9 maanden ago |
Modaliteiten | tekst afbeeldingen video | tekst |
API-Aanbieders | - | Azure AI, AWS Bedrock, Google AI Studio, Vertex AI, Snowflake Cortex |
Kennisafsluitdatum | Onbekend | Onbekend |
Open Source | Ja (Bron) | Ja |
Prijzen Invoer | $0 | $3.00 per miljoen tokens |
Prijzen Uitvoer | $0 | $9.00 per miljoen tokens |
MMLU | 78.4% Bron | 84% 5-shot Bron |
MMLU Pro | 49.5% | 50.69% Bron |
MMMU | 70% | Niet beschikbaar |
HellaSwag | Niet beschikbaar | Niet beschikbaar |
HumanEval | Niet beschikbaar | Niet beschikbaar |
MATH | 82.2% | 1.13% Bron |
GPQA | 46.0% Diamond | 24.94% |
IFEval | Niet beschikbaar | 84.01% |
Mobiele applicatie | - | - |
Compare AI. Test. Benchmarks. Mobiele Chatbot-apps, Sketch
Copyright © 2025 All Right Reserved.