Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Durant les cinq mois depuis la sortie de Qwen2-VL, les développeurs ont construit de nouveaux modèles basés sur celui-ci, apportant des retours précieux. Maintenant, Qwen2.5-VL introduit des capacités améliorées, incluant une analyse précise des images, textes et graphiques, ainsi qu'une localisation d'objets avec des sorties JSON structurées. Il comprend les vidéos longues, identifie les événements clés et fonctionne comme un agent interagissant avec des outils sur ordinateurs et téléphones. L'architecture du modèle comprend un traitement vidéo dynamique et un encodeur ViT optimisé pour une vitesse et une précision améliorées.

Gemini 2.0 Flash

Gemini 2.0 Flash est le modèle haute performance et à faible latence de Google conçu pour des expériences agentiques avancées. Doté d'une intégration native d'outils, il prend en charge les entrées multimodales, y compris le texte, les images, la vidéo et l'audio. Avec des améliorations substantielles par rapport aux versions précédentes, le modèle équilibre efficacité, vitesse et capacités améliorées pour des interactions en temps réel fluides.

	Qwen2.5-VL-32B	Gemini 2.0 Flash
Fournisseur	Alibaba	Google
Site web	Open	Open
Date de sortie	Mar 25, 2025 1 mois ago	Dec 11, 2024 4 mois ago
Modalités	texte ? images ? vidéo ?	texte ? images ? voix ? vidéo ?
Fournisseurs d’API	-	Google AI Studio, Vertex AI
Date de mise à jour des connaissances	Inconnu	08.2024
Open Source	Oui (Source)	Non
Tarification d’entrée	$0	$0.10 par million de tokens
Tarification de sortie	$0	$0.40 par million de tokens
MMLU	78.4% Source	Non disponible
MMLU Pro	49.5%	77.6% Source
MMMU	70%	71.7% Source
HellaSwag	Non disponible	Non disponible
HumanEval	Non disponible	Non disponible
MATH	82.2%	90.9% Source
GPQA	46.0% Diamond	60.1% Diamond Source
IFEval	Non disponible	Non disponible
Application mobile	-	Google Play Apple Apps

Qwen2.5-VL-32B

Gemini 2.0 Flash

Fournisseur

Alibaba

Google

Site web

Open

Date de sortie

Mar 25, 2025
1 mois ago

Dec 11, 2024
4 mois ago

Modalités

texte ?
images ?
vidéo ?

texte ?
images ?
voix ?
vidéo ?

Fournisseurs d’API

Google AI Studio, Vertex AI

Date de mise à jour des connaissances

Inconnu

08.2024

Open Source

Oui (Source)

Non

Tarification d’entrée

$0.10 par million de tokens

Tarification de sortie

$0.40 par million de tokens

MMLU

78.4%
Source

Non disponible

MMLU Pro

49.5%

77.6%
Source

MMMU

70%

71.7%
Source

HellaSwag

Non disponible

HumanEval

Non disponible

MATH

82.2%

90.9%
Source

GPQA

46.0%
Diamond

60.1%
Diamond
Source

IFEval

Non disponible

Application mobile

Google Play
Apple Apps

Comparer les LLMs
Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

Comparer les LLMs

Ajouter un commentaire

Comparer les LLMsQwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

Comparer les LLMs

Ajouter un commentaire

Comparer les LLMs
Qwen2.5-VL-32B vs Gemini 2.0 Flash