Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Durante los cinco meses desde el lanzamiento de Qwen2-VL, los desarrolladores han construido nuevos modelos basados en él, aportando valiosos comentarios. Ahora, Qwen2.5-VL introduce capacidades mejoradas, incluyendo análisis preciso de imágenes, textos y gráficos, así como localización de objetos con salidas estructuradas en JSON. Comprende videos largos, identifica eventos clave y funciona como agente interactuando con herramientas en computadoras y teléfonos. La arquitectura del modelo presenta procesamiento dinámico de video y un codificador ViT optimizado para mayor velocidad y precisión.

Gemini 2.0 Flash

Gemini 2.0 Flash es el modelo de alto rendimiento y baja latencia de Google diseñado para impulsar experiencias agentivas avanzadas. Equipado con integración nativa de herramientas, admite entradas multimodales, incluyendo texto, imágenes, video y audio. Con mejoras significativas respecto a versiones anteriores, el modelo equilibra eficiencia, velocidad y capacidades mejoradas para interacciones en tiempo real sin interrupciones.

	Qwen2.5-VL-32B	Gemini 2.0 Flash
Proveedor	Alibaba	Google
Sitio Web	Open	Open
Fecha de Lanzamiento	Mar 25, 2025 1 mes ago	Dec 11, 2024 4 meses ago
Modalidades	texto ? imágenes ? video ?	texto ? imágenes ? voz ? video ?
Proveedores de API	-	Google AI Studio, Vertex AI
Fecha de Corte de Conocimiento	Desconocido	08.2024
Código Abierto	Sí (Fuente)	No
Costo de Entrada	$0	$0.10 por millón de tokens
Costo de Salida	$0	$0.40 por millón de tokens
MMLU	78.4% Fuente	No disponible
MMLU Pro	49.5%	77.6% Fuente
MMMU	70%	71.7% Fuente
HellaSwag	No disponible	No disponible
HumanEval	No disponible	No disponible
MATH	82.2%	90.9% Fuente
GPQA	46.0% Diamond	60.1% Diamond Fuente
IFEval	No disponible	No disponible
Aplicación Móvil	-	Google Play Apple Apps

Qwen2.5-VL-32B

Gemini 2.0 Flash

Proveedor

Alibaba

Google

Sitio Web

Open

Fecha de Lanzamiento

Mar 25, 2025
1 mes ago

Dec 11, 2024
4 meses ago

Modalidades

texto ?
imágenes ?
video ?

texto ?
imágenes ?
voz ?
video ?

Proveedores de API

Google AI Studio, Vertex AI

Fecha de Corte de Conocimiento

Desconocido

08.2024

Código Abierto

Sí (Fuente)

Costo de Entrada

$0.10 por millón de tokens

Costo de Salida

$0.40 por millón de tokens

MMLU

78.4%
Fuente

No disponible

MMLU Pro

49.5%

77.6%
Fuente

MMMU

70%

71.7%
Fuente

HellaSwag

No disponible

HumanEval

No disponible

MATH

82.2%

90.9%
Fuente

GPQA

46.0%
Diamond

60.1%
Diamond
Fuente

IFEval

No disponible

Aplicación Móvil

Google Play
Apple Apps

Comparar LLMs
Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

Comparar LLMs

Agregar un Comentario

Comparar LLMsQwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

Comparar LLMs

Agregar un Comentario

Comparar LLMs
Qwen2.5-VL-32B vs Gemini 2.0 Flash