Qwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking

Qwen2.5-VL-32B

Durante los cinco meses desde el lanzamiento de Qwen2-VL, los desarrolladores han construido nuevos modelos basados en él, aportando valiosos comentarios. Ahora, Qwen2.5-VL introduce capacidades mejoradas, incluyendo análisis preciso de imágenes, textos y gráficos, así como localización de objetos con salidas estructuradas en JSON. Comprende videos largos, identifica eventos clave y funciona como agente interactuando con herramientas en computadoras y teléfonos. La arquitectura del modelo presenta procesamiento dinámico de video y un codificador ViT optimizado para mayor velocidad y precisión.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet es el modelo de IA más avanzado de Anthropic hasta la fecha y el primer sistema de razonamiento híbrido en el mercado. Ofrece modos de pensamiento estándar y extendido, este último proporcionando un razonamiento transparente y paso a paso. El modelo demuestra mejoras significativas en codificación y desarrollo web front-end, logrando resultados de vanguardia en SWE-bench Verified y TAU-bench. Disponible a través de Claude.ai, la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI, establece un nuevo estándar para la resolución inteligente de problemas impulsada por IA.

	Qwen2.5-VL-32B	Claude 3.7 Sonnet - Extended Thinking
Proveedor	Alibaba	Anthropic
Sitio Web	Open	Open
Fecha de Lanzamiento	Mar 25, 2025 1 mes ago	Feb 24, 2025 1 mes ago
Modalidades	texto ? imágenes ? video ?	texto ? imágenes ?
Proveedores de API	-	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Fecha de Corte de Conocimiento	Desconocido	-
Código Abierto	Sí (Fuente)	No
Costo de Entrada	$0	$3.00 por millón de tokens
Costo de Salida	$0	$15.00 por millón de tokens
MMLU	78.4% Fuente	No disponible
MMLU Pro	49.5%	No disponible
MMMU	70%	75% Fuente
HellaSwag	No disponible	No disponible
HumanEval	No disponible	No disponible
MATH	82.2%	96.2% Fuente
GPQA	46.0% Diamond	84.8% Diamond Fuente
IFEval	No disponible	93.2% Fuente
Aplicación Móvil	-	Google Play Apple Apps

Qwen2.5-VL-32B

Claude 3.7 Sonnet - Extended Thinking

Proveedor

Alibaba

Anthropic

Sitio Web

Open

Fecha de Lanzamiento

Mar 25, 2025
1 mes ago

Feb 24, 2025
1 mes ago

Modalidades

texto ?
imágenes ?
video ?

texto ?
imágenes ?

Proveedores de API

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Fecha de Corte de Conocimiento

Desconocido

Código Abierto

Sí (Fuente)

Costo de Entrada

$3.00 por millón de tokens

Costo de Salida

$15.00 por millón de tokens

MMLU

78.4%
Fuente

No disponible

MMLU Pro

49.5%

No disponible

MMMU

70%

75%
Fuente

HellaSwag

No disponible

HumanEval

No disponible

MATH

82.2%

96.2%
Fuente

GPQA

46.0%
Diamond

84.8%
Diamond
Fuente

IFEval

No disponible

93.2%
Fuente

Aplicación Móvil

Google Play
Apple Apps

Comparar LLMs
Qwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking

Qwen2.5-VL-32B

Claude 3.7 Sonnet - Extended Thinking

Comparar LLMs

Agregar un Comentario

Comparar LLMsQwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking

Qwen2.5-VL-32B

Claude 3.7 Sonnet - Extended Thinking

Comparar LLMs

Agregar un Comentario

Comparar LLMs
Qwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking