Qwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking

Qwen2.5-VL-32B

Durant les cinq mois depuis la sortie de Qwen2-VL, les développeurs ont construit de nouveaux modèles basés sur celui-ci, apportant des retours précieux. Maintenant, Qwen2.5-VL introduit des capacités améliorées, incluant une analyse précise des images, textes et graphiques, ainsi qu'une localisation d'objets avec des sorties JSON structurées. Il comprend les vidéos longues, identifie les événements clés et fonctionne comme un agent interagissant avec des outils sur ordinateurs et téléphones. L'architecture du modèle comprend un traitement vidéo dynamique et un encodeur ViT optimisé pour une vitesse et une précision améliorées.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet est le modèle d'IA le plus avancé d'Anthropic à ce jour et le premier système de raisonnement hybride sur le marché. Il propose des modes de pensée standard et étendu, ce dernier offrant un raisonnement transparent et étape par étape. Le modèle démontre des améliorations significatives en codage et en développement web front-end, obtenant des résultats de pointe sur SWE-bench Verified et TAU-bench. Disponible via Claude.ai, l'API Anthropic, Amazon Bedrock et Google Cloud Vertex AI, il établit une nouvelle référence pour la résolution intelligente de problèmes pilotée par l'IA.

	Qwen2.5-VL-32B	Claude 3.7 Sonnet - Extended Thinking
Fournisseur	Alibaba	Anthropic
Site web	Open	Open
Date de sortie	Mar 25, 2025 1 mois ago	Feb 24, 2025 1 mois ago
Modalités	texte ? images ? vidéo ?	texte ? images ?
Fournisseurs d’API	-	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Date de mise à jour des connaissances	Inconnu	-
Open Source	Oui (Source)	Non
Tarification d’entrée	$0	$3.00 par million de tokens
Tarification de sortie	$0	$15.00 par million de tokens
MMLU	78.4% Source	Non disponible
MMLU Pro	49.5%	Non disponible
MMMU	70%	75% Source
HellaSwag	Non disponible	Non disponible
HumanEval	Non disponible	Non disponible
MATH	82.2%	96.2% Source
GPQA	46.0% Diamond	84.8% Diamond Source
IFEval	Non disponible	93.2% Source
Application mobile	-	Google Play Apple Apps

Qwen2.5-VL-32B

Claude 3.7 Sonnet - Extended Thinking

Fournisseur

Alibaba

Anthropic

Site web

Open

Date de sortie

Mar 25, 2025
1 mois ago

Feb 24, 2025
1 mois ago

Modalités

texte ?
images ?
vidéo ?

texte ?
images ?

Fournisseurs d’API

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Date de mise à jour des connaissances

Inconnu

Open Source

Oui (Source)

Non

Tarification d’entrée

$3.00 par million de tokens

Tarification de sortie

$15.00 par million de tokens

MMLU

78.4%
Source

Non disponible

MMLU Pro

49.5%

Non disponible

MMMU

70%

75%
Source

HellaSwag

Non disponible

HumanEval

Non disponible

MATH

82.2%

96.2%
Source

GPQA

46.0%
Diamond

84.8%
Diamond
Source

IFEval

Non disponible

93.2%
Source

Application mobile

Google Play
Apple Apps

Comparer les LLMs
Qwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking

Qwen2.5-VL-32B

Claude 3.7 Sonnet - Extended Thinking

Comparer les LLMs

Ajouter un commentaire

Comparer les LLMsQwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking

Qwen2.5-VL-32B

Claude 3.7 Sonnet - Extended Thinking

Comparer les LLMs

Ajouter un commentaire

Comparer les LLMs
Qwen2.5-VL-32B vs Claude 3.7 Sonnet - Extended Thinking