Qwen2.5-VL-32B vs Gemini 2.0 Pro

Qwen2.5-VL-32B

Qwen2-VL のリリースから過去5か月間で、開発者はこれを基に新しいモデルを構築し、貴重なフィードバックを提供しました。今回の Qwen2.5-VL は、画像・テキスト・チャートの正確な分析や、構造化された JSON 出力によるオブジェクトのローカライズ機能を強化しています。また、長尺の動画を理解し、重要なイベントを特定し、コンピューターやスマートフォン上のツールと対話するエージェントとして機能します。モデルのアーキテクチャには、動的な動画処理機能と最適化された ViT エンコーダーが組み込まれ、処理速度と精度が向上しています。

Gemini 2.0 Pro

Gemini 2.0 Proは、Googleのこれまでで最も先進的なモデルで、卓越したコーディング性能と複雑なプロンプトの容易な処理を提供します。ネイティブツール統合、画像生成、音声合成などの強化された機能を備えています。高度な推論向けに設計され、テキスト、画像、動画、音声を含むマルチモーダル入力をサポートします。Google AI StudioとVertex AIを介して利用可能で、以前のバージョンに比べて大幅な性能向上を提供しながら高い効率を維持します。

	Qwen2.5-VL-32B	Gemini 2.0 Pro
プロバイダー	Alibaba	Google
ウェブサイト	Open	Open
リリース日	Mar 25, 2025 4 週 ago	Dec 11, 2024 4 ヶ月 ago
モダリティ	テキスト ? 画像 ? 動画 ?	テキスト ? 画像 ? 音声 ? 動画 ?
APIプロバイダー	-	Google AI Studio, Vertex AI
知識のカットオフ日	不明	08.2024
オープンソース	はい (ソース)	いいえ
入力料金	$0	$0.10 100万トークンあたり
出力料金	$0	$0.40 100万トークンあたり
MMLU	78.4% ソース	利用不可
MMLU Pro	49.5%	79.1% ソース
MMMU	70%	72.7% ソース
HellaSwag	利用不可	利用不可
HumanEval	利用不可	利用不可
MATH	82.2%	91.8% ソース
GPQA	46.0% Diamond	64.7% Diamond ソース
IFEval	利用不可	利用不可
モバイルアプリケーション	-	Google Play Apple Apps

Qwen2.5-VL-32B

Gemini 2.0 Pro

プロバイダー

Alibaba

Google

ウェブサイト

Open

リリース日

Mar 25, 2025
4 週 ago

Dec 11, 2024
4 ヶ月 ago

モダリティ

テキスト ?
画像 ?
動画 ?

テキスト ?
画像 ?
音声 ?
動画 ?

APIプロバイダー

Google AI Studio, Vertex AI

知識のカットオフ日

不明

08.2024

オープンソース

はい (ソース)

いいえ

入力料金

$0.10 100万トークンあたり

出力料金

$0.40 100万トークンあたり

MMLU

78.4%
ソース

利用不可

MMLU Pro

49.5%

79.1%
ソース

MMMU

70%

72.7%
ソース

HellaSwag

利用不可

HumanEval

利用不可

MATH

82.2%

91.8%
ソース

GPQA

46.0%
Diamond

64.7%
Diamond
ソース

IFEval

利用不可

モバイルアプリケーション

Google Play
Apple Apps

LLMを比較
Qwen2.5-VL-32B vs Gemini 2.0 Pro

Qwen2.5-VL-32B

Gemini 2.0 Pro

LLMを比較

コメントを追加

LLMを比較Qwen2.5-VL-32B vs Gemini 2.0 Pro

Qwen2.5-VL-32B

Gemini 2.0 Pro

LLMを比較

コメントを追加

LLMを比較
Qwen2.5-VL-32B vs Gemini 2.0 Pro