Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Qwen2-VL のリリースから過去5か月間で、開発者はこれを基に新しいモデルを構築し、貴重なフィードバックを提供しました。今回の Qwen2.5-VL は、画像・テキスト・チャートの正確な分析や、構造化された JSON 出力によるオブジェクトのローカライズ機能を強化しています。また、長尺の動画を理解し、重要なイベントを特定し、コンピューターやスマートフォン上のツールと対話するエージェントとして機能します。モデルのアーキテクチャには、動的な動画処理機能と最適化された ViT エンコーダーが組み込まれ、処理速度と精度が向上しています。

Gemini 2.0 Flash

Gemini 2.0 Flashは、Googleの高性能で低遅延のモデルで、高度なエージェント体験を実現するために設計されています。ネイティブツール統合を備え、テキスト、画像、動画、音声を含むマルチモーダル入力をサポートします。以前のバージョンに比べて大幅な改善を提供し、効率、速度、強化された機能をバランスよく組み合わせ、シームレスなリアルタイムインタラクションを実現します。

	Qwen2.5-VL-32B	Gemini 2.0 Flash
プロバイダー	Alibaba	Google
ウェブサイト	Open	Open
リリース日	Mar 25, 2025 4 週 ago	Dec 11, 2024 4 ヶ月 ago
モダリティ	テキスト ? 画像 ? 動画 ?	テキスト ? 画像 ? 音声 ? 動画 ?
APIプロバイダー	-	Google AI Studio, Vertex AI
知識のカットオフ日	不明	08.2024
オープンソース	はい (ソース)	いいえ
入力料金	$0	$0.10 100万トークンあたり
出力料金	$0	$0.40 100万トークンあたり
MMLU	78.4% ソース	利用不可
MMLU Pro	49.5%	77.6% ソース
MMMU	70%	71.7% ソース
HellaSwag	利用不可	利用不可
HumanEval	利用不可	利用不可
MATH	82.2%	90.9% ソース
GPQA	46.0% Diamond	60.1% Diamond ソース
IFEval	利用不可	利用不可
モバイルアプリケーション	-	Google Play Apple Apps

Qwen2.5-VL-32B

Gemini 2.0 Flash

プロバイダー

Alibaba

Google

ウェブサイト

Open

リリース日

Mar 25, 2025
4 週 ago

Dec 11, 2024
4 ヶ月 ago

モダリティ

テキスト ?
画像 ?
動画 ?

テキスト ?
画像 ?
音声 ?
動画 ?

APIプロバイダー

Google AI Studio, Vertex AI

知識のカットオフ日

不明

08.2024

オープンソース

はい (ソース)

いいえ

入力料金

$0.10 100万トークンあたり

出力料金

$0.40 100万トークンあたり

MMLU

78.4%
ソース

利用不可

MMLU Pro

49.5%

77.6%
ソース

MMMU

70%

71.7%
ソース

HellaSwag

利用不可

HumanEval

利用不可

MATH

82.2%

90.9%
ソース

GPQA

46.0%
Diamond

60.1%
Diamond
ソース

IFEval

利用不可

モバイルアプリケーション

Google Play
Apple Apps

LLMを比較
Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

LLMを比較

コメントを追加

LLMを比較Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

LLMを比較

コメントを追加

LLMを比較
Qwen2.5-VL-32B vs Gemini 2.0 Flash