Qwen2.5-VL-32B vs Gemini 2.0 Pro

Qwen2.5-VL-32B

W ciągu pięciu miesięcy od wydania Qwen2-VL deweloperzy zbudowali na jego podstawie nowe modele, dostarczając cennych opinii. Teraz Qwen2.5-VL wprowadza ulepszone możliwości, w tym precyzyjną analizę obrazów, tekstów i wykresów oraz lokalizację obiektów ze strukturalnymi wynikami JSON. Rozumie długie filmy, identyfikuje kluczowe wydarzenia i działa jako agent, współpracujący z narzędziami na komputerach i telefonach. Architektura modelu obejmuje dynamiczne przetwarzanie wideo i zoptymalizowany enkoder ViT dla lepszej szybkości i dokładności.

Gemini 2.0 Pro

Gemini 2.0 Pro to najnowocześniejszy model Google do tej pory, zapewniający wyjątkową wydajność w kodowaniu i z łatwością radzący sobie ze skomplikowanymi zapytaniami. Wyposażony jest w zaawansowane funkcje, takie jak natywna integracja narzędzi, generowanie obrazów i synteza mowy. Zaprojektowany z myślą o zaawansowanym rozumowaniu, model obsługuje wejścia multimodalne, w tym tekst, obrazy, wideo i dźwięk. Dostępny za pośrednictwem Google AI Studio i Vertex AI, oferuje znaczną poprawę wydajności w porównaniu do poprzednich wersji, jednocześnie zachowując wysoką efektywność.

	Qwen2.5-VL-32B	Gemini 2.0 Pro
Dostawca	Alibaba	Google
Strona internetowa	Open	Open
Data wydania	Mar 25, 2025 4 tygodnie ago	Dec 11, 2024 4 miesiące ago
Modalności	tekst ? obrazy ? wideo ?	tekst ? obrazy ? głos ? wideo ?
Dostawcy API	-	Google AI Studio, Vertex AI
Data ostatniej aktualizacji wiedzy	Nieznane	08.2024
Open Source	Tak (Źródło)	Nie
Cena za wejście	$0	$0.10 za milion tokenów
Cena za wyjście	$0	$0.40 za milion tokenów
MMLU	78.4% Źródło	Niedostępne
MMLU Pro	49.5%	79.1% Źródło
MMMU	70%	72.7% Źródło
HellaSwag	Niedostępne	Niedostępne
HumanEval	Niedostępne	Niedostępne
MATH	82.2%	91.8% Źródło
GPQA	46.0% Diamond	64.7% Diamond Źródło
IFEval	Niedostępne	Niedostępne
Aplikacja mobilna	-	Google Play Apple Apps

Qwen2.5-VL-32B

Gemini 2.0 Pro

Dostawca

Alibaba

Google

Strona internetowa

Open

Data wydania

Mar 25, 2025
4 tygodnie ago

Dec 11, 2024
4 miesiące ago

Modalności

tekst ?
obrazy ?
wideo ?

tekst ?
obrazy ?
głos ?
wideo ?

Dostawcy API

Google AI Studio, Vertex AI

Data ostatniej aktualizacji wiedzy

Nieznane

08.2024

Open Source

Tak (Źródło)

Nie

Cena za wejście

$0.10 za milion tokenów

Cena za wyjście

$0.40 za milion tokenów

MMLU

78.4%
Źródło

Niedostępne

MMLU Pro

49.5%

79.1%
Źródło

MMMU

70%

72.7%
Źródło

HellaSwag

Niedostępne

HumanEval

Niedostępne

MATH

82.2%

91.8%
Źródło

GPQA

46.0%
Diamond

64.7%
Diamond
Źródło

IFEval

Niedostępne

Aplikacja mobilna

Google Play
Apple Apps

Porównaj LLM
Qwen2.5-VL-32B vs Gemini 2.0 Pro

Qwen2.5-VL-32B

Gemini 2.0 Pro

Porównaj LLM

Dodaj komentarz

Porównaj LLMQwen2.5-VL-32B vs Gemini 2.0 Pro

Qwen2.5-VL-32B

Gemini 2.0 Pro

Porównaj LLM

Dodaj komentarz

Porównaj LLM
Qwen2.5-VL-32B vs Gemini 2.0 Pro