Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

W ciągu pięciu miesięcy od wydania Qwen2-VL deweloperzy zbudowali na jego podstawie nowe modele, dostarczając cennych opinii. Teraz Qwen2.5-VL wprowadza ulepszone możliwości, w tym precyzyjną analizę obrazów, tekstów i wykresów oraz lokalizację obiektów ze strukturalnymi wynikami JSON. Rozumie długie filmy, identyfikuje kluczowe wydarzenia i działa jako agent, współpracujący z narzędziami na komputerach i telefonach. Architektura modelu obejmuje dynamiczne przetwarzanie wideo i zoptymalizowany enkoder ViT dla lepszej szybkości i dokładności.

Gemini 2.0 Flash

Gemini 2.0 Flash to wysokowydajny model Google o niskim opóźnieniu, zaprojektowany do zaawansowanych doświadczeń agentowych. Wyposażony w natywną integrację narzędzi obsługuje dane multimodalne, w tym tekst, obrazy, wideo i dźwięk. Dzięki znacznym ulepszeniom w stosunku do poprzednich wersji model łączy wydajność, szybkość i rozszerzone możliwości dla płynnych interakcji w czasie rzeczywistym.

	Qwen2.5-VL-32B	Gemini 2.0 Flash
Dostawca	Alibaba	Google
Strona internetowa	Open	Open
Data wydania	Mar 25, 2025 1 miesiąc ago	Dec 11, 2024 4 miesiące ago
Modalności	tekst ? obrazy ? wideo ?	tekst ? obrazy ? głos ? wideo ?
Dostawcy API	-	Google AI Studio, Vertex AI
Data ostatniej aktualizacji wiedzy	Nieznane	08.2024
Open Source	Tak (Źródło)	Nie
Cena za wejście	$0	$0.10 za milion tokenów
Cena za wyjście	$0	$0.40 za milion tokenów
MMLU	78.4% Źródło	Niedostępne
MMLU Pro	49.5%	77.6% Źródło
MMMU	70%	71.7% Źródło
HellaSwag	Niedostępne	Niedostępne
HumanEval	Niedostępne	Niedostępne
MATH	82.2%	90.9% Źródło
GPQA	46.0% Diamond	60.1% Diamond Źródło
IFEval	Niedostępne	Niedostępne
Aplikacja mobilna	-	Google Play Apple Apps

Qwen2.5-VL-32B

Gemini 2.0 Flash

Dostawca

Alibaba

Google

Strona internetowa

Open

Data wydania

Mar 25, 2025
1 miesiąc ago

Dec 11, 2024
4 miesiące ago

Modalności

tekst ?
obrazy ?
wideo ?

tekst ?
obrazy ?
głos ?
wideo ?

Dostawcy API

Google AI Studio, Vertex AI

Data ostatniej aktualizacji wiedzy

Nieznane

08.2024

Open Source

Tak (Źródło)

Nie

Cena za wejście

$0.10 za milion tokenów

Cena za wyjście

$0.40 za milion tokenów

MMLU

78.4%
Źródło

Niedostępne

MMLU Pro

49.5%

77.6%
Źródło

MMMU

70%

71.7%
Źródło

HellaSwag

Niedostępne

HumanEval

Niedostępne

MATH

82.2%

90.9%
Źródło

GPQA

46.0%
Diamond

60.1%
Diamond
Źródło

IFEval

Niedostępne

Aplikacja mobilna

Google Play
Apple Apps

Porównaj LLM
Qwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

Porównaj LLM

Dodaj komentarz

Porównaj LLMQwen2.5-VL-32B vs Gemini 2.0 Flash

Qwen2.5-VL-32B

Gemini 2.0 Flash

Porównaj LLM

Dodaj komentarz

Porównaj LLM
Qwen2.5-VL-32B vs Gemini 2.0 Flash