Grok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

„Grok 3“ yra pažangiausias xAI modelis, apmokytas Colossus superklasteryje, kurio skaičiavimo galia yra dešimt kartų didesnė nei ankstesnių pažangiausių modelių. Jis turi 1 milijono žetonų kontekstinį langą ir pažangius samprotavimo gebėjimus, patobulintus per didelio masto stiprinamąjį mokymąsi, leidžiantį atlikti gilias mąstymo operacijas nuo kelių sekundžių iki kelių minučių, sprendžiant sudėtingas problemas. Modelis demonstruoja aukščiausio lygio našumą akademiniuose testuose ir realių vartotojų vertinimuose, pasiekdamas 1402 Elo balą Chatbot Arenoje. Kartu buvo išleista ir „Grok 3 Mini“ – ekonomiška versija, optimizuota supaprastintam samprotavimui.

Qwen2.5-VL-32B

Per pastaruosius penkis mėnesius nuo Qwen2-VL išleidimo kūrėjai sukūrė naujus modelius, paremtus juo, suteikdami vertingų atsiliepimų. Dabar Qwen2.5-VL pristato patobulintas galimybes, įskaitant tikslų vaizdų, teksto ir diagramų analizę bei objektų lokalizavimą su struktūruotomis JSON išvestimis. Jis supranta ilgus vaizdo įrašus, nustato pagrindinius įvykius ir veikia kaip agentas, bendraujantis su įrankiais kompiuteriuose ir telefonuose. Modelio architektūra apima dinaminį vaizdo įrašų apdorojimą ir optimizuotą ViT kodavimo įrenginį, skirtą greičiui ir tikslumui padidinti.

	Grok 3 Beta	Qwen2.5-VL-32B
Internetinė svetainė ?	Open	Open
Tiekėjas ?	xAI	Alibaba
Pokalbiai ?
Išleidimo data ?
Modalumai ?	tekstas ? vaizdai ? vaizdo ?	tekstas ? vaizdai ? vaizdo ?
API tiekėjai ?	xAI	-
Žinių nutraukimo data ?	2025-01	Nežinoma
Atvirojo kodo ?	Ne	Taip (Šaltinis)
Įvesties kaina ?	Nėra prieinama	$0
Išvesties kaina ?	Nėra prieinama	$0
MMLU ?	Nėra prieinama	78.4% Šaltinis
MMLU-Pro ?	79.9% Base model Šaltinis	49.5%
MMMU ?	78% With Think mode Šaltinis	70%
HellaSwag ?	Nėra prieinama	Nėra prieinama
HumanEval ?	Nėra prieinama	Nėra prieinama
MATH ?	Nėra prieinama	82.2%
GPQA ?	84.6% With Think mode, Diamond Šaltinis	46.0% Diamond
IFEval ?	Nėra prieinama	Nėra prieinama
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilioji programa	Google Play Apple Apps	-

Grok 3 Beta

Qwen2.5-VL-32B

Internetinė svetainė ?

Open

Tiekėjas ?

xAI

Alibaba

Pokalbiai ?

Išleidimo data ?

Modalumai ?

tekstas ?
vaizdai ?
vaizdo ?

API tiekėjai ?

xAI

Žinių nutraukimo data ?

2025-01

Nežinoma

Atvirojo kodo ?

Taip (Šaltinis)

Įvesties kaina ?

Nėra prieinama

Išvesties kaina ?

Nėra prieinama

MMLU ?

Nėra prieinama

78.4%
Šaltinis

MMLU-Pro ?

79.9%
Base model
Šaltinis

49.5%

MMMU ?

78%
With Think mode
Šaltinis

70%

HellaSwag ?

Nėra prieinama

HumanEval ?

Nėra prieinama

MATH ?

Nėra prieinama

82.2%

GPQA ?

84.6%
With Think mode, Diamond
Šaltinis

46.0%
Diamond

IFEval ?

Nėra prieinama

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilioji programa

Google Play
Apple Apps

Palyginti LLM
Grok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

Qwen2.5-VL-32B

Palyginti LLM

Pridėti komentarą

Palyginti LLMGrok 3 Beta vs Qwen2.5-VL-32B

Grok 3 Beta

Qwen2.5-VL-32B

Palyginti LLM

Pridėti komentarą

Palyginti LLM
Grok 3 Beta vs Qwen2.5-VL-32B