Grok 3 Beta vs o4-mini - Porovnaj LLM

Grok 3 Beta

„Grok 3“ je najpokročilejší model spoločnosti xAI, trénovaný na superklastri Colossus s desaťnásobnou výpočtovou silou oproti predchádzajúcim špičkovým modelom. Má kontextové okno s kapacitou 1 milión tokenov a pokročilé schopnosti uvažovania, vylepšené rozsiahlym posilňovaným učením, ktoré umožňuje hlboké myšlienkové procesy trvajúce od sekúnd až po minúty pri riešení zložitých problémov. Model dosahuje špičkové výkony v akademických testoch a reálnych používateľských hodnoteniach, pričom získal Elo skóre 1402 v Chatbot Arena. Bol vydaný spolu s Grok 3 Mini, nákladovo efektívnou verziou optimalizovanou pre zjednodušené uvažovanie.

o4-mini

OpenAI o4-mini je najnovší ľahký model v rade o-series, navrhnutý pre efektívne a schopné uvažovanie naprieč textovými a vizuálnymi úlohami. Optimalizovaný pre rýchlosť a výkon vyniká v generovaní kódu a porozumení založenom na obrázkoch, pri zachovaní rovnováhy medzi latenciou a hĺbkou uvažovania. Model podporuje kontextové okno s veľkosťou 200 000 tokenov s až 100 000 výstupnými tokenmi, čo ho robí vhodným pre rozsiahle interakcie. Spracováva textové aj obrazové vstupy a produkuje textové výstupy s pokročilými schopnosťami uvažovania. Vďaka kompaktnej architektúre a všestrannému výkonu je o4-mini ideálny pre širokú škálu reálnych aplikácií vyžadujúcich rýchlu a nákladovo efektívnu inteligenciu.

	Grok 3 Beta	o4-mini
Webová stránka ?	Open	Open
Poskytovateľ ?	xAI	OpenAI
Chat ?
Dátum vydania ?
Modality ?	text ? obrázky ? video ?	text ? obrázky ?
Poskytovatelia API ?	xAI	OpenAI API
Dátum zastarania vedomostí ?	2025-01	-
Open Source ?	Nie	Nie
Cena za vstup ?	Nie je k dispozícii	$1.10 za milión tokenov
Cena za výstup ?	Nie je k dispozícii	$4.40 za milión tokenov
MMLU ?	Nie je k dispozícii	fort
MMLU-Pro ?	79.9% Base model Zdroj	-
MMMU ?	78% With Think mode Zdroj	81.6% Zdroj
HellaSwag ?	Nie je k dispozícii	-
HumanEval ?	Nie je k dispozícii	14.28% Zdroj
MATH ?	Nie je k dispozícii	-
GPQA ?	84.6% With Think mode, Diamond Zdroj	81.4% Zdroj
IFEval ?	Nie je k dispozícii	-
SimpleQA ?	-	-
AIME 2024	-	93.4% Zdroj
AIME 2025	-	92.7% Zdroj
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilná aplikácia	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

o4-mini

Webová stránka ?

Open

Poskytovateľ ?

xAI

OpenAI

Chat ?

Dátum vydania ?

Modality ?

text ?
obrázky ?
video ?

text ?
obrázky ?

Poskytovatelia API ?

xAI

OpenAI API

Dátum zastarania vedomostí ?

2025-01

Open Source ?

Nie

Cena za vstup ?

Nie je k dispozícii

$1.10 za milión tokenov

Cena za výstup ?

Nie je k dispozícii

$4.40 za milión tokenov

MMLU ?

Nie je k dispozícii

fort

MMLU-Pro ?

79.9%
Base model
Zdroj

MMMU ?

78%
With Think mode
Zdroj

81.6%
Zdroj

HellaSwag ?

Nie je k dispozícii

HumanEval ?

Nie je k dispozícii

14.28%
Zdroj

MATH ?

Nie je k dispozícii

GPQA ?

84.6%
With Think mode, Diamond
Zdroj

81.4%
Zdroj

IFEval ?

Nie je k dispozícii

SimpleQA ?

AIME 2024

93.4%
Zdroj

AIME 2025

92.7%
Zdroj

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilná aplikácia

Google Play
Apple Apps

Porovnaj LLM
Grok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

Porovnaj LLM

Pridať komentár

Porovnaj LLMGrok 3 Beta vs o4-mini

Grok 3 Beta

o4-mini

Porovnaj LLM

Pridať komentár

Porovnaj LLM
Grok 3 Beta vs o4-mini