Grok 3 Beta vs o3-mini - Porovnat LLM

Grok 3 Beta

„Grok 3“ je nejpokročilejší model společnosti xAI, trénovaný na superklastru Colossus s desetinásobným výpočetním výkonem oproti předchozím špičkovým modelům. Disponuje kontextovým oknem o velikosti 1 milionu tokenů a pokročilými schopnostmi uvažování, vylepšenými díky rozsáhlému posilovanému učení, což umožňuje hluboké myšlenkové procesy trvající od sekund až po minuty při řešení složitých problémů. Model dosahuje špičkového výkonu v akademických srovnávacích testech i v reálných uživatelských hodnoceních, získal Elo skóre 1402 v Chatbot Areně. Byl vydán spolu s Grok 3 Mini, nákladově efektivní variantou optimalizovanou pro zjednodušené uvažování.

o3-mini

OpenAI o3-mini je vysokorychlostní a cenově efektivní model určený pro STEM aplikace, který vyniká ve vědě, matematice a programování. Uvedený na trh v lednu 2025, obsahuje klíčové funkce pro vývojáře, jako je volání funkcí, strukturované výstupy a zprávy pro vývojáře. Model nabízí tři úrovně hloubky úvah—nízkou, střední a vysokou—umožňující uživatelům optimalizovat rovnováhu mezi hlubší analýzou a rychlejší odezvou. Na rozdíl od modelu o3 neobsahuje schopnosti zpracování obrazu. Zpočátku je dostupný vybraným vývojářům v úrovních API 3-5 a lze jej využívat prostřednictvím API pro doplňování chatů, API asistentů a Batch API.

	Grok 3 Beta	o3-mini
Webová stránka ?	Open	Open
Poskytovatel ?	xAI	OpenAI
Chat ?
Datum vydání ?
Modality ?	text ? obrázky ? video ?	text ?
Poskytovatelé API ?	xAI	OpenAI API
Datum uzávěrky znalostí ?	2025-01	Neznámý
Open Source ?	Ne	Ne
Cena za vstup ?	Není k dispozici	$1.10 na milion tokenů
Cena za výstup ?	Není k dispozici	$4.40 na milion tokenů
MMLU ?	Není k dispozici	86.9% pass@1, high effort Zdroj
MMLU-Pro ?	79.9% Base model Zdroj	Není k dispozici
MMMU ?	78% With Think mode Zdroj	Není k dispozici
HellaSwag ?	Není k dispozici	Není k dispozici
HumanEval ?	Není k dispozici	Není k dispozici
MATH ?	Není k dispozici	97.9% pass@1, high effort Zdroj
GPQA ?	84.6% With Think mode, Diamond Zdroj	79.7% 0-shot, high effort Zdroj
IFEval ?	Není k dispozici	Není k dispozici
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilní aplikace	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

o3-mini

Webová stránka ?

Open

Poskytovatel ?

xAI

OpenAI

Chat ?

Datum vydání ?

Modality ?

text ?
obrázky ?
video ?

text ?

Poskytovatelé API ?

xAI

OpenAI API

Datum uzávěrky znalostí ?

2025-01

Neznámý

Open Source ?

Cena za vstup ?

Není k dispozici

$1.10 na milion tokenů

Cena za výstup ?

Není k dispozici

$4.40 na milion tokenů

MMLU ?

Není k dispozici

86.9%
pass@1, high effort
Zdroj

MMLU-Pro ?

79.9%
Base model
Zdroj

Není k dispozici

MMMU ?

78%
With Think mode
Zdroj

Není k dispozici

HellaSwag ?

Není k dispozici

HumanEval ?

Není k dispozici

MATH ?

Není k dispozici

97.9%
pass@1, high effort
Zdroj

GPQA ?

84.6%
With Think mode, Diamond
Zdroj

79.7%
0-shot, high effort
Zdroj

IFEval ?

Není k dispozici

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilní aplikace

Google Play
Apple Apps

Porovnat LLM
Grok 3 Beta vs o3-mini

Grok 3 Beta

o3-mini

Porovnat LLM

Přidat komentář

Porovnat LLMGrok 3 Beta vs o3-mini

Grok 3 Beta

o3-mini

Porovnat LLM

Přidat komentář

Porovnat LLM
Grok 3 Beta vs o3-mini