Grok 3 Beta

„Grok 3“ je najpokročilejší model spoločnosti xAI, trénovaný na superklastri Colossus s desaťnásobnou výpočtovou silou oproti predchádzajúcim špičkovým modelom. Má kontextové okno s kapacitou 1 milión tokenov a pokročilé schopnosti uvažovania, vylepšené rozsiahlym posilňovaným učením, ktoré umožňuje hlboké myšlienkové procesy trvajúce od sekúnd až po minúty pri riešení zložitých problémov. Model dosahuje špičkové výkony v akademických testoch a reálnych používateľských hodnoteniach, pričom získal Elo skóre 1402 v Chatbot Arena. Bol vydaný spolu s Grok 3 Mini, nákladovo efektívnou verziou optimalizovanou pre zjednodušené uvažovanie.

o3

OpenAI o3 je najpokročilejší model na uvažovanie od OpenAI, špeciálne vytvorený pre zvládanie zložitých úloh s vysokými kognitívnymi nárokmi. Spustený v apríli 2025 poskytuje výnimočný výkon v softvérovom inžinierstve, matematike a vedeckom riešení problémov. Model zavádza tri úrovne úsilia uvažovania – nízke, stredné a vysoké – čo umožňuje používateľom vyvážiť latenciu a hĺbku uvažovania podľa zložitosti úlohy. o3 podporuje základné nástroje pre vývojárov, vrátane volania funkcií, štruktúrovaných výstupov a systémových správ. S vstavanými vizuálnymi schopnosťami dokáže o3 interpretovať a analyzovať obrázky, čo ho robí vhodným pre multimodálne aplikácie. Je dostupný cez Chat Completions API, Assistants API a Batch API pre flexibilnú integráciu do podnikových a výskumných pracovných postupov.

Grok 3 Betao3
Webová stránka ?
Poskytovateľ ?
Chat ?
Dátum vydania ?
Modality ?
text ?
obrázky ?
video ?
text ?
obrázky ?
Poskytovatelia API ?
xAI
OpenAI API
Dátum zastarania vedomostí ?
2025-01
-
Open Source ?
Nie
Nie
Cena za vstup ?
Nie je k dispozícii
$10.00 za milión tokenov
Cena za výstup ?
Nie je k dispozícii
$40.00 za milión tokenov
MMLU ?
Nie je k dispozícii
82.9%
Zdroj
MMLU-Pro ?
79.9%
Base model
Zdroj
-
MMMU ?
78%
With Think mode
Zdroj
-
HellaSwag ?
Nie je k dispozícii
-
HumanEval ?
Nie je k dispozícii
-
MATH ?
Nie je k dispozícii
-
GPQA ?
84.6%
With Think mode, Diamond
Zdroj
83.3%
Diamond, no tools
Zdroj
IFEval ?
Nie je k dispozícii
-
SimpleQA ?
-
-
AIME 2024
-
91.6%
Zdroj
AIME 2025
-
88.9%
Zdroj
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilná aplikácia

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.