Grok 3 Beta

„Grok 3“ je najpokročilejší model spoločnosti xAI, trénovaný na superklastri Colossus s desaťnásobnou výpočtovou silou oproti predchádzajúcim špičkovým modelom. Má kontextové okno s kapacitou 1 milión tokenov a pokročilé schopnosti uvažovania, vylepšené rozsiahlym posilňovaným učením, ktoré umožňuje hlboké myšlienkové procesy trvajúce od sekúnd až po minúty pri riešení zložitých problémov. Model dosahuje špičkové výkony v akademických testoch a reálnych používateľských hodnoteniach, pričom získal Elo skóre 1402 v Chatbot Arena. Bol vydaný spolu s Grok 3 Mini, nákladovo efektívnou verziou optimalizovanou pre zjednodušené uvažovanie.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, vytvorený spoločnosťou Meta, je viacjazyčný veľký jazykový model špeciálne doladený na úlohy založené na inštrukciách a optimalizovaný pre konverzačné aplikácie. Dokáže spracovávať a generovať text vo viacerých jazykoch, pričom jeho kontextové okno podporuje až 128 000 tokenov. Uvedený na trh 6. decembra 2024, model prekonáva mnohé open-source aj proprietárne chatboty v rôznych priemyselných benchmarkoch. Využíva Grouped-Query Attention (GQA) na zlepšenie škálovateľnosti a bol trénovaný na rôznorodej množine dát obsahujúcej viac ako 15 biliónov tokenov z verejne dostupných zdrojov. Znalosti modelu sú aktuálne k decembru 2023.

Grok 3 BetaLlama 3.3 70B Instruct
Webová stránka ?
Poskytovateľ ?
Chat ?
Dátum vydania ?
Modality ?
text ?
obrázky ?
video ?
text ?
Poskytovatelia API ?
xAI
Fireworks, Together, DeepInfra, Hyperbolic
Dátum zastarania vedomostí ?
2025-01
12.2024
Open Source ?
Nie
Áno
Cena za vstup ?
Nie je k dispozícii
$0.23 za milión tokenov
Cena za výstup ?
Nie je k dispozícii
$0.40 za milión tokenov
MMLU ?
Nie je k dispozícii
86%
0-shot, CoT
Zdroj
MMLU-Pro ?
79.9%
Base model
Zdroj
68.9%
5-shot, CoT
Zdroj
MMMU ?
78%
With Think mode
Zdroj
Nie je k dispozícii
HellaSwag ?
Nie je k dispozícii
Nie je k dispozícii
HumanEval ?
Nie je k dispozícii
88.4%
pass@1
Zdroj
MATH ?
Nie je k dispozícii
77%
0-shot, CoT
Zdroj
GPQA ?
84.6%
With Think mode, Diamond
Zdroj
50.5%
0-shot, CoT
Zdroj
IFEval ?
Nie je k dispozícii
92.1%
Zdroj
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilná aplikácia
-

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.