Grok 3 Beta vs Llama 3.3 70B Instruct

Grok 3 Beta

„Grok 3“ je nejpokročilejší model společnosti xAI, trénovaný na superklastru Colossus s desetinásobným výpočetním výkonem oproti předchozím špičkovým modelům. Disponuje kontextovým oknem o velikosti 1 milionu tokenů a pokročilými schopnostmi uvažování, vylepšenými díky rozsáhlému posilovanému učení, což umožňuje hluboké myšlenkové procesy trvající od sekund až po minuty při řešení složitých problémů. Model dosahuje špičkového výkonu v akademických srovnávacích testech i v reálných uživatelských hodnoceních, získal Elo skóre 1402 v Chatbot Areně. Byl vydán spolu s Grok 3 Mini, nákladově efektivní variantou optimalizovanou pro zjednodušené uvažování.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, vytvořený společností Meta, je vícejazyčný velký jazykový model speciálně vyladěný pro úlohy založené na instrukcích a optimalizovaný pro konverzační aplikace. Je schopen zpracovávat a generovat text v několika jazycích s kontextovým oknem podporujícím až 128 000 tokenů. Uvedený na trh 6. prosince 2024, model překonává řadu open-source i proprietárních chatbotů v různých průmyslových srovnávacích testech. Využívá Grouped-Query Attention (GQA) ke zlepšení škálovatelnosti a byl natrénován na různorodé množině dat obsahující více než 15 bilionů tokenů z veřejně dostupných zdrojů. Znalosti modelu jsou aktuální k prosinci 2023.

	Grok 3 Beta	Llama 3.3 70B Instruct
Webová stránka ?	Open	Open
Poskytovatel ?	xAI	Meta
Chat ?
Datum vydání ?
Modality ?	text ? obrázky ? video ?	text ?
Poskytovatelé API ?	xAI	Fireworks, Together, DeepInfra, Hyperbolic
Datum uzávěrky znalostí ?	2025-01	12.2024
Open Source ?	Ne	Ano
Cena za vstup ?	Není k dispozici	$0.23 na milion tokenů
Cena za výstup ?	Není k dispozici	$0.40 na milion tokenů
MMLU ?	Není k dispozici	86% 0-shot, CoT Zdroj
MMLU-Pro ?	79.9% Base model Zdroj	68.9% 5-shot, CoT Zdroj
MMMU ?	78% With Think mode Zdroj	Není k dispozici
HellaSwag ?	Není k dispozici	Není k dispozici
HumanEval ?	Není k dispozici	88.4% pass@1 Zdroj
MATH ?	Není k dispozici	77% 0-shot, CoT Zdroj
GPQA ?	84.6% With Think mode, Diamond Zdroj	50.5% 0-shot, CoT Zdroj
IFEval ?	Není k dispozici	92.1% Zdroj
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilní aplikace	Google Play Apple Apps	-

Grok 3 Beta

Llama 3.3 70B Instruct

Webová stránka ?

Open

Poskytovatel ?

xAI

Porovnat LLM
Grok 3 Beta vs Llama 3.3 70B Instruct

Grok 3 Beta

Llama 3.3 70B Instruct

Porovnat LLM

Přidat komentář

Porovnat LLMGrok 3 Beta vs Llama 3.3 70B Instruct

Grok 3 Beta

Llama 3.3 70B Instruct

Porovnat LLM

Přidat komentář

Porovnat LLM
Grok 3 Beta vs Llama 3.3 70B Instruct