Grok 3 Beta vs Claude 3.7 Sonnet

Grok 3 Beta

„Grok 3“ je nejpokročilejší model společnosti xAI, trénovaný na superklastru Colossus s desetinásobným výpočetním výkonem oproti předchozím špičkovým modelům. Disponuje kontextovým oknem o velikosti 1 milionu tokenů a pokročilými schopnostmi uvažování, vylepšenými díky rozsáhlému posilovanému učení, což umožňuje hluboké myšlenkové procesy trvající od sekund až po minuty při řešení složitých problémů. Model dosahuje špičkového výkonu v akademických srovnávacích testech i v reálných uživatelských hodnoceních, získal Elo skóre 1402 v Chatbot Areně. Byl vydán spolu s Grok 3 Mini, nákladově efektivní variantou optimalizovanou pro zjednodušené uvažování.

Claude 3.7 Sonnet

Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.

	Grok 3 Beta	Claude 3.7 Sonnet
Webová stránka ?	Open	Open
Poskytovatel ?	xAI	Anthropic
Chat ?
Datum vydání ?
Modality ?	text ? obrázky ? video ?	text ? obrázky ?
Poskytovatelé API ?	xAI	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí ?	2025-01	-
Open Source ?	Ne	Ne
Cena za vstup ?	Není k dispozici	$3.00 na milion tokenů
Cena za výstup ?	Není k dispozici	$15.00 na milion tokenů
MMLU ?	Není k dispozici	Není k dispozici
MMLU-Pro ?	79.9% Base model Zdroj	Není k dispozici
MMMU ?	78% With Think mode Zdroj	71.8% Zdroj
HellaSwag ?	Není k dispozici	Není k dispozici
HumanEval ?	Není k dispozici	Není k dispozici
MATH ?	Není k dispozici	82.2% Zdroj
GPQA ?	84.6% With Think mode, Diamond Zdroj	68% Diamond Zdroj
IFEval ?	Není k dispozici	90.8% Zdroj
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilní aplikace	Google Play Apple Apps	Google Play Apple Apps
VideoGameBench ?
Celkové skóre	-	0%
Doom II	-	0%
Dream DX	-	0%
Awakening DX	-	0%
Civilization I	-	0%
Pokemon Crystal	-	0%
The Need for Speed	-	0%
The Incredible Machine	-	0%
Secret Game 1	-	0%
Secret Game 2	-	0%
Secret Game 3	-	0%

Grok 3 Beta

Claude 3.7 Sonnet

Webová stránka ?

Open

Poskytovatel ?

xAI

Anthropic

Chat ?

Datum vydání ?

Modality ?

text ?
obrázky ?
video ?

text ?
obrázky ?

Poskytovatelé API ?

xAI

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Datum uzávěrky znalostí ?

2025-01

Open Source ?

Cena za vstup ?

Není k dispozici

$3.00 na milion tokenů

Cena za výstup ?

Není k dispozici

$15.00 na milion tokenů

MMLU ?

Není k dispozici

MMLU-Pro ?

79.9%
Base model
Zdroj

Není k dispozici

MMMU ?

78%
With Think mode
Zdroj

71.8%
Zdroj

HellaSwag ?

Není k dispozici

HumanEval ?

Není k dispozici

MATH ?

Není k dispozici

82.2%
Zdroj

GPQA ?

84.6%
With Think mode, Diamond
Zdroj

68%
Diamond
Zdroj

IFEval ?

Není k dispozici

90.8%
Zdroj

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilní aplikace

Google Play
Apple Apps

VideoGameBench ?

Celkové skóre

Doom II

Dream DX

Awakening DX

Civilization I

Pokemon Crystal

The Need for Speed

The Incredible Machine

Secret Game 1

Secret Game 2

Secret Game 3

Porovnat LLM
Grok 3 Beta vs Claude 3.7 Sonnet

Grok 3 Beta

Claude 3.7 Sonnet

VideoGameBench ?

Porovnat LLM

Přidat komentář

Porovnat LLMGrok 3 Beta vs Claude 3.7 Sonnet

Grok 3 Beta

Claude 3.7 Sonnet

VideoGameBench ?

Porovnat LLM

Přidat komentář

Porovnat LLM
Grok 3 Beta vs Claude 3.7 Sonnet