Grok 3 Beta vs Claude 3.7 Sonnet - Extended Thinking

Grok 3 Beta

„Grok 3“ je najpokročilejší model spoločnosti xAI, trénovaný na superklastri Colossus s desaťnásobnou výpočtovou silou oproti predchádzajúcim špičkovým modelom. Má kontextové okno s kapacitou 1 milión tokenov a pokročilé schopnosti uvažovania, vylepšené rozsiahlym posilňovaným učením, ktoré umožňuje hlboké myšlienkové procesy trvajúce od sekúnd až po minúty pri riešení zložitých problémov. Model dosahuje špičkové výkony v akademických testoch a reálnych používateľských hodnoteniach, pričom získal Elo skóre 1402 v Chatbot Arena. Bol vydaný spolu s Grok 3 Mini, nákladovo efektívnou verziou optimalizovanou pre zjednodušené uvažovanie.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet je doteraz najpokročilejší model AI od spoločnosti Anthropic a prvý hybridný systém na uvažovanie na trhu. Ponúka štandardný aj rozšírený režim myslenia, pričom druhý z nich poskytuje transparentné, krok za krokom vysvetlené uvažovanie. Model vykazuje významné vylepšenia v kódovaní a vývoji front-endu webových aplikácií, dosahuje špičkové výsledky v testoch SWE-bench Verified a TAU-bench. Dostupné cez Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový štandard pre inteligentné riešenie problémov poháňané AI.

	Grok 3 Beta	Claude 3.7 Sonnet - Extended Thinking
Webová stránka ?	Open	Open
Poskytovateľ ?	xAI	Anthropic
Chat ?
Dátum vydania ?
Modality ?	text ? obrázky ? video ?	text ? obrázky ?
Poskytovatelia API ?	xAI	Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Dátum zastarania vedomostí ?	2025-01	-
Open Source ?	Nie	Nie
Cena za vstup ?	Nie je k dispozícii	$3.00 za milión tokenov
Cena za výstup ?	Nie je k dispozícii	$15.00 za milión tokenov
MMLU ?	Nie je k dispozícii	Nie je k dispozícii
MMLU-Pro ?	79.9% Base model Zdroj	Nie je k dispozícii
MMMU ?	78% With Think mode Zdroj	75% Zdroj
HellaSwag ?	Nie je k dispozícii	Nie je k dispozícii
HumanEval ?	Nie je k dispozícii	Nie je k dispozícii
MATH ?	Nie je k dispozícii	96.2% Zdroj
GPQA ?	84.6% With Think mode, Diamond Zdroj	84.8% Diamond Zdroj
IFEval ?	Nie je k dispozícii	93.2% Zdroj
SimpleQA ?	-	-
AIME 2024	-	-
AIME 2025	-	-
Aider Polyglot ?	-	-
LiveCodeBench v5 ?	-	-
Global MMLU (Lite) ?	-	-
MathVista ?	-	-
Mobilná aplikácia	Google Play Apple Apps	Google Play Apple Apps

Grok 3 Beta

Claude 3.7 Sonnet - Extended Thinking

Webová stránka ?

Open

Poskytovateľ ?

xAI

Anthropic

Chat ?

Dátum vydania ?

Modality ?

text ?
obrázky ?
video ?

text ?
obrázky ?

Poskytovatelia API ?

xAI

Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI

Dátum zastarania vedomostí ?

2025-01

Open Source ?

Nie

Cena za vstup ?

Nie je k dispozícii

$3.00 za milión tokenov

Cena za výstup ?

Nie je k dispozícii

$15.00 za milión tokenov

MMLU ?

Nie je k dispozícii

MMLU-Pro ?

79.9%
Base model
Zdroj

Nie je k dispozícii

MMMU ?

78%
With Think mode
Zdroj

75%
Zdroj

HellaSwag ?

Nie je k dispozícii

HumanEval ?

Nie je k dispozícii

MATH ?

Nie je k dispozícii

96.2%
Zdroj

GPQA ?

84.6%
With Think mode, Diamond
Zdroj

84.8%
Diamond
Zdroj

IFEval ?

Nie je k dispozícii

93.2%
Zdroj

SimpleQA ?

AIME 2024

AIME 2025

Aider Polyglot ?

LiveCodeBench v5 ?

Global MMLU (Lite) ?

MathVista ?

Mobilná aplikácia

Google Play
Apple Apps

Porovnaj LLM
Grok 3 Beta vs Claude 3.7 Sonnet - Extended Thinking

Grok 3 Beta

Claude 3.7 Sonnet - Extended Thinking

Porovnaj LLM

Pridať komentár

Porovnaj LLMGrok 3 Beta vs Claude 3.7 Sonnet - Extended Thinking

Grok 3 Beta

Claude 3.7 Sonnet - Extended Thinking

Porovnaj LLM

Pridať komentár

Porovnaj LLM
Grok 3 Beta vs Claude 3.7 Sonnet - Extended Thinking