Grok 3 Beta

„Grok 3“ je nejpokročilejší model společnosti xAI, trénovaný na superklastru Colossus s desetinásobným výpočetním výkonem oproti předchozím špičkovým modelům. Disponuje kontextovým oknem o velikosti 1 milionu tokenů a pokročilými schopnostmi uvažování, vylepšenými díky rozsáhlému posilovanému učení, což umožňuje hluboké myšlenkové procesy trvající od sekund až po minuty při řešení složitých problémů. Model dosahuje špičkového výkonu v akademických srovnávacích testech i v reálných uživatelských hodnoceních, získal Elo skóre 1402 v Chatbot Areně. Byl vydán spolu s Grok 3 Mini, nákladově efektivní variantou optimalizovanou pro zjednodušené uvažování.

Claude 3.7 Sonnet

Claude 3.7 Sonnet je dosud nejpokročilejší model společnosti Anthropic a první hybridní AI pro uvažování na trhu. Nabízí jak standardní, tak rozšířený režim myšlení, přičemž druhý z nich poskytuje transparentní, krok za krokem vysvětlené uvažování. Model vyniká v kódování a vývoji front-endu webových aplikací, dosahuje špičkových výsledků v testech SWE-bench Verified a TAU-bench. Dostupné přes Claude.ai, Anthropic API, Amazon Bedrock a Google Cloud Vertex AI, stanovuje nový standard pro inteligentní řešení problémů řízené AI.

Grok 3 BetaClaude 3.7 Sonnet
Poskytovatel
Webová stránka
Datum vydání
Jan 19, 2025
3 měsíce ago
Feb 24, 2025
1 měsíc ago
Modality
text ?
obrázky ?
video ?
text ?
obrázky ?
Poskytovatelé API
xAI
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Datum uzávěrky znalostí
2025-01
-
Open Source
Ne
Ne
Cena za vstup
Není k dispozici
$3.00 na milion tokenů
Cena za výstup
Není k dispozici
$15.00 na milion tokenů
MMLU
Není k dispozici
Není k dispozici
MMLU Pro
79.9%
Base model
Zdroj
Není k dispozici
MMMU
78%
With Think mode
Zdroj
71.8%
Zdroj
HellaSwag
Není k dispozici
Není k dispozici
HumanEval
Není k dispozici
Není k dispozici
MATH
Není k dispozici
82.2%
Zdroj
GPQA
84.6%
With Think mode, Diamond
Zdroj
68%
Diamond
Zdroj
IFEval
Není k dispozici
90.8%
Zdroj
Mobilní aplikace

Porovnat LLM

Přidat komentář


10%
Naše stránky používají soubory cookie.

Zásady ochrany osobních údajů a souborů cookie: Tento web používá soubory cookie. Dalším používáním webu souhlasíte s jejich používáním.