Grok 3 Beta

„Grok 3“ yra pažangiausias xAI modelis, apmokytas Colossus superklasteryje, kurio skaičiavimo galia yra dešimt kartų didesnė nei ankstesnių pažangiausių modelių. Jis turi 1 milijono žetonų kontekstinį langą ir pažangius samprotavimo gebėjimus, patobulintus per didelio masto stiprinamąjį mokymąsi, leidžiantį atlikti gilias mąstymo operacijas nuo kelių sekundžių iki kelių minučių, sprendžiant sudėtingas problemas. Modelis demonstruoja aukščiausio lygio našumą akademiniuose testuose ir realių vartotojų vertinimuose, pasiekdamas 1402 Elo balą Chatbot Arenoje. Kartu buvo išleista ir „Grok 3 Mini“ – ekonomiška versija, optimizuota supaprastintam samprotavimui.

Claude 3.5 Haiku

Claude 3.5 Haiku, sukurtas „Anthropic“, siūlo 200 000 žetonų kontekstinį langą. Kaina nustatyta – 1 $ už milijoną įvesties žetonų ir 5 $ už milijoną išvesties žetonų, o naudojant užklausų kaupimą talpykloje galima sutaupyti iki 90 %, o per „Message Batches API“ – iki 50 %. Šis modelis, išleistas 2024 m. lapkričio 4 d., išsiskiria kodo užbaigimu, interaktyviais pokalbių robotais, duomenų išgavimu ir žymėjimu bei realaus laiko turinio moderavimu.

Grok 3 BetaClaude 3.5 Haiku
Internetinė svetainė ?
Tiekėjas ?
Pokalbiai ?
Išleidimo data ?
Modalumai ?
tekstas ?
vaizdai ?
vaizdo ?
tekstas ?
API tiekėjai ?
xAI
Anthropic, AWS Bedrock, Vertex AI
Žinių nutraukimo data ?
2025-01
01.04.2024
Atvirojo kodo ?
Ne
Ne
Įvesties kaina ?
Nėra prieinama
$0.80 už milijoną žodžių
Išvesties kaina ?
Nėra prieinama
$4.00
MMLU ?
Nėra prieinama
Nėra prieinama
MMLU-Pro ?
79.9%
Base model
Šaltinis
65%
0-shot CoT
Šaltinis
MMMU ?
78%
With Think mode
Šaltinis
Nėra prieinama
HellaSwag ?
Nėra prieinama
Nėra prieinama
HumanEval ?
Nėra prieinama
88.1%
0-shot
Šaltinis
MATH ?
Nėra prieinama
69.4%
0-shot CoT
Šaltinis
GPQA ?
84.6%
With Think mode, Diamond
Šaltinis
Nėra prieinama
IFEval ?
Nėra prieinama
Nėra prieinama
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilioji programa

Palyginti LLM

Pridėti komentarą


10%
Mūsų svetainė naudoja slapukus.

Privatumo ir slapukų politika: Ši svetainė naudoja slapukus. Tęsdami naudojimąsi svetaine, jūs sutinkate su jų naudojimu.