Grok 3 Beta

„Grok 3“ je najpokročilejší model spoločnosti xAI, trénovaný na superklastri Colossus s desaťnásobnou výpočtovou silou oproti predchádzajúcim špičkovým modelom. Má kontextové okno s kapacitou 1 milión tokenov a pokročilé schopnosti uvažovania, vylepšené rozsiahlym posilňovaným učením, ktoré umožňuje hlboké myšlienkové procesy trvajúce od sekúnd až po minúty pri riešení zložitých problémov. Model dosahuje špičkové výkony v akademických testoch a reálnych používateľských hodnoteniach, pričom získal Elo skóre 1402 v Chatbot Arena. Bol vydaný spolu s Grok 3 Mini, nákladovo efektívnou verziou optimalizovanou pre zjednodušené uvažovanie.

Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking je pokročilý model logického myslenia navrhnutý na zvýšenie výkonu a zrozumiteľnosti tým, že sprístupňuje svoj myšlienkový proces. Vyniká pri riešení zložitých problémov, programátorských výziev a matematického uvažovania, pričom poskytuje riešenia krok za krokom. Model je optimalizovaný na úlohy vyžadujúce podrobné vysvetlenia a logickú analýzu a obsahuje natívnu integráciu nástrojov, vrátane vykonávania kódu a funkcií Google Search.

Grok 3 BetaGemini 2.0 Flash Thinking
Webová stránka ?
Poskytovateľ ?
Chat ?
Dátum vydania ?
Modality ?
text ?
obrázky ?
video ?
text ?
obrázky ?
Poskytovatelia API ?
xAI
Google AI Studio, Vertex AI, Gemini API
Dátum zastarania vedomostí ?
2025-01
04.2024
Open Source ?
Nie
Nie
Cena za vstup ?
Nie je k dispozícii
Nie je k dispozícii
Cena za výstup ?
Nie je k dispozícii
Nie je k dispozícii
MMLU ?
Nie je k dispozícii
Nie je k dispozícii
MMLU-Pro ?
79.9%
Base model
Zdroj
Nie je k dispozícii
MMMU ?
78%
With Think mode
Zdroj
75.4%
Zdroj
HellaSwag ?
Nie je k dispozícii
Nie je k dispozícii
HumanEval ?
Nie je k dispozícii
Nie je k dispozícii
MATH ?
Nie je k dispozícii
Nie je k dispozícii
GPQA ?
84.6%
With Think mode, Diamond
Zdroj
74.2%
Diamond Science
Zdroj
IFEval ?
Nie je k dispozícii
Nie je k dispozícii
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Mobilná aplikácia

Porovnaj LLM

Pridať komentár


10%
Naša stránka používa súbory cookies.

Zásady ochrany osobných údajov a súborov cookies: Táto stránka používa súbory cookies. Pokračovaním v používaní stránky súhlasíte s ich použitím.