„Grok 3“ yra pažangiausias xAI modelis, apmokytas Colossus superklasteryje, kurio skaičiavimo galia yra dešimt kartų didesnė nei ankstesnių pažangiausių modelių. Jis turi 1 milijono žetonų kontekstinį langą ir pažangius samprotavimo gebėjimus, patobulintus per didelio masto stiprinamąjį mokymąsi, leidžiantį atlikti gilias mąstymo operacijas nuo kelių sekundžių iki kelių minučių, sprendžiant sudėtingas problemas. Modelis demonstruoja aukščiausio lygio našumą akademiniuose testuose ir realių vartotojų vertinimuose, pasiekdamas 1402 Elo balą Chatbot Arenoje. Kartu buvo išleista ir „Grok 3 Mini“ – ekonomiška versija, optimizuota supaprastintam samprotavimui.
Gemini 2.0 Pro yra pažangiausias „Google“ modelis iki šiol, užtikrinantis išskirtinį programavimo našumą ir lengvai apdorojantis sudėtingas užklausas. Jis turi patobulintas funkcijas, tokias kaip natyvi įrankių integracija, vaizdų generavimas ir kalbos sintezė. Sukurtas pažangiam samprotavimui, šis modelis palaiko multimodalinius įvestis, įskaitant tekstą, vaizdus, vaizdo įrašus ir garsą. Prieinamas per „Google AI Studio“ ir „Vertex AI“, jis siūlo reikšmingus našumo patobulinimus, palyginti su ankstesnėmis versijomis, išlaikydamas aukštą efektyvumą.
Grok 3 Beta | Gemini 2.0 Pro | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | ||
Išleidimo data | Jan 19, 2025 3 mėnesiai ago | Dec 11, 2024 4 mėnesiai ago |
Modalumai | tekstas vaizdai vaizdo | tekstas vaizdai balso vaizdo |
API tiekėjai | xAI | Google AI Studio, Vertex AI |
Žinių nutraukimo data | 2025-01 | 08.2024 |
Atvirojo kodo | Ne | Ne |
Įvesties kaina | Nėra prieinama | $0.10 už milijoną žodžių |
Išvesties kaina | Nėra prieinama | $0.40 už milijoną žodžių |
MMLU | Nėra prieinama | Nėra prieinama |
MMLU Pro | 79.9% Base model Šaltinis | 79.1% Šaltinis |
MMMU | 78% With Think mode Šaltinis | 72.7% Šaltinis |
HellaSwag | Nėra prieinama | Nėra prieinama |
HumanEval | Nėra prieinama | Nėra prieinama |
MATH | Nėra prieinama | 91.8% Šaltinis |
GPQA | 84.6% With Think mode, Diamond Šaltinis | 64.7% Diamond Šaltinis |
IFEval | Nėra prieinama | Nėra prieinama |
Mobilioji programa |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.