„Grok 3“ yra pažangiausias xAI modelis, apmokytas Colossus superklasteryje, kurio skaičiavimo galia yra dešimt kartų didesnė nei ankstesnių pažangiausių modelių. Jis turi 1 milijono žetonų kontekstinį langą ir pažangius samprotavimo gebėjimus, patobulintus per didelio masto stiprinamąjį mokymąsi, leidžiantį atlikti gilias mąstymo operacijas nuo kelių sekundžių iki kelių minučių, sprendžiant sudėtingas problemas. Modelis demonstruoja aukščiausio lygio našumą akademiniuose testuose ir realių vartotojų vertinimuose, pasiekdamas 1402 Elo balą Chatbot Arenoje. Kartu buvo išleista ir „Grok 3 Mini“ – ekonomiška versija, optimizuota supaprastintam samprotavimui.
„OpenAI“ naujausias GPT-4.5 modelis, išleistas 2025 m. vasario 27 d., yra revolucingas dirbtinio intelekto modelis su 12,8 trilijono parametrų ir 128 000 ženklų konteksto langu. Jis pasižymi pažangusiomis bendromis žiniomis, patobulinta emocine intelekcija, daugialypiu įvesties apdorojimu (tekstas ir vaizdas),sudėtingais funkcijų iškvietimais ir realaus laiko atsakymų srautais. Iš pradžių pristatytas „ChatGPT Pro“ naudotojams, vėliau bus prieinamas „Plus“ ir „Team“ abonentams, jis teikia atsakymus maždaug 37 ženklų per sekundę greičiu, todėl yra puikus pasirinkimas užduotims, reikalaujančioms aukšto lygio samprotavimo ir emocinio gilumo.
Grok 3 Beta | GPT-4.5 | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | ||
Išleidimo data | Jan 19, 2025 3 mėnesiai ago | Feb 27, 2025 1 mėnuo ago |
Modalumai | tekstas vaizdai vaizdo | tekstas vaizdai |
API tiekėjai | xAI | OpenAI, Azure OpenAI Service |
Žinių nutraukimo data | 2025-01 | 2023-10 |
Atvirojo kodo | Ne | Ne |
Įvesties kaina | Nėra prieinama | $75.00 už milijoną žodžių |
Išvesties kaina | Nėra prieinama | $150.00 už milijoną žodžių |
MMLU | Nėra prieinama | Nėra prieinama |
MMLU Pro | 79.9% Base model Šaltinis | Nėra prieinama |
MMMU | 78% With Think mode Šaltinis | 74.4% Šaltinis |
HellaSwag | Nėra prieinama | Nėra prieinama |
HumanEval | Nėra prieinama | Nėra prieinama |
MATH | Nėra prieinama | Nėra prieinama |
GPQA | 84.6% With Think mode, Diamond Šaltinis | 71.4% science Šaltinis |
IFEval | Nėra prieinama | Nėra prieinama |
Mobilioji programa |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.