Grok 4

GPT-4.1

GPT-4.1, kurį OpenAI pristatė 2025 m. balandžio 14 d., pristato 1 milijono ženklų konteksto langą ir palaiko iki 32 768 ženklų išvestį užklausai. Jis pasižymi puikiais rezultatais programavimo užduotyse, pasiekdamas 54,6 % SWE-Bench Verified etalono rodiklio ir parodydamas 10,5 % pagerėjimą, lyginant su GPT-4o, vykdant instrukcijas „MultiChallenge“. Modelio žinių atnaujinimo data – 2024 m. birželis. Kaina – 2,00 USD už milijoną įvesties ženklų ir 8,00 USD už milijoną išvesties ženklų, su 75 % nuolaida talpinamiems duomenims, todėl jis yra labai ekonomiškas pasikartojančioms užklausoms.

Grok 4GPT-4.1
Internetinė svetainė ?
Tiekėjas ?
Pokalbiai ?
Išleidimo data ?
Modalumai ?
tekstas ?
vaizdai ?
balso ?
vaizdo ?
tekstas ?
vaizdai ?
API tiekėjai ?
xAI
OpenAI API
Žinių nutraukimo data ?
-
-
Atvirojo kodo ?
Ne
Ne
Įvesties kaina ?
$3.00 už milijoną žodžių
$2.00 už milijoną žodžių
Išvesties kaina ?
$15.00 už milijoną žodžių
$8.00 už milijoną žodžių
MMLU ?
-
90.2%
pass@1
Šaltinis
MMLU-Pro ?
-
-
MMMU ?
-
74.8%
Šaltinis
HellaSwag ?
-
-
HumanEval ?
-
-
MATH ?
-
-
GPQA ?
87.5%
Science
Šaltinis
66.3%
Diamond
Šaltinis
IFEval ?
-
-
SimpleQA ?
-
-
AIME 2024
-
48.1%
Šaltinis
AIME 2025
91.7%
Competition Math
Šaltinis
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
79%
Competitive Coding
Šaltinis
-
Global MMLU (Lite) ?
-
87.3%
pass@1
Šaltinis
MathVista ?
-
-
Mobilioji programa

MathArena ?

Vidutinis balas
89%
-
AIME 2025
Testas, pagrįstas užduotimis iš matematikos konkurso (American Invitational Mathematics Examination),skirtas modelių matematikos įgūdžiams patikrinti.
91%
-
HMMT February 2025
Testas, pagrįstas užduotimis iš Harvard-MIT Mathematics Tournament, 2025 m. vasario mėn., skirtas modelių matematikos įgūdžiams patikrinti.
92%
-
BRUMO 2025
95%
-
SMT 2025
Testas, pagrįstas užduotimis iš Stanford Math Tournament, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.
86%
-
CMIMC 2025
Testas, pagrįstas užduotimis iš Canadian Mathematical Olympiad, 2025 m., skirtas modelių matematikos įgūdžiams patikrinti.
83%
-

Palyginti LLM

Pridėti komentarą


10%
Mūsų svetainė naudoja slapukus.

Privatumo ir slapukų politika: Ši svetainė naudoja slapukus. Tęsdami naudojimąsi svetaine, jūs sutinkate su jų naudojimu.