GPT-4.1, kurį OpenAI pristatė 2025 m. balandžio 14 d., pristato 1 milijono ženklų konteksto langą ir palaiko iki 32 768 ženklų išvestį užklausai. Jis pasižymi puikiais rezultatais programavimo užduotyse, pasiekdamas 54,6 % SWE-Bench Verified etalono rodiklio ir parodydamas 10,5 % pagerėjimą, lyginant su GPT-4o, vykdant instrukcijas „MultiChallenge“. Modelio žinių atnaujinimo data – 2024 m. birželis. Kaina – 2,00 USD už milijoną įvesties ženklų ir 8,00 USD už milijoną išvesties ženklų, su 75 % nuolaida talpinamiems duomenims, todėl jis yra labai ekonomiškas pasikartojančioms užklausoms.
„Gemini 2.0 Flash Thinking“ yra pažangus samprotavimo modelis, sukurtas siekiant pagerinti našumą ir aiškumą, padarant savo mąstymo procesą matomą. Jis puikiai sprendžia sudėtingas problemas, programavimo iššūkius ir matematinius uždavinius, pateikdamas žingsnis po žingsnio sprendimus. Optimizuotas užduotims, reikalaujančioms išsamių paaiškinimų ir loginės analizės, modelis taip pat turi integruotas priemones, įskaitant kodo vykdymą ir „Google“ paieškos galimybes.
GPT-4.1 | Gemini 2.0 Flash Thinking | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | ||
Išleidimo data | Apr 14, 2025 2 savaitės ago | Dec 19, 2024 4 mėnesiai ago |
Modalumai | tekstas vaizdai | tekstas vaizdai |
API tiekėjai | OpenAI API | Google AI Studio, Vertex AI, Gemini API |
Žinių nutraukimo data | - | 04.2024 |
Atvirojo kodo | Ne | Ne |
Įvesties kaina | $2.00 už milijoną žodžių | Nėra prieinama |
Išvesties kaina | $8.00 už milijoną žodžių | Nėra prieinama |
MMLU | 90.2% pass@1 Šaltinis | Nėra prieinama |
MMLU Pro | - | Nėra prieinama |
MMMU | 74.8% Šaltinis | 75.4% Šaltinis |
HellaSwag | - | Nėra prieinama |
HumanEval | - | Nėra prieinama |
MATH | - | Nėra prieinama |
GPQA | 66.3% Diamond Šaltinis | 74.2% Diamond Science Šaltinis |
IFEval | - | Nėra prieinama |
Mobilioji programa |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.