LLaMA 4 Scout – tai 17 milijardų parametrų modelis, kuris naudoja Mixture-of-Experts architektūrą su 16 aktyvių ekspertų, todėl yra lyderis savo multimodalių modelių kategorijoje. Jis nuolat lenkia konkurentus, tokius kaip Gemma 3, Gemini 2.0 Flash-Lite ir Mistral 3.1 įvairiose užduotyse. Nepaisant aukštos spartos, LLaMA 4 Scout yra nepaprastai efektyvus – gali veikti vienoje NVIDIA H100 GPU naudojant Int4 kvantavimą. Taip pat turi pirmaujantį 10 milijonų žodžių konteksto langą ir yra natūraliai multimodalinis – be problemų apdoroja tekstą, vaizdus ir vaizdo įrašus sudėtingoms realaus pasaulio reikmėms.
GPT-4.1, kurį OpenAI pristatė 2025 m. balandžio 14 d., pristato 1 milijono ženklų konteksto langą ir palaiko iki 32 768 ženklų išvestį užklausai. Jis pasižymi puikiais rezultatais programavimo užduotyse, pasiekdamas 54,6 % SWE-Bench Verified etalono rodiklio ir parodydamas 10,5 % pagerėjimą, lyginant su GPT-4o, vykdant instrukcijas „MultiChallenge“. Modelio žinių atnaujinimo data – 2024 m. birželis. Kaina – 2,00 USD už milijoną įvesties ženklų ir 8,00 USD už milijoną išvesties ženklų, su 75 % nuolaida talpinamiems duomenims, todėl jis yra labai ekonomiškas pasikartojančioms užklausoms.
Llama 4 Scout | GPT-4.1 | |
---|---|---|
Internetinė svetainė
| ||
Tiekėjas
| ||
Pokalbiai
| ||
Išleidimo data
| ||
Modalumai
| tekstas vaizdai vaizdo | tekstas vaizdai |
API tiekėjai
| Meta AI, Hugging Face, Fireworks, Together, DeepInfra | OpenAI API |
Žinių nutraukimo data
| 2025-04 | - |
Atvirojo kodo
| Taip (Šaltinis) | Ne |
Įvesties kaina
| Nėra prieinama | $2.00 už milijoną žodžių |
Išvesties kaina
| Nėra prieinama | $8.00 už milijoną žodžių |
MMLU
| Nėra prieinama | 90.2% pass@1 Šaltinis |
MMLU-Pro
| 74.3% Reasoning & Knowledge Šaltinis | - |
MMMU
| 69.4% Image Reasoning Šaltinis | 74.8% Šaltinis |
HellaSwag
| Nėra prieinama | - |
HumanEval
| Nėra prieinama | - |
MATH
| Nėra prieinama | - |
GPQA
| 57.2% Diamond Šaltinis | 66.3% Diamond Šaltinis |
IFEval
| Nėra prieinama | - |
SimpleQA
| - | - |
AIME 2024 | - | 48.1% Šaltinis |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | 87.3% pass@1 Šaltinis |
MathVista
| - | - |
Mobilioji programa | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.