LLaMA 4 Scout – tai 17 milijardų parametrų modelis, kuris naudoja Mixture-of-Experts architektūrą su 16 aktyvių ekspertų, todėl yra lyderis savo multimodalių modelių kategorijoje. Jis nuolat lenkia konkurentus, tokius kaip Gemma 3, Gemini 2.0 Flash-Lite ir Mistral 3.1 įvairiose užduotyse. Nepaisant aukštos spartos, LLaMA 4 Scout yra nepaprastai efektyvus – gali veikti vienoje NVIDIA H100 GPU naudojant Int4 kvantavimą. Taip pat turi pirmaujantį 10 milijonų žodžių konteksto langą ir yra natūraliai multimodalinis – be problemų apdoroja tekstą, vaizdus ir vaizdo įrašus sudėtingoms realaus pasaulio reikmėms.
OpenAI o3 yra pažangiausias OpenAI samprotavimo modelis, specialiai sukurtas sudėtingoms, didelio pažinimo užduotims atlikti. Pristatytas 2025 m. balandį, jis pasižymi puikiais rezultatais programinės įrangos inžinerijoje, matematikoje ir mokslinėje problemų sprendimo srityje. Modelis pristato tris samprotavimo pastangų lygius – žemą, vidutinį ir aukštą – leidžiantys vartotojams subalansuoti delsą ir samprotavimo gylį pagal užduoties sudėtingumą. o3 palaiko pagrindines kūrėjų priemones, įskaitant funkcijų iškvietimus, struktūrizuotus rezultatus ir sistemos lygio žinutes. Turėdamas integruotas vaizdo galimybes, o3 gali interpretuoti ir analizuoti vaizdus, todėl tinka įvairioms daugialypėms programoms. Jis pasiekiamas per Chat Completions API, Assistants API ir Batch API, leidžiant lanksčiai integruoti į įmonių ir mokslo darbo eigą.
Llama 4 Scout | o3 | |
---|---|---|
Tiekėjas | ||
Internetinė svetainė | ||
Išleidimo data | Apr 05, 2025 2 savaitės ago | Apr 16, 2025 1 savaitė ago |
Modalumai | tekstas vaizdai vaizdo | tekstas vaizdai |
API tiekėjai | Meta AI, Hugging Face, Fireworks, Together, DeepInfra | OpenAI API |
Žinių nutraukimo data | 2025-04 | - |
Atvirojo kodo | Taip (Šaltinis) | Ne |
Įvesties kaina | Nėra prieinama | $10.00 už milijoną žodžių |
Išvesties kaina | Nėra prieinama | $40.00 už milijoną žodžių |
MMLU | Nėra prieinama | 82.9% Šaltinis |
MMLU Pro | 74.3% Reasoning & Knowledge Šaltinis | - |
MMMU | 69.4% Image Reasoning Šaltinis | - |
HellaSwag | Nėra prieinama | - |
HumanEval | Nėra prieinama | - |
MATH | Nėra prieinama | - |
GPQA | 57.2% Diamond Šaltinis | 83.3% Diamond, no tools Šaltinis |
IFEval | Nėra prieinama | - |
Mobilioji programa | - |
Compare AI. Test. Benchmarks. Mobiliosios pokalbių robotų programos, Sketch
Copyright © 2025 All Right Reserved.