GPT-4.1, ktorý OpenAI spustil 14. apríla 2025, prináša kontextové okno s veľkosťou 1 milión tokenov a podporuje výstupy až 32 768 tokenov na požiadavku. Poskytuje vynikajúci výkon v kódovacích úlohách, dosahuje 54,6 % v benchmarku SWE-Bench Verified a vykazuje 10,5 % zlepšenie oproti GPT-4o v MultiChallenge pri sledovaní inštrukcií. Vedomostný limit modelu je stanovený na jún 2024. Cena je 2,00 $ za milión tokenov pre vstup a 8,00 $ za milión tokenov pre výstup, s 75 % zľavou pre ukladané vstupy, čo ho robí vysoko nákladovo efektívnym pre opakované dopytovania.
„Llama 3.3 70B Instruct“, vytvorený spoločnosťou Meta, je viacjazyčný veľký jazykový model špeciálne doladený na úlohy založené na inštrukciách a optimalizovaný pre konverzačné aplikácie. Dokáže spracovávať a generovať text vo viacerých jazykoch, pričom jeho kontextové okno podporuje až 128 000 tokenov. Uvedený na trh 6. decembra 2024, model prekonáva mnohé open-source aj proprietárne chatboty v rôznych priemyselných benchmarkoch. Využíva Grouped-Query Attention (GQA) na zlepšenie škálovateľnosti a bol trénovaný na rôznorodej množine dát obsahujúcej viac ako 15 biliónov tokenov z verejne dostupných zdrojov. Znalosti modelu sú aktuálne k decembru 2023.
GPT-4.1 | Llama 3.3 70B Instruct | |
---|---|---|
Poskytovateľ | ||
Webová stránka | ||
Dátum vydania | Apr 14, 2025 2 týždne ago | Dec 06, 2024 4 mesiace ago |
Modality | text obrázky | text |
Poskytovatelia API | OpenAI API | Fireworks, Together, DeepInfra, Hyperbolic |
Dátum zastarania vedomostí | - | 12.2024 |
Open Source | Nie | Áno |
Cena za vstup | $2.00 za milión tokenov | $0.23 za milión tokenov |
Cena za výstup | $8.00 za milión tokenov | $0.40 za milión tokenov |
MMLU | 90.2% pass@1 Zdroj | 86% 0-shot, CoT Zdroj |
MMLU Pro | - | 68.9% 5-shot, CoT Zdroj |
MMMU | 74.8% Zdroj | Nie je k dispozícii |
HellaSwag | - | Nie je k dispozícii |
HumanEval | - | 88.4% pass@1 Zdroj |
MATH | - | 77% 0-shot, CoT Zdroj |
GPQA | 66.3% Diamond Zdroj | 50.5% 0-shot, CoT Zdroj |
IFEval | - | 92.1% Zdroj |
Mobilná aplikácia | - |
Compare AI. Test. Benchmarks. Chatboty pre mobilné aplikácie, Sketch
Copyright © 2025 All Right Reserved.