




„Llama 3.3 70B Instruct“, a Meta által létrehozott többnyelvű, nagyméretű nyelvi modell, amelyet kifejezetten utasításalapú feladatokhoz finomhangoltak és beszélgetési alkalmazásokhoz optimalizáltak. Több nyelven képes szöveget feldolgozni és generálni, kontextusablaka akár 128 000 tokenig terjed. A 2024. december 6-án megjelent modell számos nyílt forráskódú és saját fejlesztésű chatbotot felülmúl az iparági benchmarkokban. A skálázhatóság javítása érdekében Grouped-Query Attention (GQA) technológiát alkalmaz, és több mint 15 billió tokenből álló, nyilvánosan elérhető forrásokból származó változatos adathalmazon tanult. A modell tudása 2023. decemberéig aktuális.
Weboldal AI Modell Weboldal | |
Szolgáltató A modellt biztosító entitás. | |
Csevegés Írjon be egy üzenetet a csevegés megkezdéséhez | - |
Kiadási Dátum Mikor jelent meg a modell először. | 1 év ago Dec 06, 2024 |
Modalitások A modell által feldolgozható adattípusok | szöveg |
API Szolgáltatók A modellt kínáló szolgáltatók. (Ez nem egy teljes lista.) | Fireworks, Together, DeepInfra, Hyperbolic |
Tudás Befejezési Dátuma Utoljára mikor frissült a modell tudása. | 12.2024 |
Nyílt Forráskódú A modell kódja nyilvánosan használható-e. | Igen |
Bemeneti Árazás A promptokban feldolgozott tokenek költsége | $0.23 millió tokenenként |
Kimeneti Árazás A modell által generált tokenek költsége | $0.40 millió tokenenként |
MMLU Massive Multitask Language Understanding – 57 tantárgyban teszteli a tudást, beleértve a matematikát, történelmet, jogot és egyebeket | 86% 0-shot, CoT Forrás |
MMLU-Pro Egy robusztusabb MMLU benchmark nehezebb, gondolkodásra összpontosító kérdésekkel, nagyobb választási lehetőségekkel és csökkentett prompt érzékenységgel | 68.9% 5-shot, CoT Forrás |
MMMU Massive Multitask Multimodal Understanding – Teszteli a megértést szöveg, kép, hang és videó terén | Nem elérhető |
HellaSwag Egy kihívást jelentő mondatkiegészítési benchmark | Nem elérhető |
HumanEval Értékeli a kódgenerálás és problémamegoldó képességeket | 88.4% pass@1 Forrás |
MATH Különböző nehézségi szinteken teszteli a matematikai problémamegoldó képességeket | 77% 0-shot, CoT Forrás |
GPQA Doktori szintű tudást tesztel kémiában, biológiában és fizikában, több választós kérdéseken keresztül, amelyek mély szakmai tudást igényelnek | 50.5% 0-shot, CoT Forrás |
IFEval Teszteli a modell képességét, hogy pontosan kövesse az explicit formázási utasításokat, megfelelő kimeneteket generáljon, és következetesen betartsa az utasításokat különböző feladatok során | 92.1% Forrás |
SimpleQA Egyszerű kérdések pontosságának értékelése | - |
AIME 2024 | - |
AIME 2025 | - |
Aider Polyglot Többnyelvű programozási benchmark. | - |
LiveCodeBench v5 Valós idejű programozási benchmark | - |
Global MMLU (Lite) A benchmark egyszerűsített verziója a modellek globális szintű univerzalitásának értékelésére. | - |
MathVista Értékeli az AI modellek matematikai következtetési képességeit vizuális környezetben | - |
Mobilalkalmazás | - |
Compare AI. Test. Benchmarks. Mobil Chatbot Alkalmazások, Sketch
Copyright © 2026 All Right Reserved.