Llama 3.3 70B Instruct AI Műszaki Specifikációk és Értékelés

Llama 3.3 70B Instruct

Hozzászólások: 0

„Llama 3.3 70B Instruct“, a Meta által létrehozott többnyelvű, nagyméretű nyelvi modell, amelyet kifejezetten utasításalapú feladatokhoz finomhangoltak és beszélgetési alkalmazásokhoz optimalizáltak. Több nyelven képes szöveget feldolgozni és generálni, kontextusablaka akár 128 000 tokenig terjed. A 2024. december 6-án megjelent modell számos nyílt forráskódú és saját fejlesztésű chatbotot felülmúl az iparági benchmarkokban. A skálázhatóság javítása érdekében Grouped-Query Attention (GQA) technológiát alkalmaz, és több mint 15 billió tokenből álló, nyilvánosan elérhető forrásokból származó változatos adathalmazon tanult. A modell tudása 2023. decemberéig aktuális.

3691

542

Helyezés az összesített rangsorban dátummal Július 2026

Felhasználói értékelés https://compare-ai.foundtt.com

3.9

Modell Áttekintés

Weboldal AI Modell Weboldal	Open
Szolgáltató A modellt biztosító entitás.	Meta
Csevegés Írjon be egy üzenetet a csevegés megkezdéséhez	-
Kiadási Dátum Mikor jelent meg a modell először.	1 év ago Dec 06, 2024
Modalitások A modell által feldolgozható adattípusok	szöveg ?
API Szolgáltatók A modellt kínáló szolgáltatók. (Ez nem egy teljes lista.)	Fireworks, Together, DeepInfra, Hyperbolic
Tudás Befejezési Dátuma Utoljára mikor frissült a modell tudása.	12.2024
Nyílt Forráskódú A modell kódja nyilvánosan használható-e.	Igen
Bemeneti Árazás A promptokban feldolgozott tokenek költsége	$0.23 millió tokenenként
Kimeneti Árazás A modell által generált tokenek költsége	$0.40 millió tokenenként
MMLU Massive Multitask Language Understanding – 57 tantárgyban teszteli a tudást, beleértve a matematikát, történelmet, jogot és egyebeket	86% 0-shot, CoT Forrás
MMLU-Pro Egy robusztusabb MMLU benchmark nehezebb, gondolkodásra összpontosító kérdésekkel, nagyobb választási lehetőségekkel és csökkentett prompt érzékenységgel	68.9% 5-shot, CoT Forrás
MMMU Massive Multitask Multimodal Understanding – Teszteli a megértést szöveg, kép, hang és videó terén	Nem elérhető
HellaSwag Egy kihívást jelentő mondatkiegészítési benchmark	Nem elérhető
HumanEval Értékeli a kódgenerálás és problémamegoldó képességeket	88.4% pass@1 Forrás
MATH Különböző nehézségi szinteken teszteli a matematikai problémamegoldó képességeket	77% 0-shot, CoT Forrás
GPQA Doktori szintű tudást tesztel kémiában, biológiában és fizikában, több választós kérdéseken keresztül, amelyek mély szakmai tudást igényelnek	50.5% 0-shot, CoT Forrás
IFEval Teszteli a modell képességét, hogy pontosan kövesse az explicit formázási utasításokat, megfelelő kimeneteket generáljon, és következetesen betartsa az utasításokat különböző feladatok során	92.1% Forrás
SimpleQA Egyszerű kérdések pontosságának értékelése	-
AIME 2024	-
AIME 2025	-
Aider Polyglot Többnyelvű programozási benchmark.	-
LiveCodeBench v5 Valós idejű programozási benchmark	-
Global MMLU (Lite) A benchmark egyszerűsített verziója a modellek globális szintű univerzalitásának értékelésére.	-
MathVista Értékeli az AI modellek matematikai következtetési képességeit vizuális környezetben	-
Mobilalkalmazás	-

Llama 3.3 70B Instruct Specifikációk, Értékelés és Összehasonlítás

Llama 3.3 70B Instruct

Modell Áttekintés

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása