Llama 3.3 70B Instruct

Hozzászólások: 0
Llama 3.3 70B Instruct #0
Llama 3.3 70B Instruct #1
Llama 3.3 70B Instruct #2
Llama 3.3 70B Instruct #3

„Llama 3.3 70B Instruct“, a Meta által létrehozott többnyelvű, nagyméretű nyelvi modell, amelyet kifejezetten utasításalapú feladatokhoz finomhangoltak és beszélgetési alkalmazásokhoz optimalizáltak. Több nyelven képes szöveget feldolgozni és generálni, kontextusablaka akár 128 000 tokenig terjed. A 2024. december 6-án megjelent modell számos nyílt forráskódú és saját fejlesztésű chatbotot felülmúl az iparági benchmarkokban. A skálázhatóság javítása érdekében Grouped-Query Attention (GQA) technológiát alkalmaz, és több mint 15 billió tokenből álló, nyilvánosan elérhető forrásokból származó változatos adathalmazon tanult. A modell tudása 2023. decemberéig aktuális.

3691
542

Helyezés az összesített rangsorban dátummal Június 2026
29
Felhasználói értékelés https://compare-ai.foundtt.com
3.9

Modell Áttekintés

Weboldal
AI Modell Weboldal
Szolgáltató
A modellt biztosító entitás.
Csevegés
Írjon be egy üzenetet a csevegés megkezdéséhez
-
Kiadási Dátum
Mikor jelent meg a modell először.
1 év ago
Dec 06, 2024
Modalitások
A modell által feldolgozható adattípusok
szöveg ?
API Szolgáltatók
A modellt kínáló szolgáltatók. (Ez nem egy teljes lista.)
Fireworks, Together, DeepInfra, Hyperbolic
Tudás Befejezési Dátuma
Utoljára mikor frissült a modell tudása.
12.2024
Nyílt Forráskódú
A modell kódja nyilvánosan használható-e.
Igen
Bemeneti Árazás
A promptokban feldolgozott tokenek költsége
$0.23 millió tokenenként
Kimeneti Árazás
A modell által generált tokenek költsége
$0.40 millió tokenenként
MMLU
Massive Multitask Language Understanding – 57 tantárgyban teszteli a tudást, beleértve a matematikát, történelmet, jogot és egyebeket
86%
0-shot, CoT
Forrás
MMLU-Pro
Egy robusztusabb MMLU benchmark nehezebb, gondolkodásra összpontosító kérdésekkel, nagyobb választási lehetőségekkel és csökkentett prompt érzékenységgel
68.9%
5-shot, CoT
Forrás
MMMU
Massive Multitask Multimodal Understanding – Teszteli a megértést szöveg, kép, hang és videó terén
Nem elérhető
HellaSwag
Egy kihívást jelentő mondatkiegészítési benchmark
Nem elérhető
HumanEval
Értékeli a kódgenerálás és problémamegoldó képességeket
88.4%
pass@1
Forrás
MATH
Különböző nehézségi szinteken teszteli a matematikai problémamegoldó képességeket
77%
0-shot, CoT
Forrás
GPQA
Doktori szintű tudást tesztel kémiában, biológiában és fizikában, több választós kérdéseken keresztül, amelyek mély szakmai tudást igényelnek
50.5%
0-shot, CoT
Forrás
IFEval
Teszteli a modell képességét, hogy pontosan kövesse az explicit formázási utasításokat, megfelelő kimeneteket generáljon, és következetesen betartsa az utasításokat különböző feladatok során
92.1%
Forrás
SimpleQA
Egyszerű kérdések pontosságának értékelése
-
AIME 2024
-
AIME 2025
-
Aider Polyglot
Többnyelvű programozási benchmark.
-
LiveCodeBench v5
Valós idejű programozási benchmark
-
Global MMLU (Lite)
A benchmark egyszerűsített verziója a modellek globális szintű univerzalitásának értékelésére.
-
MathVista
Értékeli az AI modellek matematikai következtetési képességeit vizuális környezetben
-
Mobilalkalmazás
-

Hozzászólás Hozzáadása

LLM-ek Összehasonlítása


10%
Webhelyünk sütiket használ

Ez az oldal sütiket használ. A webhely további használatával Ön elfogadja azok használatát.