
„Llama 3.3 70B Instruct“, vytvorený spoločnosťou Meta, je viacjazyčný veľký jazykový model špeciálne doladený na úlohy založené na inštrukciách a optimalizovaný pre konverzačné aplikácie. Dokáže spracovávať a generovať text vo viacerých jazykoch, pričom jeho kontextové okno podporuje až 128 000 tokenov. Uvedený na trh 6. decembra 2024, model prekonáva mnohé open-source aj proprietárne chatboty v rôznych priemyselných benchmarkoch. Využíva Grouped-Query Attention (GQA) na zlepšenie škálovateľnosti a bol trénovaný na rôznorodej množine dát obsahujúcej viac ako 15 biliónov tokenov z verejne dostupných zdrojov. Znalosti modelu sú aktuálne k decembru 2023.
| Llama 3.3 70B Instruct | GLM-4.5 | |
|---|---|---|
Webová stránka
| ||
Poskytovateľ
| ||
Chat
| ||
Dátum vydania
| ||
Modality
| text | text |
Poskytovatelia API
| Fireworks, Together, DeepInfra, Hyperbolic | Zhipu AI |
Dátum zastarania vedomostí
| 12.2024 | Neznáme |
Open Source
| Áno | Áno |
Cena za vstup
| $0.23 za milión tokenov | - |
Cena za výstup
| $0.40 za milión tokenov | - |
MMLU
| 86% 0-shot, CoT Zdroj | 84.6% Academic Knowledge Zdroj |
MMLU-Pro
| 68.9% 5-shot, CoT Zdroj | - |
MMMU
| Nie je k dispozícii | - |
HellaSwag
| Nie je k dispozícii | - |
HumanEval
| 88.4% pass@1 Zdroj | - |
MATH
| 77% 0-shot, CoT Zdroj | - |
GPQA
| 50.5% 0-shot, CoT Zdroj | - |
IFEval
| 92.1% Zdroj | - |
SimpleQA
| - | - |
AIME 2024 | - | - |
AIME 2025 | - | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Mobilná aplikácia | - | - |
MathArena | ||
| Priemerné skóre | - | 83% |
AIME 2025 Test založený na úlohách zo súťaže v matematike (American Invitational Mathematics Examination),určený na overenie matematických schopností modelov. | - | 93% |
HMMT February 2025 Test založený na úlohách z Harvard-MIT Mathematics Tournament, február 2025, určený na overenie matematických schopností modelov. | - | 78% |
BRUMO 2025 | - | 92% |
SMT 2025 Test založený na úlohách zo Stanford Math Tournament, 2025, určený na overenie matematických schopností modelov. | - | 82% |
CMIMC 2025 Test založený na úlohách z Canadian Mathematical Olympiad, 2025, určený na overenie matematických schopností modelov. | - | 71% |
Compare AI. Test. Benchmarks. Chatboty pre mobilné aplikácie, Sketch
Copyright © 2026 All Right Reserved.