Llama 3.3 70B Instruct

Llama 3.3 70B Instruct, ontwikkeld door Meta, is een meertalig groot taalmodel dat specifiek is afgestemd op instructiegebaseerde taken en geoptimaliseerd voor conversatietoepassingen. Het kan tekst in meerdere talen verwerken en genereren, met een contextvenster dat tot 128.000 tokens ondersteunt. Gelanceerd op 6 december 2024, overtreft het model talrijke open-source en propriëtaire chatmodellen in verschillende branchebenchmarks. Het maakt gebruik van Grouped-Query Attention (GQA) om de schaalbaarheid te verbeteren en is getraind op een diverse dataset van meer dan 15 biljoen tokens uit openbaar beschikbare bronnen. De kennis van het model is actueel tot december 2023.

Nova Micro

Amazon Nova Micro is een tekstmodel dat is geoptimaliseerd voor kosten en snelheid. Met een contextvenster van 128K tokens blinkt het uit in taken zoals tekstsamenvatting, vertaling, interactieve chat en basisprogrammering. Uitgebracht als onderdeel van de Amazon Nova-foundationmodellen, ondersteunt het fine-tuning en distillatie voor aanpassing aan eigen gegevens.

Llama 3.3 70B InstructNova Micro
Aanbieder
Website
Releasedatum
Dec 06, 2024
4 maanden ago
Dec 02, 2024
4 maanden ago
Modaliteiten
tekst ?
tekst ?
API-Aanbieders
Fireworks, Together, DeepInfra, Hyperbolic
Amazon Bedrock
Kennisafsluitdatum
12.2024
Opzettelijk niet vrijgegeven
Open Source
Ja
Nee
Prijzen Invoer
$0.23 per miljoen tokens
$0.04 per miljoen tokens
Prijzen Uitvoer
$0.40 per miljoen tokens
$0.14 per miljoen tokens
MMLU
86%
0-shot, CoT
Bron
77.6%
CoT
Bron
MMLU Pro
68.9%
5-shot, CoT
Bron
-
MMMU
Niet beschikbaar
-
HellaSwag
Niet beschikbaar
-
HumanEval
88.4%
pass@1
Bron
81.1%
pass@1
Bron
MATH
77%
0-shot, CoT
Bron
69.3%
CoT
Bron
GPQA
50.5%
0-shot, CoT
Bron
40%
Main
Bron
IFEval
92.1%
Bron
87.2%
Bron
Mobiele applicatie
-
-

Vergelijk LLMs

Voeg een reactie toe


10%
Onze site gebruikt cookies.

Privacy- en cookiebeleid: Deze site maakt gebruik van cookies. Door de site te blijven gebruiken, gaat u akkoord met het gebruik ervan.