Grok 3 Beta

Grok 3 — це найпросунутіша модель xAI, навчена на суперкомп'ютерному кластері Colossus із десятикратною обчислювальною потужністю порівняно з попередніми передовими моделями. Вона має контекстне вікно на 1 мільйон токенів і розширені можливості логічного мислення, покращені завдяки масштабному навчання з підкріпленням, що дозволяє здійснювати глибокі розумові процеси від секунд до хвилин для розв'язання складних задач. Модель досягла високих результатів у академічних тестах та оцінках користувачів, отримавши рейтинг Elo 1402 у Chatbot Arena. Була випущена разом із Grok 3 Mini — економічною версією, оптимізованою для спрощеного логічного мислення.

Llama 3.3 70B Instruct

„Llama 3.3 70B Instruct“, створена Meta, — це багатомовна велика мовна модель, спеціально налаштована для завдань на основі інструкцій і оптимізована для розмовних додатків. Вона може обробляти та генерувати текст кількома мовами, підтримуючи контекстне вікно до 128 000 токенів. Запущена 6 грудня 2024 року, модель перевершує багато відкритих і комерційних чат-ботів у різних галузевих тестах. Використовує Grouped-Query Attention (GQA) для покращення масштабованості та навчена на різноманітному наборі даних, що містить понад 15 трильйонів токенів із публічних джерел. Знання моделі актуальні до грудня 2023 року.

Grok 3 BetaLlama 3.3 70B Instruct
Веб-сайт ?
Постачальник ?
Чат ?
Дата випуску ?
Модальності ?
текст ?
зображення ?
відео ?
текст ?
Постачальники API ?
xAI
Fireworks, Together, DeepInfra, Hyperbolic
Дата оновлення знань ?
2025-01
12.2024
Відкритий код ?
Ні
Так
Вартість введення ?
Недоступно
$0.23 за мільйон токенів
Вартість виведення ?
Недоступно
$0.40 за мільйон токенів
MMLU ?
Недоступно
86%
0-shot, CoT
Джерело
MMLU-Pro ?
79.9%
Base model
Джерело
68.9%
5-shot, CoT
Джерело
MMMU ?
78%
With Think mode
Джерело
Недоступно
HellaSwag ?
Недоступно
Недоступно
HumanEval ?
Недоступно
88.4%
pass@1
Джерело
MATH ?
Недоступно
77%
0-shot, CoT
Джерело
GPQA ?
84.6%
With Think mode, Diamond
Джерело
50.5%
0-shot, CoT
Джерело
IFEval ?
Недоступно
92.1%
Джерело
SimpleQA ?
-
-
AIME 2024
-
-
AIME 2025
-
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Мобільний додаток
-

Порівняти LLM

Додати коментар


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.