Grok 3 Beta

Grok 3 — это самый продвинутый модельный продукт xAI, обученный на суперкомпьютерном кластере Colossus с вычислительной мощностью, превышающей предыдущие передовые модели в 10 раз. Обладает контекстным окном в 1 миллион токенов и расширенными возможностями рассуждения, улучшенными благодаря крупномасштабному обучению с подкреплением, что позволяет осуществлять глубокие мыслительные процессы от секунд до минут для решения сложных задач. Модель демонстрирует выдающиеся результаты в академических тестах и реальных пользовательских оценках, набрав рейтинг Elo 1402 в Chatbot Arena. Выпущена вместе с Grok 3 Mini — экономичной версией, оптимизированной для упрощенного рассуждения.

Llama 3.3 70B Instruct

Llama 3.3 70B Instruct, созданная Meta, — это многоязычная крупная языковая модель, специально доработанная для задач на основе инструкций и оптимизированная для разговорных приложений. Она способна обрабатывать и генерировать текст на нескольких языках, поддерживая контекстное окно до 128 000 токенов. Запущенная 6 декабря 2024 года, модель превосходит многие open-source и проприетарные чат-модели в различных отраслевых тестах. Она использует Grouped-Query Attention (GQA) для улучшения масштабируемости и обучена на разнообразном наборе данных, содержащем более 15 триллионов токенов из общедоступных источников. Знания модели актуальны на декабрь 2023 года.

Grok 3 BetaLlama 3.3 70B Instruct
Провайдер
Веб-сайт
Дата выпуска
Jan 19, 2025
3 месяца назад
Dec 06, 2024
4 месяца назад
Модальности
текст ?
изображения ?
видео ?
текст ?
Поставщики API
xAI
Fireworks, Together, DeepInfra, Hyperbolic
Дата актуальности знаний
2025-01
12.2024
Открытый исходный код
Нет
Да
Стоимость ввода
Недоступно
$0.23 за миллион токенов
Стоимость вывода
Недоступно
$0.40 за миллион токенов
MMLU
Недоступно
86%
0-shot, CoT
Источник
MMLU Pro
79.9%
Base model
Источник
68.9%
5-shot, CoT
Источник
MMMU
78%
With Think mode
Источник
Недоступно
HellaSwag
Недоступно
Недоступно
HumanEval
Недоступно
88.4%
pass@1
Источник
MATH
Недоступно
77%
0-shot, CoT
Источник
GPQA
84.6%
With Think mode, Diamond
Источник
50.5%
0-shot, CoT
Источник
IFEval
Недоступно
92.1%
Источник
Мобильное приложение
-

Сравнение LLM

Добавить комментарий


10%
Наш сайт использует cookies

Этот сайт использует файлы cookie. Продолжая пользоваться сайтом, вы соглашаетесь с их использованием.