Grok 3 — це найпросунутіша модель xAI, навчена на суперкомп'ютерному кластері Colossus із десятикратною обчислювальною потужністю порівняно з попередніми передовими моделями. Вона має контекстне вікно на 1 мільйон токенів і розширені можливості логічного мислення, покращені завдяки масштабному навчання з підкріпленням, що дозволяє здійснювати глибокі розумові процеси від секунд до хвилин для розв'язання складних задач. Модель досягла високих результатів у академічних тестах та оцінках користувачів, отримавши рейтинг Elo 1402 у Chatbot Arena. Була випущена разом із Grok 3 Mini — економічною версією, оптимізованою для спрощеного логічного мислення.
OpenAI o3 — це найдосконаліша аналітична модель від OpenAI, створена спеціально для вирішення складних завдань із високими когнітивними вимогами. Випущена у квітні 2025 року, вона демонструє виняткову продуктивність у розробці програмного забезпечення, математиці та науковому вирішенні проблем. Модель пропонує три рівні аналітичного навантаження — низький, середній та високий — дозволяючи користувачам балансувати між затримкою та глибиною аналізу залежно від складності завдання. o3 підтримує ключові інструменти для розробників, включаючи виклик функцій, структуровані висновки та системні повідомлення. Завдяки вбудованим візуальним можливостям o3 може інтерпретувати та аналізувати зображення, що робить його придатним для мультимодальних додатків. Доступний через Chat Completions API, Assistants API та Batch API для гнучкої інтеграції в корпоративні та дослідницькі процеси.
Grok 3 Beta | o3 | |
---|---|---|
Постачальник | ||
Веб-сайт | ||
Дата випуску | Jan 19, 2025 3 months ago | Apr 16, 2025 1 week ago |
Модальності | текст зображення відео | текст зображення |
Постачальники API | xAI | OpenAI API |
Дата оновлення знань | 2025-01 | - |
Відкритий код | Ні | Ні |
Вартість введення | Недоступно | $10.00 за мільйон токенів |
Вартість виведення | Недоступно | $40.00 за мільйон токенів |
MMLU | Недоступно | 82.9% Джерело |
MMLU Pro | 79.9% Base model Джерело | - |
MMMU | 78% With Think mode Джерело | - |
HellaSwag | Недоступно | - |
HumanEval | Недоступно | - |
MATH | Недоступно | - |
GPQA | 84.6% With Think mode, Diamond Джерело | 83.3% Diamond, no tools Джерело |
IFEval | Недоступно | - |
Мобільний додаток |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.