GPT-OSS Технические характеристики и обзор ИИ

GPT-OSS

Комментарии: 0

Позиция в общем рейтинге на
Июнь 2026

Рейтинг пользователей
https://compare-ai.foundtt.com

4.1

Обзор модели

Веб-сайт Страница модели ИИ	Open
Провайдер Организация, предоставляющая данную модель.	OpenAI
Чат Введите сообщение, чтобы начать общение	Open
Дата выпуска Когда модель была впервые выпущена.	9 месяцев назад Авг 05, 2025
Модальности Типы данных, которые может обрабатывать модель	текст ?
Поставщики API Провайдеры, предлагающие данную модель. (Этот список не является исчерпывающим.)	Self-hosted, Hugging Face, AWS, Azure, Databricks
Дата актуальности знаний Когда в последний раз обновлялись знания модели.	-
Открытый исходный код Доступен ли исходный код модели для публичного использования.	Да
Стоимость ввода Стоимость обработки токенов в вашем запросе	$0.15 за миллион токенов
Стоимость вывода Стоимость токенов, сгенерированных моделью	$0.60 за миллион токенов
MMLU Massive Multitask Language Understanding – Тестирование знаний по 57 предметам, включая математику, историю, право и другие	82.7% Источник
MMLU-Pro Улучшенный бенчмарк MMLU с более сложными вопросами, ориентированными на рассуждение, увеличенным числом вариантов ответов и сниженной чувствительностью к подсказкам	-
MMMU Massive Multitask Multimodal Understanding – Тестирование понимания текста, изображений, аудио и видео	-
HellaSwag Сложный бенчмарк для завершения предложений	-
HumanEval Оценивает возможности генерации кода и решения задач	-
MATH Тестирование математических навыков на разных уровнях сложности	-
GPQA Тестирование знаний на уровне PhD в области химии, биологии и физики с помощью вопросов множественного выбора, требующих глубоких экспертных знаний	80.1% Diamond Источник
IFEval Оценивает способность модели точно следовать явным инструкциям по форматированию, генерировать соответствующие выходные данные и поддерживать последовательность инструкций в разных задачах	-
SimpleQA Оценка точности простых вопросов	66.2% Источник
AIME 2024	69% Источник
AIME 2025	98.7%
Aider Polyglot Многоязычный программный бенчмарк.	-
LiveCodeBench v5 Бенчмарк для программирования в реальном времени	42.7% v5 Источник
Global MMLU (Lite) Упрощенная версия бенчмарка для оценки универсальности моделей на глобальном уровне.	-
MathVista Оценивает способности математического мышления моделей ИИ в визуальных контекстах	-
Мобильное приложение	-

GPT-OSS Характеристики, обзор и сравнение

GPT-OSS

Обзор модели

Добавить комментарий

Сравнение LLM