o4-mini

OpenAI o4-mini — це найновіша легка модель у серії o, розроблена для ефективного та потужного аналізу текстових та візуальних завдань. Оптимізована для швидкості та продуктивності, вона відмінно справляється з генерацією коду та аналізом зображень, зберігаючи баланс між затримкою та глибиною аналізу. Модель підтримує контекстне вікно у 200 000 токенів з виведенням до 100 000 токенів, що робить її придатною для тривалих та об’ємних взаємодій. Вона обробляє як текстові, так і графічні вхідні дані, видаючи текстові результати з розширеними аналітичними можливостями. Завдяки компактній архітектурі та універсальній продуктивності o4-mini ідеально підходить для широкого спектру реальних додатків, що вимагають швидкого та економічно ефективного інтелекту.

GLM-4.5

o4-miniGLM-4.5
Веб-сайт ?
Постачальник ?
Чат ?
Дата випуску ?
Модальності ?
текст ?
зображення ?
текст ?
Постачальники API ?
OpenAI API
Zhipu AI
Дата оновлення знань ?
-
Невідомо
Відкритий код ?
Ні
Так
Вартість введення ?
$1.10 за мільйон токенів
-
Вартість виведення ?
$4.40 за мільйон токенів
-
MMLU ?
fort
84.6%
Academic Knowledge
Джерело
MMLU-Pro ?
-
-
MMMU ?
81.6%
Джерело
-
HellaSwag ?
-
-
HumanEval ?
14.28%
Джерело
-
MATH ?
-
-
GPQA ?
81.4%
Джерело
-
IFEval ?
-
-
SimpleQA ?
-
-
AIME 2024
93.4%
Джерело
-
AIME 2025
92.7%
Джерело
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Мобільний додаток
-

MathArena ?

Середній бал
87%
83%
AIME 2025
Тест, заснований на завданнях з конкурсу з математики (American Invitational Mathematics Examination),призначений для перевірки математичних навичок моделей.
92%
93%
HMMT February 2025
Тест, заснований на завданнях з Harvard-MIT Mathematics Tournament, лютий 2025 року, призначений для перевірки математичних навичок моделей.
83%
78%
BRUMO 2025
87%
92%
SMT 2025
Тест, заснований на завданнях зі Stanford Math Tournament, 2025 року, призначений для перевірки математичних навичок моделей.
89%
82%
CMIMC 2025
Тест, заснований на завданнях з Canadian Mathematical Olympiad, 2025 року, призначений для перевірки математичних навичок моделей.
84%
71%

Порівняти LLM

Додати коментар


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.