o3

OpenAI o3 — це найдосконаліша аналітична модель від OpenAI, створена спеціально для вирішення складних завдань із високими когнітивними вимогами. Випущена у квітні 2025 року, вона демонструє виняткову продуктивність у розробці програмного забезпечення, математиці та науковому вирішенні проблем. Модель пропонує три рівні аналітичного навантаження — низький, середній та високий — дозволяючи користувачам балансувати між затримкою та глибиною аналізу залежно від складності завдання. o3 підтримує ключові інструменти для розробників, включаючи виклик функцій, структуровані висновки та системні повідомлення. Завдяки вбудованим візуальним можливостям o3 може інтерпретувати та аналізувати зображення, що робить його придатним для мультимодальних додатків. Доступний через Chat Completions API, Assistants API та Batch API для гнучкої інтеграції в корпоративні та дослідницькі процеси.

Qwen2.5-VL-32B

Протягом п'яти місяців з моменту випуску Qwen2-VL розробники створили нові моделі на його основі, надавши цінні відгуки. Тепер Qwen2.5-VL пропонує покращені можливості, включаючи точний аналіз зображень, текстів і діаграм, а також локалізацію об'єктів із структурованими виводами JSON. Він розуміє довгі відео, визначає ключові події та функціонує як агент, взаємодіючи з інструментами на комп'ютерах і телефонах. Архітектура моделі включає динамічну обробку відео та оптимізований кодувальник ViT для підвищення швидкості та точності.

o3Qwen2.5-VL-32B
Веб-сайт ?
Постачальник ?
Чат ?
Дата випуску ?
Модальності ?
текст ?
зображення ?
текст ?
зображення ?
відео ?
Постачальники API ?
OpenAI API
-
Дата оновлення знань ?
-
Невідомо
Відкритий код ?
Ні
Вартість введення ?
$10.00 за мільйон токенів
$0
Вартість виведення ?
$40.00 за мільйон токенів
$0
MMLU ?
82.9%
Джерело
78.4%
Джерело
MMLU-Pro ?
-
49.5%
MMMU ?
-
70%
HellaSwag ?
-
Недоступно
HumanEval ?
-
Недоступно
MATH ?
-
82.2%
GPQA ?
83.3%
Diamond, no tools
Джерело
46.0%
Diamond
IFEval ?
-
Недоступно
SimpleQA ?
-
-
AIME 2024
91.6%
Джерело
-
AIME 2025
88.9%
Джерело
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Мобільний додаток
-

MathArena ?

Середній бал
86%
-
AIME 2025
Тест, заснований на завданнях з конкурсу з математики (American Invitational Mathematics Examination),призначений для перевірки математичних навичок моделей.
89%
-
HMMT February 2025
Тест, заснований на завданнях з Harvard-MIT Mathematics Tournament, лютий 2025 року, призначений для перевірки математичних навичок моделей.
78%
-
BRUMO 2025
96%
-
SMT 2025
Тест, заснований на завданнях зі Stanford Math Tournament, 2025 року, призначений для перевірки математичних навичок моделей.
88%
-
CMIMC 2025
Тест, заснований на завданнях з Canadian Mathematical Olympiad, 2025 року, призначений для перевірки математичних навичок моделей.
78%
-

Порівняти LLM

Додати коментар


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.