
OpenAI o3 — це найдосконаліша аналітична модель від OpenAI, створена спеціально для вирішення складних завдань із високими когнітивними вимогами. Випущена у квітні 2025 року, вона демонструє виняткову продуктивність у розробці програмного забезпечення, математиці та науковому вирішенні проблем. Модель пропонує три рівні аналітичного навантаження — низький, середній та високий — дозволяючи користувачам балансувати між затримкою та глибиною аналізу залежно від складності завдання. o3 підтримує ключові інструменти для розробників, включаючи виклик функцій, структуровані висновки та системні повідомлення. Завдяки вбудованим візуальним можливостям o3 може інтерпретувати та аналізувати зображення, що робить його придатним для мультимодальних додатків. Доступний через Chat Completions API, Assistants API та Batch API для гнучкої інтеграції в корпоративні та дослідницькі процеси.
Протягом п'яти місяців з моменту випуску Qwen2-VL розробники створили нові моделі на його основі, надавши цінні відгуки. Тепер Qwen2.5-VL пропонує покращені можливості, включаючи точний аналіз зображень, текстів і діаграм, а також локалізацію об'єктів із структурованими виводами JSON. Він розуміє довгі відео, визначає ключові події та функціонує як агент, взаємодіючи з інструментами на комп'ютерах і телефонах. Архітектура моделі включає динамічну обробку відео та оптимізований кодувальник ViT для підвищення швидкості та точності.
| o3 | Qwen2.5-VL-32B | |
|---|---|---|
Веб-сайт
| ||
Постачальник
| ||
Чат
| ||
Дата випуску
| ||
Модальності
| текст зображення | текст зображення відео |
Постачальники API
| OpenAI API | - |
Дата оновлення знань
| - | Невідомо |
Відкритий код
| Ні | Так (Джерело) |
Вартість введення
| $10.00 за мільйон токенів | $0 |
Вартість виведення
| $40.00 за мільйон токенів | $0 |
MMLU
| 82.9% Джерело | 78.4% Джерело |
MMLU-Pro
| - | 49.5% |
MMMU
| - | 70% |
HellaSwag
| - | Недоступно |
HumanEval
| - | Недоступно |
MATH
| - | 82.2% |
GPQA
| 83.3% Diamond, no tools Джерело | 46.0% Diamond |
IFEval
| - | Недоступно |
SimpleQA
| - | - |
AIME 2024 | 91.6% Джерело | - |
AIME 2025 | 88.9% Джерело | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Мобільний додаток | - | |
MathArena | ||
| Середній бал | 86% | - |
AIME 2025 Тест, заснований на завданнях з конкурсу з математики (American Invitational Mathematics Examination),призначений для перевірки математичних навичок моделей. | 89% | - |
HMMT February 2025 Тест, заснований на завданнях з Harvard-MIT Mathematics Tournament, лютий 2025 року, призначений для перевірки математичних навичок моделей. | 78% | - |
BRUMO 2025 | 96% | - |
SMT 2025 Тест, заснований на завданнях зі Stanford Math Tournament, 2025 року, призначений для перевірки математичних навичок моделей. | 88% | - |
CMIMC 2025 Тест, заснований на завданнях з Canadian Mathematical Olympiad, 2025 року, призначений для перевірки математичних навичок моделей. | 78% | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2026 All Right Reserved.