OpenAI o3 — це найдосконаліша аналітична модель від OpenAI, створена спеціально для вирішення складних завдань із високими когнітивними вимогами. Випущена у квітні 2025 року, вона демонструє виняткову продуктивність у розробці програмного забезпечення, математиці та науковому вирішенні проблем. Модель пропонує три рівні аналітичного навантаження — низький, середній та високий — дозволяючи користувачам балансувати між затримкою та глибиною аналізу залежно від складності завдання. o3 підтримує ключові інструменти для розробників, включаючи виклик функцій, структуровані висновки та системні повідомлення. Завдяки вбудованим візуальним можливостям o3 може інтерпретувати та аналізувати зображення, що робить його придатним для мультимодальних додатків. Доступний через Chat Completions API, Assistants API та Batch API для гнучкої інтеграції в корпоративні та дослідницькі процеси.
Gemini 2.0 Flash Thinking — це передова модель логічного мислення, розроблена для підвищення продуктивності та зрозумілості, роблячи свій процес мислення видимим. Вона чудово справляється зі складними завданнями, викликами у програмуванні та математичними міркуваннями, надаючи покрокові рішення. Оптимізована для завдань, які вимагають детальних пояснень і логічного аналізу, модель також має вбудовану інтеграцію інструментів, включаючи виконання коду та функції Google Search.
o3 | Gemini 2.0 Flash Thinking | |
---|---|---|
Веб-сайт
| ||
Постачальник
| ||
Чат
| ||
Дата випуску
| ||
Модальності
| текст зображення | текст зображення |
Постачальники API
| OpenAI API | Google AI Studio, Vertex AI, Gemini API |
Дата оновлення знань
| - | 04.2024 |
Відкритий код
| Ні | Ні |
Вартість введення
| $10.00 за мільйон токенів | Недоступно |
Вартість виведення
| $40.00 за мільйон токенів | Недоступно |
MMLU
| 82.9% Джерело | Недоступно |
MMLU-Pro
| - | Недоступно |
MMMU
| - | 75.4% Джерело |
HellaSwag
| - | Недоступно |
HumanEval
| - | Недоступно |
MATH
| - | Недоступно |
GPQA
| 83.3% Diamond, no tools Джерело | 74.2% Diamond Science Джерело |
IFEval
| - | Недоступно |
SimpleQA
| - | - |
AIME 2024 | 91.6% Джерело | - |
AIME 2025 | 88.9% Джерело | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Мобільний додаток |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2025 All Right Reserved.