
OpenAI o3 — це найдосконаліша аналітична модель від OpenAI, створена спеціально для вирішення складних завдань із високими когнітивними вимогами. Випущена у квітні 2025 року, вона демонструє виняткову продуктивність у розробці програмного забезпечення, математиці та науковому вирішенні проблем. Модель пропонує три рівні аналітичного навантаження — низький, середній та високий — дозволяючи користувачам балансувати між затримкою та глибиною аналізу залежно від складності завдання. o3 підтримує ключові інструменти для розробників, включаючи виклик функцій, структуровані висновки та системні повідомлення. Завдяки вбудованим візуальним можливостям o3 може інтерпретувати та аналізувати зображення, що робить його придатним для мультимодальних додатків. Доступний через Chat Completions API, Assistants API та Batch API для гнучкої інтеграції в корпоративні та дослідницькі процеси.
Gemini 2.0 Flash — це високопродуктивна модель Google з низькою затримкою, розроблена для передових агентських взаємодій. Оснащена нативною інтеграцією інструментів, вона підтримує мультимодальні вхідні дані, включаючи текст, зображення, відео та аудіо. Із суттєвими покращеннями порівняно з попередніми версіями модель поєднує ефективність, швидкість і розширені можливості для плавної взаємодії в реальному часі.
| o3 | Gemini 2.0 Flash | |
|---|---|---|
Веб-сайт
| ||
Постачальник
| ||
Чат
| ||
Дата випуску
| ||
Модальності
| текст зображення | текст зображення голос відео |
Постачальники API
| OpenAI API | Google AI Studio, Vertex AI |
Дата оновлення знань
| - | 08.2024 |
Відкритий код
| Ні | Ні |
Вартість введення
| $10.00 за мільйон токенів | $0.10 за мільйон токенів |
Вартість виведення
| $40.00 за мільйон токенів | $0.40 за мільйон токенів |
MMLU
| 82.9% Джерело | Недоступно |
MMLU-Pro
| - | 77.6% Джерело |
MMMU
| - | 71.7% Джерело |
HellaSwag
| - | Недоступно |
HumanEval
| - | Недоступно |
MATH
| - | 90.9% Джерело |
GPQA
| 83.3% Diamond, no tools Джерело | 60.1% Diamond Джерело |
IFEval
| - | Недоступно |
SimpleQA
| - | - |
AIME 2024 | 91.6% Джерело | - |
AIME 2025 | 88.9% Джерело | - |
Aider Polyglot
| - | - |
LiveCodeBench v5
| - | - |
Global MMLU (Lite)
| - | - |
MathVista
| - | - |
Мобільний додаток | ||
VideoGameBench | ||
Загальний бал | - | 0% |
Doom II | - | 0% |
Dream DX | - | 0% |
Awakening DX | - | 0% |
Civilization I | - | 0% |
Pokemon Crystal | - | 0% |
The Need for Speed | - | 0% |
The Incredible Machine | - | 0% |
Secret Game 1 | - | 0% |
Secret Game 2 | - | 0% |
Secret Game 3 | - | 0% |
MathArena | ||
| Середній бал | 86% | - |
AIME 2025 Тест, заснований на завданнях з конкурсу з математики (American Invitational Mathematics Examination),призначений для перевірки математичних навичок моделей. | 89% | - |
HMMT February 2025 Тест, заснований на завданнях з Harvard-MIT Mathematics Tournament, лютий 2025 року, призначений для перевірки математичних навичок моделей. | 78% | - |
BRUMO 2025 | 96% | - |
SMT 2025 Тест, заснований на завданнях зі Stanford Math Tournament, 2025 року, призначений для перевірки математичних навичок моделей. | 88% | - |
CMIMC 2025 Тест, заснований на завданнях з Canadian Mathematical Olympiad, 2025 року, призначений для перевірки математичних навичок моделей. | 78% | - |
Compare AI. Test. Benchmarks. Чат-боти для мобільних застосунків, Sketch
Copyright © 2026 All Right Reserved.