Gemini 2.5 Pro

Gemini 2.5 Pro — це найдосконаліша модель ШІ від Google, розроблена для глибоких міркувань і продуманого створення відповідей. Вона перевершує ключові тести, демонструючи виняткову логіку та навички програмування. Оптимізована для створення динамічних веб-додатків, автономних систем коду та адаптації коду, забезпечуючи високу продуктивність. З вбудованими мультимодальними можливостями та розширеним контекстним вікном вона ефективно обробляє великі набори даних і інтегрує різні джерела інформації для вирішення складних завдань.

o3-mini

OpenAI o3-mini — це високошвидкісна та економічно ефективна модель логічного мислення, розроблена для застосувань у STEM-сферах, яка демонструє високі результати в науці, математиці та програмуванні. Випущена у січні 2025 року, вона містить ключові функції для розробників, такі як виклик функцій, структуровані вихідні дані та повідомлення для розробників. Модель пропонує три рівні глибини аналізу—низький, середній і високий—що дозволяє користувачам знаходити баланс між детальнішим аналізом і швидкістю відповіді. На відміну від моделі o3, вона не має можливостей обробки зображень. Спочатку доступна вибраним розробникам на рівнях використання API 3-5 і може бути інтегрована через Chat Completions API, Assistants API та Batch API.

Gemini 2.5 Proo3-mini
Веб-сайт ?
Постачальник ?
Чат ?
Дата випуску ?
Модальності ?
текст ?
зображення ?
голос ?
відео ?
текст ?
Постачальники API ?
Google AI Studio, Vertex AI, Gemini app
OpenAI API
Дата оновлення знань ?
-
Невідомо
Відкритий код ?
Ні
Ні
Вартість введення ?
Недоступно
$1.10 за мільйон токенів
Вартість виведення ?
Недоступно
$4.40 за мільйон токенів
MMLU ?
Недоступно
86.9%
pass@1, high effort
Джерело
MMLU-Pro ?
Недоступно
Недоступно
MMMU ?
81.7%
Джерело
Недоступно
HellaSwag ?
Недоступно
Недоступно
HumanEval ?
Недоступно
Недоступно
MATH ?
Недоступно
97.9%
pass@1, high effort
Джерело
GPQA ?
84.0%
Diamond Science
Джерело
79.7%
0-shot, high effort
Джерело
IFEval ?
Недоступно
Недоступно
SimpleQA ?
52.9%
-
AIME 2024
92.0%
-
AIME 2025
86.7%
-
Aider Polyglot ?
74.0% / 68.6%
-
LiveCodeBench v5 ?
70.4%
-
Global MMLU (Lite) ?
89.8%
-
MathVista ?
-
-
Мобільний додаток

VideoGameBench ?

Загальний бал
0.48%
-
Doom II
0%
-
Dream DX
4.8%
-
Awakening DX
0%
-
Civilization I
0%
-
Pokemon Crystal
0%
-
The Need for Speed
0%
-
The Incredible Machine
0%
-
Secret Game 1
0%
-
Secret Game 2
0%
-
Secret Game 3
0%
-

Порівняти LLM

Додати коментар


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.