o3

OpenAI o3 — це найдосконаліша аналітична модель від OpenAI, створена спеціально для вирішення складних завдань із високими когнітивними вимогами. Випущена у квітні 2025 року, вона демонструє виняткову продуктивність у розробці програмного забезпечення, математиці та науковому вирішенні проблем. Модель пропонує три рівні аналітичного навантаження — низький, середній та високий — дозволяючи користувачам балансувати між затримкою та глибиною аналізу залежно від складності завдання. o3 підтримує ключові інструменти для розробників, включаючи виклик функцій, структуровані висновки та системні повідомлення. Завдяки вбудованим візуальним можливостям o3 може інтерпретувати та аналізувати зображення, що робить його придатним для мультимодальних додатків. Доступний через Chat Completions API, Assistants API та Batch API для гнучкої інтеграції в корпоративні та дослідницькі процеси.

Claude 3.7 Sonnet - Extended Thinking

Claude 3.7 Sonnet — це найдосконаліша модель ШІ від Anthropic на сьогодні та перша гібридна система для міркувань на ринку. Він пропонує як стандартний, так і розширений режими мислення, причому останній забезпечує прозоре, покрокове міркування. Модель демонструє значні покращення в кодуванні та фронтенд-розробці, досягаючи передових результатів у тестах SWE-bench Verified і TAU-bench. Доступний через Claude.ai, API Anthropic, Amazon Bedrock і Google Cloud Vertex AI, він задає новий стандарт для інтелектуального вирішення проблем, керованого ШІ.

o3Claude 3.7 Sonnet - Extended Thinking
Веб-сайт ?
Постачальник ?
Чат ?
Дата випуску ?
Модальності ?
текст ?
зображення ?
текст ?
зображення ?
Постачальники API ?
OpenAI API
Claude.ai, Anthropic API, Amazon Bedrock, Google Cloud Vertex AI
Дата оновлення знань ?
-
-
Відкритий код ?
Ні
Ні
Вартість введення ?
$10.00 за мільйон токенів
$3.00 за мільйон токенів
Вартість виведення ?
$40.00 за мільйон токенів
$15.00 за мільйон токенів
MMLU ?
82.9%
Джерело
Недоступно
MMLU-Pro ?
-
Недоступно
MMMU ?
-
75%
Джерело
HellaSwag ?
-
Недоступно
HumanEval ?
-
Недоступно
MATH ?
-
96.2%
Джерело
GPQA ?
83.3%
Diamond, no tools
Джерело
84.8%
Diamond
Джерело
IFEval ?
-
93.2%
Джерело
SimpleQA ?
-
-
AIME 2024
91.6%
Джерело
-
AIME 2025
88.9%
Джерело
-
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
Мобільний додаток

Порівняти LLM

Додати коментар


10%
Наш сайт використовує cookies

Цей сайт використовує файли cookie. Продовжуючи користуватися сайтом, ви погоджуєтеся з їх використанням.