GPT‑5.1

o3

OpenAI o3は、OpenAIの最も高度な推論モデルで、複雑で高度な認知タスクを処理するために特別に構築されています。2025年4月にリリースされ、ソフトウェアエンジニアリング、数学、科学的問題解決において卓越したパフォーマンスを発揮します。このモデルは、低、中、高の3段階の推論努力を導入し、ユーザーがタスクの複雑さに応じてレイテンシと推論の深さをバランスさせることができます。o3は、関数呼び出し、構造化出力、システムレベルのメッセージングなど、開発者向けの必須ツールをサポートしています。組み込みの視覚機能により、o3は画像を解釈および分析でき、マルチモーダルアプリケーションに適しています。Chat Completions API、Assistants API、Batch APIを通じて利用可能で、企業や研究ワークフローに柔軟に統合できます。

GPT‑5.1o3
ウェブサイト ?
プロバイダー ?
チャット ?
リリース日 ?
モダリティ ?
テキスト ?
画像 ?
テキスト ?
画像 ?
APIプロバイダー ?
OpenAI API (Responses & Chat Completions),ChatGPT (Instant & Thinking),Codex (CLI & IDE)
OpenAI API
知識のカットオフ日 ?
06.2025
-
オープンソース ?
いいえ
いいえ
入力料金 ?
$1.25 100万トークンあたり
$10.00 100万トークンあたり
出力料金 ?
$10.00 100万トークンあたり
$40.00 100万トークンあたり
MMLU ?
-
82.9%
ソース
MMLU-Pro ?
78.4%
ソース
-
MMMU ?
85.4%
ソース
-
HellaSwag ?
-
-
HumanEval ?
-
-
MATH ?
-
-
GPQA ?
88.1%
Diamond
ソース
83.3%
Diamond, no tools
ソース
IFEval ?
-
-
SimpleQA ?
-
-
AIME 2024
-
91.6%
ソース
AIME 2025
94%
ソース
88.9%
ソース
Aider Polyglot ?
-
-
LiveCodeBench v5 ?
-
-
Global MMLU (Lite) ?
-
-
MathVista ?
-
-
モバイルアプリケーション

MathArena ?

平均スコア
-
86%
AIME 2025
アメリカ招待数学試験(American Invitational Mathematics Examination)の問題に基づいたテストで、モデルの数学的能力を評価することを目的としています。
-
89%
HMMT February 2025
2025年2月のハーバードMIT数学トーナメントの問題に基づいたテストで、モデルの数学的能力を評価することを目的としています。
-
78%
BRUMO 2025
-
96%
SMT 2025
2025年のスタンフォード数学トーナメントの問題に基づいたテストで、モデルの数学的能力を評価することを目的としています。
-
88%
CMIMC 2025
2025年のカナダ数学オリンピックの問題に基づいたテストで、モデルの数学的能力を評価することを目的としています。
-
78%

LLMを比較

コメントを追加


10%
当サイトはクッキーを使用しています。

プライバシーとクッキーポリシー: 当サイトはクッキーを使用しています。当サイトを引き続きご利用いただくことで、クッキーの使用に同意したことになります。