Model Releases Community 2026-03-31 Source →

GPT-5.4リリース — 人間超えのOSWorld 75%達成、APIは最大105万トークンのコンテキストウィンドウを提供

OpenAIは2026年3月5日、最新フラッグシップモデル「GPT-5.4」を正式リリースしました。標準・Thinking・Proの3バリアントで提供されており、APIでは最大105万トークンという業界最大級のコンテキストウィンドウに対応します。コンピューター操作を評価するOSWorld-Verifiedベンチマークでは75.0%を記録し、人間のベースライン（72.4%）を超えた初のモデルとなりました。AIが単なるチャットツールから自律的なデジタルワーカーへと移行する重要な節目と位置づけられています。

GPT-5.4はOpenAIのGPT-5.3-Codexの最先端コーディング能力を統合した初のメインラインモデルで、ネイティブのコンピューター操作機能を初めて内蔵しています。スクリーンショットとマウス・キーボード入力を通じてデスクトップ環境を直接操作できるこの機能は、GPT-5.2の47.3%から大幅に向上した結果です。他にもプロフェッショナルワークを評価するGDPvalで83.0%（GPT-5.2は70.9%）、ウェブリサーチを評価するBrowseCompで82.7%（同65.8%）と各ベンチマークで大幅な改善が確認されています。APIの標準料金は入力100万トークンあたり2.50ドル、出力15ドルですが、標準の272,000トークンを超えて100万トークンまで拡張する場合は43%の料金増が適用されます。

X（旧Twitter）ではOpenAIの公式アカウントが「5.4 sooner than you think」と投稿してから数時間で300万ビューを獲得し、開発者コミュニティの間で大きな期待感が高まりました。一方、Hacker Newsでは法律AIのHarveyや開発ツールCursorのエンジニアから高評価を得た反面、「一般的な常識推論のギャップはまだある」「コスト増が気になる」という懸念も多く寄せられました。競合比較ではClaude Opus 4.6がコーディング（SWE-Bench 80.8%）やウェブリサーチ（BrowseComp 84%）でリード、Gemini 3.1 Proが抽象推論（ARC-AGI-2 77.1%）で上回っており、r/accelerateでは「フロントエンド設計ではClaudeやGeminiの方が優れている」という意見も見られました。

GPT-5.4の登場により、AIエージェントが実際の業務フローに組み込まれる動きがさらに加速しそうです。特にOSWorldで人間のパフォーマンスを上回ったという事実は象徴的で、オフィスワークの自動化における現実的な可能性を示しています。ChatGPT上ではGPT-5.4 ThinkingがPlus・Team・Pro向けに提供開始され、従来のGPT-5.2 Thinkingは2026年6月5日に退役予定です。

- [Introducing GPT-5.4	OpenAI](https://openai.com/index/introducing-gpt-5-4/)
- [OpenAI launches GPT-5.4 with Pro and Thinking versions	TechCrunch](https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/)
- [GPT-5.4: Native Computer Use, 1M Context Window, Tool Search	DataCamp](https://www.datacamp.com/blog/gpt-5-4)

GPT-5.4リリース — 人間超えのOSWorld 75%達成、APIは最大105万トークンのコンテキストウィンドウを提供

関連リンク