OpenAIは2026年3月5日、最新フラッグシップモデル「GPT-5.4」を正式リリースしました。標準・Thinking・Proの3バリアントで提供されており、APIでは最大105万トークンという業界最大級のコンテキストウィンドウに対応します。コンピューター操作を評価するOSWorld-Verifiedベンチマークでは75.0%を記録し、人間のベースライン(72.4%)を超えた初のモデルとなりました。AIが単なるチャットツールから自律的なデジタルワーカーへと移行する重要な節目と位置づけられています。
GPT-5.4はOpenAIのGPT-5.3-Codexの最先端コーディング能力を統合した初のメインラインモデルで、ネイティブのコンピューター操作機能を初めて内蔵しています。スクリーンショットとマウス・キーボード入力を通じてデスクトップ環境を直接操作できるこの機能は、GPT-5.2の47.3%から大幅に向上した結果です。他にもプロフェッショナルワークを評価するGDPvalで83.0%(GPT-5.2は70.9%)、ウェブリサーチを評価するBrowseCompで82.7%(同65.8%)と各ベンチマークで大幅な改善が確認されています。APIの標準料金は入力100万トークンあたり2.50ドル、出力15ドルですが、標準の272,000トークンを超えて100万トークンまで拡張する場合は43%の料金増が適用されます。
X(旧Twitter)ではOpenAIの公式アカウントが「5.4 sooner than you think」と投稿してから数時間で300万ビューを獲得し、開発者コミュニティの間で大きな期待感が高まりました。一方、Hacker Newsでは法律AIのHarveyや開発ツールCursorのエンジニアから高評価を得た反面、「一般的な常識推論のギャップはまだある」「コスト増が気になる」という懸念も多く寄せられました。競合比較ではClaude Opus 4.6がコーディング(SWE-Bench 80.8%)やウェブリサーチ(BrowseComp 84%)でリード、Gemini 3.1 Proが抽象推論(ARC-AGI-2 77.1%)で上回っており、r/accelerateでは「フロントエンド設計ではClaudeやGeminiの方が優れている」という意見も見られました。
GPT-5.4の登場により、AIエージェントが実際の業務フローに組み込まれる動きがさらに加速しそうです。特にOSWorldで人間のパフォーマンスを上回ったという事実は象徴的で、オフィスワークの自動化における現実的な可能性を示しています。ChatGPT上ではGPT-5.4 ThinkingがPlus・Team・Pro向けに提供開始され、従来のGPT-5.2 Thinkingは2026年6月5日に退役予定です。
| - [Introducing GPT-5.4 | OpenAI](https://openai.com/index/introducing-gpt-5-4/) |
|---|---|
| - [OpenAI launches GPT-5.4 with Pro and Thinking versions | TechCrunch](https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/) |
| - [GPT-5.4: Native Computer Use, 1M Context Window, Tool Search | DataCamp](https://www.datacamp.com/blog/gpt-5-4) |