OpenAIは3月5日、ChatGPT、API、Codexの全プラットフォームでGPT-5.4を正式リリースしました。105万トークンという過去最大のコンテキストウィンドウと、スクリーンショットとキーボード・マウス操作でアプリケーションを直接操作できる「ネイティブコンピュータ操作」機能を搭載し、デスクトップタスクで75%の成功率を達成しています。
GPT-5.4は「初のメインライン推論モデル」として、コーディング、ツール使用、エージェント機能を統合しています。新たに導入された「ツールサーチ」機能では、大規模なツールインベントリの遅延読み込みが可能となり、ベンチマークテストでトークンオーバーヘッドを47%削減しました。また、44の職種にわたる専門家との比較で83%のケースで上回る結果を示しており、OpenAIのSam Altman CEOは「会話で最も気に入っているモデル」と評価しています。
ビジネス界ではExcelやスプレッドシートとの統合機能が注目を集め、開発者コミュニティでは「コンピュータ操作エージェント」機能への関心が高まっています。X(旧Twitter)では金融データ統合への期待が寄せられる一方、Redditのr/ChatGPTでは「能力的には確かに良い」としながらも、モデルの「過剰な分析」が日常業務で摩擦を生むとの指摘や、数千人のユーザーがGPT-5への不満を表明するなど、反応は二極化しています。Hacker Newsでは「ベンチマーク競争から実用性へのシフト」を評価する声が上がり、エージェント自動化とツール統合に焦点を当てた方向性が支持されています。
今回のリリースは、AI競争が「言語能力」から「ワークフロー所有」へと移行したことを示しています。AnthropicやGoogleも同様のエージェント機能を投入する中、今後はエージェントの信頼性、ツールエコシステム、そして生産性ツールへの組み込みが競争の焦点となりそうです。
| - [OpenAI launches GPT-5.4 with Pro and Thinking versions | TechCrunch](https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/) |
|---|---|
| - [GPT-5.4 and the March 2026 ChatGPT Upgrade Cycle | AI Critique](https://www.aicritique.org/us/2026/03/16/gpt-5-4-and-the-march-2026-chatgpt-upgrade-cycle-official-release-media-narratives-and-real-world-reactions/) |