← 2026-03-09
Model Releases Community 2026-03-09 Source →

OpenAI GPT-5.4がネイティブPC操作と100万トークンを搭載、OSWorldベンチマークで人間超え75%を達成

OpenAIは2026年3月5日、ネイティブコンピュータ操作機能を初めて搭載した汎用AIモデル「GPT-5.4」をリリースしました。APIでは最大100万トークンのコンテキストウィンドウが利用可能となり、OpenAI史上最大の入力長を実現しています。

GPT-5.4の最大の特徴は、デスクトップ環境でスクリーンショットを見ながらキーボードやマウス操作を行う能力です。デスクトップ操作ベンチマーク「OSWorld-Verified」では75.0%のスコアを記録し、人間の72.4%を上回りました。これはGPT-5.2の47.3%から大幅に向上した数値であり、AIがコンピュータ操作において人間を超えた初のケースとなります。TechCrunchによると、GPT-5.4には「Pro」と「Thinking」の2つのバリエーションが用意され、金融ツールやMicrosoft Excel・Google Sheetsとの連携プラグインも搭載されています。

X上では開発者からコスト削減と83%の高速化を評価する声が上がっています。一方で「ハルシネーション(幻覚)の懸念は依然として残る」との指摘もあり、「OSWorldで人間を超えたのは画期的だが、実際のエクスプロイト(脆弱性悪用)能力は限定的」という冷静な分析も見られます。事実性が33%向上したとOpenAIは発表していますが、実務での信頼性については今後の検証が待たれるところです。

コンピュータ操作AIの実用化が急速に進む中、GPT-5.4の登場はAIエージェント時代の本格的な幕開けを告げるものとなりそうです。

関連リンク

- [Introducing GPT-5.4 OpenAI](https://openai.com/index/introducing-gpt-5-4/)
- [OpenAI launches GPT-5.4 with Pro and Thinking versions TechCrunch](https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/)