← 2026-03-17
Model Releases Community 2026-03-17 Source →

OpenAI、GPT-5.4をリリース——OSWorldベンチマークで75%を達成し人間の72.4%を初めて超越

OpenAIは3月5日、最新のフラッグシップモデル「GPT-5.4」をリリースしました。OSWorld-Verifiedベンチマークで75.0%の成功率を達成し、人間の72.4%を初めて上回ったことで、AIがコンピュータ操作タスクにおいて人間を超えた歴史的なマイルストーンとなりました。

GPT-5.4の最大の特徴は、スクリーンショットからデスクトップを操作し、UIをクリックしたり、メールを送信したり、フォームを入力したりできる「コンピュータ使用」機能を一般向けモデルとして初めて内蔵したことです。前バージョンのGPT-5.2が47.3%だったOSWorldスコアを大幅に更新し、約1.6倍の性能向上を実現しています。また、コンテキストウィンドウは104万トークン(約75万語相当)に拡張され、大規模なコードベース、法的文書セット、数年分の財務報告書を一度のAPI呼び出しで処理できるようになりました。さらに、事実誤りを33%削減したことで、ハルシネーション問題への対応も進んでいます。

X(旧Twitter)上では「月次アップデートが続いており、GPT-5.1からの継続的な改善が印象的」という声が上がっているほか、Hacker Newsでは「コンピュータ操作タスクで人間超えは歴史的マイルストーン」との評価が寄せられています。OpenAIはGPT-5.4 ProとGPT-5.4 Thinkingの2バージョンを提供しており、エンタープライズ向けのユースケースを拡大する狙いがあるようです。

AIエージェントが人間の代わりにコンピュータを操作する時代が本格的に到来したと言えそうです。今後は業務自動化や複雑なワークフローの効率化において、GPT-5.4がどのように活用されるかが注目されます。

関連リンク

- [Introducing GPT-5.4 OpenAI](https://openai.com/index/introducing-gpt-5-4/)
- [OpenAI launches GPT-5.4 with Pro and Thinking versions TechCrunch](https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/)
- [GPT-5.4 Breakthrough: First General-Purpose Model Surpasses Humans on OSWorld Blockchain News](https://blockchain.news/ainews/gpt-5-4-breakthrough-first-general-purpose-model-surpasses-humans-on-osworld-75-analysis-benchmarks-and-enterprise-use-cases)