← 2026-03-27
Model Releases Community 2026-03-27 Source →

OpenAI GPT-5.4が100万トークン対応&コンピュータ操作で人間超え、OSWorldで75%達成

OpenAIは2026年3月5日、最新の大規模言語モデル「GPT-5.4」をリリースしました。Standard、Thinking、Proの3バリアント構成で、最大100万トークンのコンテキストウィンドウとネイティブのコンピュータ操作機能を搭載しています。特筆すべきは、コンピュータ操作タスクのベンチマーク「OSWorld-Verified」で75%のスコアを達成し、人間のベースライン72.4%を初めて超えた点です。

GPT-5.4は、これまで別々のモデルに分散していた機能を統合したことが大きな特徴です。GPT-5.3-Codexのコーディング能力と、デスクトップやブラウザ、ソフトウェアを自律的に操作するエージェント機能を1つのモデルに集約しました。OpenAIによると、事実精度も大幅に向上しており、GPT-5.2と比較して個別の主張が誤りである確率が33%低下、回答全体でエラーを含む確率が18%減少したとのことです。

価格とバリアントの違い

API利用料金は、Standard版が入力100万トークンあたり2.50ドル、出力100万トークンあたり15ドルに設定されています。Pro版は入力30ドル、出力180ドルとなっており、Hacker Newsでは「Claude Opus 4.6より安い」という点が話題になっています。一方、Xでは「AGIか詐欺か」で意見が二分しており、Sam Altman CEOが「最もお気に入りの会話相手モデル」と称賛する一方、r/ChatGPTでは15万件以上の議論が巻き起こり、開発者からは長時間のエージェントタスクにおけるエッジケースも報告されています。

100万トークンのコンテキストウィンドウは、OpenAI史上最大です。これにより、長大なドキュメント全体を一度に処理したり、複雑なワークフローを通じて文脈を維持したりすることが可能になります。コンピュータ操作機能は、ChatGPT、API、Codexで同時に展開され、エンタープライズ向けのエージェント用途での活用が期待されています。

関連リンク