OpenAIは3月5日、推論最適化モデル「GPT-5.4 Thinking」をリリースしました。100万トークンのコンテキストウィンドウ、ネイティブのコンピュータ操作機能、ツール検索機能を搭載し、API価格は入力100万トークンあたり2.50ドル、出力15ドルに設定されています。
今回のGPT-5.4は「最も事実に正確なモデル」を謳っており、ユーザーが事実誤認をフラグ付けしたプロンプトセットでテストした結果、個々の主張が誤りである確率がGPT-5.2と比較して33%低減し、回答全体にエラーが含まれる確率も18%減少したとのことです。また、問題解決に使用するトークン数も大幅に削減され、コスト効率も向上しています。Codexユーザーは最大100万トークンのコンテキストを設定でき、長期的なタスクの計画・実行・検証が可能になりました。
しかしながら、ユーザーからの反応は必ずしも好意的ではありません。Redditのr/ChatGPTでは6,000人以上が「horrible」「soulless」と批判し、GPT-4oからの「ダウングレード」との声が多数寄せられています。X(旧Twitter)上でも「ロボット的で感情的に距離がある」「基本タスクでも苦労する」との失望の声が上がっています。さらにPolymarket調査によると、OpenAIの評価は75%から14%へと急落したとHacker Newsで報告されています。
ベンチマーク性能と実際のユーザー体験の乖離は、AI業界における継続的な課題を浮き彫りにしています。OpenAIは技術的な改善を重ねているものの、ユーザーが求める「人間らしさ」や「使いやすさ」との間にギャップが生じている可能性があります。今後のアップデートでこれらの懸念にどう対応するかが注目されます。
| - [Introducing GPT-5.4 | OpenAI](https://openai.com/index/introducing-gpt-5-4/) |
|---|---|
| - [OpenAI launches GPT-5.4 with Pro and Thinking versions | TechCrunch](https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/) |
| - [GPT-5.4: Native Computer Use, 1M Context Window, Tool Search | DataCamp](https://www.datacamp.com/blog/gpt-5-4) |