OpenAIは2026年6月6日、ChatGPTに新たなセキュリティ機能「ロックダウンモード」を実装しました。このモードを有効にすると、ライブWeb閲覧・外部ファイルのダウンロード・エージェントモードなどの機能が制限され、プロンプトインジェクション攻撃によって機密データが外部へ流出するリスクを軽減します。ただしOpenAI自身も、モデルのコンテキストへの悪意ある入力注入そのものは防ぐことができないと認めており、これが「根本的な解決策ではない」という評価につながっています。
プロンプトインジェクション攻撃(OWASP LLM01)とは、AIモデルへの入力に悪意ある命令を埋め込み、本来の指示を上書きしてデータを奪ったり意図しない行動を取らせたりする攻撃手法です。ロックダウンモードはWeb閲覧やファイル送信などの「データが外に出るルート」を塞ぐことで、攻撃が成功したとしても情報を持ち出せない状態にするアプローチです。r/netsecでは「根本的な解決ではなくバンドエイド」という評価が主流で、OWASP LLM01問題の難解さを解説する技術スレッドが人気を集めました。
企業のセキュリティチームからは、機密文書を扱う業務でのChatGPT利用ポリシーを実装しやすくなるという歓迎の声が上がっています。一方でX上では「データ流出の最終段階しか防げないのに大げさな発表」という批判的な意見も少なくありませんでした。
Hacker Newsでは、プロンプトインジェクション攻撃が前年比340%増という統計情報が注目を集め、LLM(大規模言語モデル)のセキュリティ設計における根本的課題についての議論が広がりました。AIエージェントが外部ツールやWebサービスと連携する機能が普及するほど、攻撃面が広がるという構造的問題は解決しておらず、ロックダウンモードはその問題に対する現実的な妥協点として捉えることができます。安全性と利便性のトレードオフをユーザー側で選択できるという設計思想は、今後の業界標準になる可能性もあります。