AI Security Community 2026-03-31 Source →

OpenAI、AIエージェント脆弱性に特化したバグバウンティを開始 — 最大10万ドルの報奨金でMCPやプロンプトインジェクションを対象に

OpenAIは2026年3月25日、エージェントAIのセキュリティリスクに特化した「安全性バグバウンティプログラム」を立ち上げました。従来のセキュリティバグバウンティとは別建てのプログラムで、AIエージェント固有の脅威として、MCP（Model Context Protocol）の乱用・プロンプトインジェクション・エージェントによるデータ外部流出などを対象とし、最大10万ドルの報奨金を提供します。OWASPがプロンプトインジェクションをLLM脆弱性の最高深刻度に分類した直後のタイミングでもあり、業界全体のAIセキュリティ体制強化に向けた動きが加速しています。

エージェントAI固有のリスクとは、単体のチャットモデルとは異なり、モデルが外部ツールやAPIを自律的に呼び出し、メールの送受信、コード実行、Webブラウジングなどを行う際に生じる脆弱性です。MCPは複数のツールやデータソースとAIエージェントをつなぐプロトコルですが、悪意ある外部コンテンツがこの通信経路を悪用することで意図しない操作が実行されるリスクがあります。OpenAIはジェイルブレイク（制限解除）は今回の対象外としつつも、エージェントが実際の業務環境で機密データを外部流出させるようなシナリオを重点的に評価する方針を示しています。報奨金の体系は深刻度に応じて段階的に設定されており、実証性のある高リスクな脆弱性ほど高額な報奨金が得られます。

セキュリティコミュニティからは「AI業界全体が採用すべきモデル」として歓迎の声があがり、特にエージェントAI固有のリスク分類を正式化した点が高く評価されました。一方Redditでは、「GPT-5.4の収益規模からすれば報奨金上限の10万ドルは少なすぎる」という意見や、「ジェイルブレイクが対象外というのはセキュリティ上の穴ではないか」という批判も見受けられました。Hacker Newsでは、「これをきっかけにAIセキュリティの脆弱性分類体系が業界標準として確立されるかもしれない」として他社が追随するかを注視するコメントが多く集まりました。

エージェントAIが企業の基幹業務に組み込まれていく中、セキュリティの「外部の目」を取り込む仕組みは不可欠です。OpenAIが先陣を切ることで、Google・Anthropic・Microsoftなど他のAI大手が同様のプログラムを設けるきっかけになる可能性があります。独立したセキュリティ研究者やエシカルハッカーが自由に参加できる環境が整えば、AIエージェントの実用化に向けた信頼性の底上げにつながるでしょう。

OpenAI、AIエージェント脆弱性に特化したバグバウンティを開始 — 最大10万ドルの報奨金でMCPやプロンプトインジェクションを対象に

関連リンク