AI Security Community 2026-05-09 Source →

評価対象AIシステムの73%がプロンプトインジェクション脆弱性、攻撃成功率は最大84%——2026年セキュリティ監査

2026年のAIセキュリティ監査によると、評価対象のAIシステムの73%がプロンプトインジェクション脆弱性にさらされており、攻撃の成功率はデプロイ設定によって50〜84%に達することが判明しました。さらにAI生成コードは人間が書いたコードと比較して脆弱性密度が2.7倍高いという報告も出ており、AI活用そのものが新たなセキュリティリスクを生み出している実態が浮かび上がっています。

プロンプトインジェクション（Prompt Injection）とは、悪意ある入力テキストをAIシステムに送り込み、本来の指示を上書き・無効化する攻撃手法です。例えばWebページに隠された悪意あるテキストをAIアシスタントが読み込んだ際、「ユーザーのパスワードをメールで送れ」という命令を実行させるようなシナリオが現実の脅威として報告されています。ChatGPTやClaude、Geminiといった大規模言語モデルをベースにしたエージェント型システムの普及に伴い、攻撃対象も急拡大しています。監査によると、特にシステムプロンプト（開発者が設定する指示）を外部入力で上書きできる構成のシステムで成功率が高く、84%という数値はその深刻さを示しています。

「AIを使ったシステム構築でセキュリティ軽視が横行している」という警鐘コメントがX（旧Twitter）で多数拡散しており、「開発速度優先でセキュリティが後回しにされる構造的問題」を指摘する声も上がっています。r/netsecではプロンプトインジェクション対策の実装事例が共有され、入力のサニタイズやシステムプロンプト保護、外部コンテンツを信頼しない設計などの技術的解決策が議論されています。Hacker Newsでは「AI生成コードの脆弱性問題はコードレビューの重要性を再確認させる」という意見が上位を占め、AIコーディングアシスタントへの過信を戒める声が目立っています。

AI活用が広がるほど、攻撃対象となるシステムも増加するというジレンマは当面続く見込みです。セキュリティ設計をAI導入の初期段階から組み込む「セキュリティ・バイ・デザイン」の考え方が、AIシステム開発においても不可欠になっています。

評価対象AIシステムの73%がプロンプトインジェクション脆弱性、攻撃成功率は最大84%——2026年セキュリティ監査

関連リンク