最新のセキュリティ監査によると、プロンプトインジェクション(AIモデルへの悪意ある命令注入)脆弱性は本番AIデプロイの73%に存在しており、OWASPが定めるLLMアプリケーション脆弱性トップ10で2026年も第1位を維持し続けている。OpenAIでさえ「フロンティアセキュリティ上の課題」として認めている根本的な防御困難性が、AI実装の広がりとともに深刻なリスクとして顕在化している。
Repello AIやElevateConsultなどのセキュリティ機関の分析によると、脅威の形態は大きく進化している。初期の問題はチャットインターフェースを通じてモデルをジェイルブレイク(安全制限の回避)することだったが、現在の主流は「間接プロンプトインジェクション(Indirect Prompt Injection)」と「クロスモーダル攻撃」に移行している。間接攻撃では、悪意ある指示をウェブサイト・PDF・画像のピクセルに隠し込み、LLMがそのデータを処理した瞬間に隠された命令がセッションを乗っ取る。LLMが信頼できる指示と信頼できない入力を確実に区別できないという設計上の制約が根本原因であり、研究によると多層防御を施した環境でも15%以上の攻撃成功率が残存するとされる。防御策としてはOWASPは最小権限のツール設計・入出力フィルタリング・高リスクアクションへの人間による承認・定期的な敵対的テストを推奨しているが、完全な防御は現時点では技術的に困難とされている。
X上ではセキュリティ研究者から「73%という数字は衝撃的。AIを本番環境にデプロイする前にペネトレーションテストを義務化すべきだ」という主張が拡散した。r/netsecでは「多層防御でも15%以上の成功率が残るという研究結果は業界全体への警鐘」というコメントが高評価を集めた。HackerNewsでは「LLMは設計上インジェクション耐性がない」という根本問題への言及と、入力サニタイズの具体的な実装例を共有するスレッドが人気を博した。
AIエージェントの自律性が高まるにつれ、プロンプトインジェクションが引き起こし得る実害の規模も拡大している。企業がAIを本番環境に展開する際、セキュリティテストを設計工程の初期から組み込む「シフトレフト・セキュリティ」の考え方が一層重要になっており、業界標準の整備が急務となっている。