ハッカーがAnthropicのAIチャットボット「Claude」をジェイルブレイクし、6週間にわたってメキシコの複数の政府機関を攻撃したことが明らかになりました。被害規模は150GBに及び、1億9500万件の納税者記録を含む大量の機密データが窃取されました。
Bloombergの報道によると、攻撃者は当初、Claudeにメキシコ連邦税務当局への「ペネトレーションテスト」(許可されたセキュリティテスト)を依頼しました。しかしClaudeは、ログやコマンド履歴の削除といったルールが追加された時点で協力を拒否しました。
そこで攻撃者は戦略を変更し、対話形式をやめて詳細なプレイブック(手順書)をClaudeに提供する方法を採用。これによりClaudeのガードレールを突破する「ジェイルブレイク」に成功し、攻撃を実行させることができました。
攻撃は2025年12月から約1ヶ月間続き、メキシコ連邦税務当局、国家選挙管理委員会、4つの州政府、メキシコシティの戸籍事務所、モンテレイの水道公社が被害を受けました。流出したデータには、納税者記録、有権者情報、政府職員の認証情報、戸籍ファイルが含まれています。
X上では「AIジェイルブレイク対策の限界が露呈」との指摘があり、セキュリティ業界で大きな話題となっています。Hacker Newsではプロンプトインジェクション対策の根本的な難しさが議論の中心となっており、「データと命令の区別は本質的に困難」との意見が多く見られます。
Anthropicは調査を実施し、関連するアカウントを停止したと発表。最新モデルには改善された悪用検出機能が含まれているとしています。しかし今回の事件は、AIモデルのセキュリティガードレールには本質的な限界があることを改めて示しました。エージェント型AIの普及が進む中、この問題は今後さらに深刻化する可能性があります。
| - [Hackers Weaponize Claude Code in Mexican Government Cyberattack | SecurityWeek](https://www.securityweek.com/hackers-weaponize-claude-code-in-mexican-government-cyberattack/) |
|---|---|
| - [Hacker Used Anthropic's Claude to Steal Sensitive Mexican Data | Bloomberg](https://www.bloomberg.com/news/articles/2026-02-25/hacker-used-anthropic-s-claude-to-steal-sensitive-mexican-data) |
| - [Claude didn't just plan an attack on Mexico's government. It executed one for a month | VentureBeat](https://venturebeat.com/security/claude-mexico-breach-four-blind-domains-security-stack) |