Anthropicが開発した未公開のフロンティアAIモデル「Claude Mythos Preview」が、事前テストの7週間で2000件を超える未知のゼロデイ脆弱性を発見していたことが明らかになりました。発見された脆弱性には主要OS・ブラウザのものに加え、27年間にわたって見逃されてきたOpenBSDの脆弱性も含まれており、政府当局や安全保障の専門家からは前例のない懸念の声が上がっています。
CNBCの報道によると、Mythosは通常のセキュリティ研究者が数か月かけて行うファジング(バグ探索手法の一つ)や静的解析を、LLMの文脈理解能力と組み合わせることで大幅に高速化しているとされています。特に1997年から存在していたとみられるOpenBSDの脆弱性が検出されたことは、長年のコードベース(ソフトウェアの原始コード全体)を持つオープンソースプロジェクトでさえAIの網を逃れられないことを示すものとして、コミュニティに衝撃を与えました。Anthropicはモデルの安全な展開に向けて「Project Glasswing」という段階的公開フレームワークを導入しており、まず政府機関や防衛関連組織への限定提供から始める方針を示しています。一方でDiscordユーザーがモデルへの不正アクセスに成功したという報告も浮上しており、情報管理の難しさも露呈しています。
X(旧Twitter)では「Mythosは人類史上最も危険なソフトウェアツールになりうる」という強い意見と、「AnthropicのProject Glasswingによる段階的公開は正しいアプローチ」という擁護論が激しく対立しました。r/netsecでは「27年物のOpenBSD脆弱性発見は驚異的」と技術的側面への称賛が集まった一方、r/artificialでは「AIが防御より攻撃側に有利になるターニングポイント」と懸念する投稿が多数寄せられました。Hacker Newsでは「Mythosが連邦規制の直接的な引き金になった」というコメントが多数の支持を集め、AIの軍事・安全保障用途に対する規制の在り方を巡る議論に発展しています。
Anthropicはプロジェクトの透明性確保のため、発見された脆弱性情報を各ベンダーへ責任ある開示(Responsible Disclosure)のプロセスを通じて報告中とのことです。MythosをめぐってはすでにCIAやNSAなどの情報機関を含む政府機関との協議が始まっているとも伝えられており、AI能力の急激な進化が安全保障政策の議論を数年単位で前倒しにしている現状が浮き彫りになっています。今後の正式公開スケジュールや、規制当局の動向に注目が集まっています。