AI Security Community 2026-04-12 Source →

「危険すぎて公開できない」— AnthropicのClaude Mythos、主要OS・ブラウザで数千件のゼロデイ脆弱性を自動発見し12組織に限定提供

Anthropicは4月7日、新モデル「Claude Mythos」のプレビューと、それを活用したサイバーセキュリティ構想「Project Glasswing」を発表しました。Claude Mythosは主要OS全種・主要ウェブブラウザ全種で数千件のゼロデイ脆弱性（開発元も知らなかった未知の欠陥）を自律的に発見・実証することに成功した一方、悪用リスクが高すぎると判断され、一般公開は見送られています。

17年・27年越しの欠陥をAIが独力で発見

Anthropicの発表によると、Claude Mythosは人間の指示なしに、FreeBSDに潜む17年前からの遠隔コード実行脆弱性（CVE-2026-4747）を特定・実証しました。この欠陥を利用すると、NFSを動かすサーバーの完全な制御権を遠隔から奪える危険なものです。さらにOpenBSDに残っていた27年ものの古いバグや、動画処理ライブラリFFmpegの16年前から存在した脆弱性も発見されており、AIが従来のセキュリティ診断の常識を大きく超える能力を持つことを示しました。

こうした能力の高さゆえに、Anthropicは「同等の能力を持つモデルが攻撃者の手に渡った場合の被害は計り知れない」と判断。一般公開を断念し、12の信頼できるセキュリティ機関・企業にのみ限定提供する「Project Glasswing」フレームワークのもとで提供を開始しました。同プロジェクトを通じてAnthropicはMythosの利用クレジット最大1億ドルを提供するほか、オープンソースセキュリティ団体への400万ドルの直接寄付も約束しています。

X（旧Twitter）では「一般公開できないほど危険なモデルを作ったと明言した前代未聞の発表」として大きな話題となり、AI安全性の議論が新局面を迎えたとの声が多数上がりました。セキュリティコミュニティでは「防衛側が先にツールを持てる貴重な機会」という肯定的意見と、「Anthropicが危険な能力の扱いを決める権限を持つべきか」という批判的意見がHacker Newsで真っ向から対立しています。

「防衛者に先手を与える」戦略の是非

今回の発表が業界に投げかけた問いは単純ではありません。Simonwillison.netのSimon Willison氏は「Glasswingの制約は必要なものだと思う」と評価しつつも、民間企業が社会的影響の大きい技術の公開範囲を単独で決定することへの疑問も同時に示しています。r/netsecでは「数千件のゼロデイを自動発見」という能力の現実に驚愕しつつ、「同じ技術を持つ攻撃者がいたとしたら」という仮定が議論を呼んでいます。

AIが人間のセキュリティ研究者をはるかに上回る速度と規模で脆弱性を発見できる時代が到来しつつある今、「誰がどのようにその能力を管理するか」という問いはAI開発そのものの方向性を左右する問題となっています。Project Glasswingが防衛側にとって有効な仕組みとなるのか、それとも新たなリスクの芽となるのか、今後の動向が注目されます。

「危険すぎて公開できない」— AnthropicのClaude Mythos、主要OS・ブラウザで数千件のゼロデイ脆弱性を自動発見し12組織に限定提供

17年・27年越しの欠陥をAIが独力で発見

「防衛者に先手を与える」戦略の是非

関連リンク