Anthropicは4月7日、サイバーセキュリティ特化型の大規模言語モデル「Claude Mythos 5」のプレビューを公開しました。同時に「Project Glasswing(プロジェクト・グラスウィング)」として、AWS・Apple・Microsoft・Google・NVIDIA・CrowdStrikeなど12の主要組織と連携し、すべての主要OSおよびWebブラウザにわたる数千件のゼロデイ脆弱性(攻撃者に事前に知られていない未公開の欠陥)を発見したと発表しました。モデルの能力が高すぎるとして、一般公開は見送られています。
Project Glasswingの公式ページによると、Claude Mythos 5は完全に自律した形でFreeBSDの17年前から存在していたリモートコード実行(RCE)の脆弱性(CVE-2026-4747)を特定し、悪用まで実証しました。NFS(ネットワークファイルシステム)を実行するマシンのroot権限を外部から奪取できる重大な欠陥です。さらに27年間パッチが当たっていなかったOpenBSDのクラッシュ脆弱性も発見しており、数千件という発見件数の一端が垣間見えます。
AnthropicはMythos 5を「史上最も強力なサイバーセキュリティツール」と位置付けつつ、攻撃者にも同等の能力を提供するデュアルユース(軍民両用)問題を正面から認め、防御側が備える時間を確保するためにアクセスを12組織に限定しています。Linux Foundationやブロードコム、JPモルガン・チェースなども参加しており、クリティカルソフトウェアのセキュリティ強化を進める方針です。
一方、セキュリティコミュニティの反応は複雑です。Tom's Hardwareのレポートを引用したReddit・r/netsecでは、手作業でレビューされた脆弱性が198件にとどまることから「『数千件の壊滅的なエクスプロイト』という主張には根拠が薄い」との懐疑的な声が多数上がっています。Hacker Newsでも「セールストークか本物の突破口か」をめぐり白熱した議論が続いており、FFmpegで発見された脆弱性がAnthropicの自己分析でも「クリティカルではない」とされた点を問題視する意見も見られます。
X(旧Twitter)では「主要OS・ブラウザ全域で数千件のゼロデイ発見——一般公開しないという判断自体が能力の証明」という声が広まりました。これはAI開発における新たな閾値(いきち)を示す出来事でもあります。これまで「公開しないほど危険なAI」は理論上の存在でしたが、Anthopicが商用モデルで実際にそのラインを越えたと公言した初めてのケースとなりました。
Simon Willison氏など著名な開発者・研究者の間では、Project Glasswingのアプローチ——フロンティアモデルを即座に一般公開するのではなく、責任ある組織のみと連携して防御を先行させる——を「必要かつ合理的」と評価する声もあります。フロンティアAIのガバナンスが現実の問題として問われる局面に差し掛かっています。