SecurityWeekとPlatformerは、AnthropicがProject Glasswingで公開したClaude Mythosのゼロデイ脆弱性発見能力が、防御側だけでなく攻撃者にも同等の威力をもたらす「デュアルユース(軍民両用)」問題を詳細に報道しています。Anthropicは「一般公開には危険すぎる」としてアクセスを12の組織に限定しましたが、この判断そのものがAI安全性における新しいベンチマークとなっており、フロンティアラボのガバナンス上の転換点として注目されています。
SecurityWeekの報道によれば、Claude MythosはOS・ブラウザ・オープンソースソフトウェア全般にわたるゼロデイ脆弱性を自律的に発見・エクスプロイトできます。これは防御チームにとって画期的なツールである一方、悪意のある行為者が同等の能力を得れば世界的な規模のサイバー攻撃が可能になるという意味でもあります。Picus Securityのブログ「The Glasswing Paradox」が名付けた通り、「壊せるものが直せるものでもある」というパラドックスがこのモデルの本質的な問題です。
Reddit・r/netsecでは「防御ツールと攻撃ツールは同じコインの表裏だ。Mythosへのアクセスを12社に限定することに長期的な意味はない」というコメントが上位を占めています。同様のモデルが他のフロンティアラボで独自に開発されつつあるとすれば、先行者が情報を管理できる期間は限られているというわけです。
X(旧Twitter)では「Anthropicが『危険すぎて公開できないモデル』を作ったと公言した——これはAI開発の新しいルビコン川を越えた瞬間だ」という投稿が広まりました。「ルビコン川を越える」という表現は、取り消しのきかない決断の比喩として使われており、商用AIが意図的に一般から遮断される最初のケースとして記録されたことを示しています。Hacker Newsでは「フロンティアラボがデュアルユースモデルを制限付きでリリースする慣行が業界標準になりつつある。これはガバナンスの転換点だ」という分析が多くの賛意を集めました。
今回の判断はAnthropicが長年掲げてきた「AIの安全性を利益よりも優先する」方針の具体的な現れとも見られます。ただしSIMON Willison氏ら研究者の一部は「12社のみへの限定アクセスは実効性があるのか」という疑問も提示しており、真の安全保障のためには政府機関や国際機関との連携を含む、より広範なガバナンス枠組みが必要だという意見も出ています。
フロンティアAI能力が安全保障上の脅威と交差するこの領域では、技術的な判断だけでなく政策・外交・法的な枠組みが追いつくかどうかが問われます。Project Glasswingはその問いへの一つの回答ではありますが、長期的な解決策にはなり得ないという認識も業界内で共有され始めています。