Anthropicが新世代モデル「Claude Mythos」のプレビューを、Project Glasswinという限定プログラムを通じて約50社のパートナーにのみ提供しています。このモデルはゼロデイ脆弱性(まだ公開・修正されていないセキュリティ上の弱点)を自律的に特定し、攻撃コードまで生成できるサイバーセキュリティ能力が突出しており、安全上のリスクを理由に一般公開は見送られました。
Anthropicによると、Mythosはこれまでのクロードシリーズとは質的に異なるサイバー攻撃能力を持つとされています。ゼロデイ脆弱性の自動悪用は、これまで熟練のセキュリティ研究者が手作業で行ってきた高度な作業であり、AIがこれを自律実行できるとすれば攻防両面での影響は計り知れません。
X上では「『危険すぎて公開できないAI』というフレーミング自体がマーケティングに見えるという批判も。ただ能力値は本物らしい」という冷静な見方が広がっています。r/netsecでは「ゼロデイ自動悪用ができるなら防御側にも使えるはず」という期待とリスク議論が交錯しており、限定公開がむしろセキュリティ研究者の関心を高める結果になっています。Hacker Newsではセキュリティ専門家のBruce Schneierが「サイバーセキュリティの未来への含意」と題した論考を投稿し700件を超えるコメントを集めるなど、業界全体への波紋は大きいものとなっています。
限定提供パートナーには防衛・セキュリティ関連企業が含まれるとみられており、ペネトレーションテスト(侵入テスト)の自動化や脆弱性スキャンへの応用が想定されます。安全能力とリスクのバランスをどう取るかという問いは、今後のフロンティアAIモデルの開発・公開方針全体に影を落とす可能性があります。