AI Security Community 2026-04-25 Source →

Anthropicの最強モデル「Claude Mythos」は一般公開せず——ゼロデイ脆弱性を大規模自動発見できる能力がリスク要因に

Anthropicは、同社が開発した最高性能モデル「Claude Mythos」を一般向けには公開しないと発表しました。主要なOSやブラウザを含む数千件の高度な脆弱性を自動的かつ大規模に発見できる能力を持つとされており、悪用のリスクを考慮してアクセスを厳しく制限。Amazon、Apple、Cisco、Google、Microsoft、NVIDIAなど一握りの大企業が参加する「Project Glasswing」というコンソーシアムを通じた限定利用のみを許可しています。

Anthropicによると、Claude Mythosは数十年にわたって検出されなかった脆弱性も含め、既知・未知のセキュリティホールを大量に自動発見する能力を持ちます。こうした能力は、防御側にとっては理想的なツールとなり得る一方、悪意のある行為者が手に入れた場合は前例のない規模のサイバー攻撃を可能にする危険性があります。Anthropicはこのトレードオフを踏まえ、一般公開よりも限定利用という難しい判断を下しました。Project Glasswingに参加している企業は、自社システムの脆弱性診断にMythosを活用できますが、外部への提供は禁止されています。

Hacker Newsではこの発表に対して726件ものコメントが集まり、「セキュリティと技術進歩のバランスをどう取るべきか」という根本的な問いについて深刻な議論が展開されています。r/netsecでは「防御側だけが使えるというのは楽観的すぎる」「いずれ同様の能力を持つモデルが別の組織によって作られるのでは」という現実的な懸念も示されています。

Mythosのような超高性能AIモデルをどう管理するかは、業界全体が向き合うべき未解決の問いです。今回のAnthropicの判断は一つの先例となりますが、同様の能力を持つモデルが今後オープンソースで登場した場合、この枠組みがどこまで有効かは不透明なままです。AI安全性と能力公開の議論は、今後さらに複雑さを増していくでしょう。

Anthropicの最強モデル「Claude Mythos」は一般公開せず——ゼロデイ脆弱性を大規模自動発見できる能力がリスク要因に

関連リンク