Anthropicが2026年2月5日にリリースした最新AIモデル「Claude Opus 4.6」が、オープンソースソフトウェアのセキュリティ検証において驚異的な成果を上げています。同社によると、テスト期間中にLinuxカーネルやGhostScript、OpenSCなどの主要OSSプロジェクトで500件以上の未発見の高深刻度脆弱性を検出しました。
特に注目すべきはMozillaとの協力による検証です。Anthropicは2週間の調査期間中にFirefoxに関する112件のレポートをMozillaに提出し、そのうち22件がCVE(共通脆弱性識別子)として認定されました。この22件には高深刻度の14件が含まれており、2025年の月間最多報告数を単独で上回る結果となりました。Claude Opus 4.6は調査開始からわずか20分でJavaScriptエンジン内のUse After Free脆弱性を特定し、最初の脆弱性を検証・提出している間にさらに50件のクラッシュを引き起こす入力パターンを発見したとのことです。
Claude Opus 4.6は100万トークンのコンテキストウィンドウと最大12万8000トークンの出力を備え、コーディング能力においては「現行最強」との評価を受けています。METRによる推定では、タスク完了時間の50%時間ホライズンが14時間30分と、他モデルを大きく引き離しています。Reddit上では「有料ユーザーから障害頻発への不満」が報告されており、3月だけで5回のサービス障害が発生したという指摘もあります。Hacker Newsでは「GPT-5.4と互角だが、コーディングではOpusが優位」との評価が見られます。
セキュリティAIの可能性を示す一方で、Anthropicの検証では脆弱性を実際のエクスプロイトに転換できたのは数百回の試行中わずか2回だったことも報告されています。防御的AIとしての活用が進む一方、攻撃への転用リスクは現時点では限定的という結果は、今後のAIセキュリティ開発における重要な指標となりそうです。
| - [Partnering with Mozilla to improve Firefox's security | Anthropic](https://www.anthropic.com/news/mozilla-firefox-security) |
|---|---|
| - [Claude Opus 4.6 Found 500 Vulnerabilities | Aikido Security](https://www.aikido.dev/blog/claude-opus-4-6-500-vulnerabilities-software-security) |
| - [Introducing Claude Opus 4.6 | Anthropic](https://www.anthropic.com/news/claude-opus-4-6) |