Anthropicが2026年2月5日にリリースしたClaude Opus 4.6が、Artificial Analysisランキングで1位を獲得した。OpenAIのGPT-5.2および前バージョンのClaude Opus 4.5を上回る性能を示し、AI業界における新たなマイルストーンとなっている。
Claude Opus 4.6は、コーディング能力、長時間タスクの継続性、高品質な業務成果物の生成において大幅な進化を遂げた。最も注目すべき新機能は、ベータ版として搭載された100万トークンのコンテキストウィンドウと、複数のAIエージェントがコーディングプロジェクトで自律的に連携する「エージェントチーム」機能である。
ベンチマーク性能では圧倒的な結果を残している。GDPval-AA(経済的に価値のある知識労働タスクを測定するベンチマーク)ではGPT-5.2を約144 ELOポイント差で凌駕し、複雑な多分野推論テスト「Humanity's Last Exam」では全フロンティアモデル中トップを記録。さらにFinance Agentベンチマークでも首位を獲得した。
エンタープライズ採用も急拡大している。Andreessen Horowitzの2026年1月調査によると、Anthropicの企業向け本番環境導入シェアは2024年3月のほぼゼロから44%に急上昇。一方でOpenAIは77%の企業が本番環境で使用しており、依然として市場リーダーの地位を維持している。
ただし、競争は依然として熾烈だ。2月19日にリリースされたGoogle Gemini 3.1 Proは、SWE-Bench Verifiedで80.6%、Terminal-Bench 2.0で68.5%を記録し、これらの指標ではOpus 4.6を僅差で上回っている。Anthropicはこのリリースを「バイブワーキング」時代への移行と位置づけ、AIがより直感的に人間の作業を支援する新パラダイムを提唱している。