Anthropicは2026年2月5日、フラッグシップモデルClaude Opus 4.6をリリースした。同モデルはArtificial Analysisランキングで1位を獲得し、OpenAIのGPT-5.2およびGoogle Gemini 3.1 Proを上回る性能を示している。
Claude Opus 4.6は、コーディング能力、長時間タスクの持続性、プロフェッショナルな成果物の品質において大幅な改善を実現した。Artificial AnalysisランキングおよびArena.aiのユーザー選好ランキングの両方で総合1位を獲得し、ライティング、コーディング、指示追従などのサブカテゴリーでも高評価を得ている。
特筆すべきは、複雑な多分野推論テスト「Humanity's Last Exam」でのトップ性能、および金融・法務などの経済的価値の高い知識労働タスクを測定するGDPval-AAベンチマークにおいて、GPT-5.2を約144 ELOポイント上回った点である。
技術面では、100万トークンのコンテキストウィンドウ(ベータ版)を搭載し、複数のAIエージェントがコーディングプロジェクトで自律的に連携できる「エージェントチーム」機能を新たに導入。この機能は、AIが「vibe working」(雰囲気での作業)時代に移行しつつあることを示唆している。
Anthropicは特にAIエージェントカテゴリーで高い評価を受けており、自律的なタスク実行能力において競合他社をリードしている。