Model Releases Official 2026-06-11 Source →

Anthropic「Claude Opus 4.8」がAI知性指数で初の60点超え——61.4点で首位、自己誤り検出能力は前作比4倍

Anthropicは最新フラッグシップモデル「Claude Opus 4.8」をリリースしました。Artificial Analysis（第三者AIベンチマーク機関）の知性指数（Intelligence Index）において業界で初めて60点の壁を超え、61.4点を記録して首位を獲得しています。特にエージェント向けコーディング精度と自己誤り検出能力（Self-Correction）が前作比約4倍向上したとAnthropicは発表しています。

Anthropicの発表によれば、Claude Opus 4.8はSuperAgentベンチマークの全テストケースを完走するという実績も達成しています。X上では「Claude Codeが自分のミスを自分で指摘してくれるようになった」という開発者レポートが多数リツイートされており、実際の開発現場での信頼性向上を実感する声が目立ちます。コスト面では「GPT-5.5と同コストでパリティ超えのベンチマーク結果」として驚きをもって受け止められています。

Hacker Newsでは、数値指標よりも実務的な視点から「現場でのエージェント信頼性が向上している」という実務者コメントが高評価を集めています。ベンチマーク上位の争いがし烈を極める中、信頼できる動作保証とエラーリカバリー能力こそが企業採用の鍵であるという認識が広がっています。

AnthropicはこのタイミングでSeries H完了後の評価額がOpenAIを初めて上回り9,650億ドルに達したことも話題となっています。技術的優位性と市場評価の両面でClaudeブランドの存在感が増す中、「自分のミスを自分で直せるAI」はエージェントAI元年ともいえる2026年の開発生産性を大きく変えうる存在です。

Anthropic「Claude Opus 4.8」がAI知性指数で初の60点超え——61.4点で首位、自己誤り検出能力は前作比4倍

関連リンク