Anthropicが5月28日にリリースした「Claude Opus 4.8」が、AI性能を総合評価する「人工分析インテリジェンス指数」で61.4点を記録し、OpenAIの「GPT-5.5」(60.2点)を上回ってトップの座を獲得しました。コーディングベンチマークでも首位に立ち、2026年6月時点で「総合最強AIモデル」との評価が業界に定着しつつあります。
人工分析インテリジェンス指数は、推論・コーディング・数学・知識・マルチモーダルなど複数の評価軸を総合したスコアで、複数のAI研究機関が参照する業界標準の一つです。Claude Opus 4.8とGPT-5.5の差はわずか1.2ポイントながら、特にコーディングタスクにおける一貫性と精度の高さがOrdus 4.8を首位に押し上げた要因とみられています。Anthropicはリリースから1週間余りでベンチマーク最高位を獲得したことになります。
X(旧Twitter)では「エージェント作業での精度が明らかに上がった。OpenAIはそろそろGPT-6を出さないと追いつけなくなる」という開発者の声が拡散しています。Redditでも「Opusがまた頂点に立った。Anthropicのペースが速すぎてついていけない」という反応とともに、「コーディングタスクでの安定性」を高く評価する技術者のコメントが集まっており、エンジニアコミュニティでの支持が厚いことがうかがえます。
Anthropicは近年、OpusをはじめとするモデルファミリーをOpenAIやGoogleとほぼ同等のペースでアップデートし続けており、ベンチマーク上位によって競合他社との差別化を図る戦略を取っています。GPT-5.5との僅差での首位交代は、フロンティアモデル競争の激化を示すものであり、OpenAIがいつGPT-6を投入するかが今後の焦点となりそうです。