Model Releases Community 2026-05-01 Source →

Claude Opus 4.7、リリース直後から「史上最悪」と批判殺到——長文検索精度が78.3%から32.2%に急落、トークン消費は最大1.35倍に増加

Anthropicが2026年4月16日にリリースしたClaude Opus 4.7が、開発者コミュニティから激しい批判を受けています。長文コンテキスト検索の標準ベンチマーク「MRCR（Multi-Range Contextual Retrieval）」において、前バージョンのOpus 4.6比で78.3%から32.2%へと性能が半分以下に急落。さらに新しいトークナイザーの採用によりトークン消費量が最大1.35倍に増加し、実質的な料金値上げと受け取られています。Reddit・X・Discordでは「史上最悪のリリース」という言葉が飛び交っています。

Startup Fortuneの報告によると、ユーザーから寄せられた問題は性能低下にとどまりません。Claude Codeを使用するケースでは、無害なコードをマルウェアと誤判定するという信頼性に関わる不具合も多数報告されています。また「strawberry」という単語に含まれる「r」の数など、明白な事実確認問題での誤りが多発しているとの報告も拡散しており、基礎的な品質の退行を示す声が後を絶ちません。Anthropicはこれらの問題に対して現時点では公式コメントを出していません。

X上では「Opus 4.7はアップグレードどころか深刻な退行」との投稿が14,000いいねを獲得し、具体的な誤りの事例報告が続々と拡散しました。Redditでは「深刻な退行、アップグレードではない」というスレッドが2,300アップボートを獲得し、Claude Codeでの誤判定問題も別途多数報告されています。Hacker Newsでは新トークナイザーによるコスト増加の技術的分析が詳細に行われ、長文コンテキスト性能の崩壊についての具体的なベンチマーク比較が注目を集めました。ただし複雑な視覚処理タスクでの改善を報告するユーザーも一部存在しており、用途によって評価が分かれる側面もあります。

Anthropicにとって今回のリリースは、急成長する競合他社に対して性能面で優位を保たなければならないプレッシャーの中での躓きとなりました。長文コンテキスト処理はClaudeが差別化要因として打ち出してきた機能だけに、その著しい低下はブランドイメージへの影響も懸念されます。今後の修正パッチや後継モデルでの改善が待たれるところです。

Claude Opus 4.7、リリース直後から「史上最悪」と批判殺到——長文検索精度が78.3%から32.2%に急落、トークン消費は最大1.35倍に増加

関連リンク