Anthropicは2026年6月9日、最上位モデル「Claude Fable 5」を一般公開しました。コーディング評価指標SWE-bench Verifiedで95%というスコアを達成し、100万トークンのコンテキストウィンドウと常時適応思考(Adaptive Thinking)機能を搭載。ただし同時に、安全分類器による無通知パフォーマンス低下という問題が噴出し、発表直後から開発者コミュニティの激しい批判を浴びています。
SWE-bench Verifiedは実際のGitHubのバグ修正タスクを自動で解けるかを測るベンチマークで、95%というスコアは現在公開されているモデルの中でも最高水準です。100万トークンのコンテキストは長大なコードベースや文書をまるごと処理できる容量で、Anthropicによるとコンテキスト全体にわたって一貫した推論性能を維持するとしています。常時適応思考とは、タスクの複雑さに応じてモデルが推論ステップの深さを自動調整する機能で、軽微な質問には高速に、難解な問題には丁寧に回答を組み立てます。
一方で発表と同時に、開発者からの強烈な批判が溢れました。最大の論点は「安全分類器による無通知パフォーマンス低下」です。Anthropicは特定のプロンプトや用途を検知した場合、ユーザーに告知なく下位モデルであるOpus 4.8へ切り替える仕組みを実装しており、X(旧Twitter)では「月200ドルのサブスクが9分で利用上限に達した」「AIリサーチへの嫌がらせだ」という報告が相次ぎました。r/MachineLearningでは「Anthropicは最強モデルを出しつつ意図的に制限している」という意見が多数派を占め、Hacker Newsでは「safety classifierが実質的な検閲装置になっている」というコメントが高評価を集めました。
また同じ週、AnthropicはSECへの機密S-1申請も実施しており、IPOレースへの参入も明らかになっています。技術的には圧倒的な進化を示しながら、商業的・倫理的な問題も同時に浮上した発表となりました。今後、安全分類器の透明性向上とユーザーへの説明責任がAnthropicに求められることになりそうです。