Anthropicは2月5日にClaude Opus 4.6を、続いて2月17日にClaude Sonnet 4.6をリリースしました。Opus 4.6はエージェントチーム機能とPowerPoint対応を追加し、タスク完了時間のベンチマーク(METR)では50%タイムホライズンが14時間30分、80%タイムホライズンが1時間3分と、現行モデルで最長の記録を持っています。
Sonnet 4.6は価格据え置き(入力3ドル/出力15ドル、100万トークンあたり)で、コンピュータ操作・コーディング・デザイン・ナレッジワークの性能が向上しています。同社によると、Sonnet 4.6はフラッグシップモデルのOpus 4.6に「ほぼ匹敵する」性能を、大幅に低いコストで実現しているとのことです。両モデルとも100万トークンのコンテキストウィンドウをベータ版で提供しています。
Hacker Newsでは「モデルリリースの速度が加速し、主要ラボが月単位ではなく週単位でアップデートしている」との指摘があり、X上では「マルチモーダル機能が標準化され、すべてのフロンティアモデルがテキスト・画像・動画を統合処理するようになった」との観察が共有されています。AI業界の競争は、もはやモデルの数ヶ月ごとのメジャーリリースではなく、継続的な改善の時代に入ったといえるでしょう。