Model Releases Community 2026-06-07 Source →

AlibabaがエージェントコーディングLLM「Qwen3-Coder-Next」公開——262Kコンテキスト・入力$0.11/Mトークンの低コスト設計

Alibabaの研究チームQwenは、コーディング特化型大規模言語モデル「Qwen3-Coder-Next」を公開しました。総パラメータ数80Bながら推論時には3Bパラメータのみを活性化するMoE（Mixture of Experts）アーキテクチャを採用し、262,000トークンという超長コンテキストウィンドウと入力コスト100万トークンあたり0.11ドルという競争力のある価格を実現しています。コード生成・リファクタリング・デバッグに特化した設計で、AIエージェントによる自律的な開発ワークフローへの組み込みを主な用途として想定しています。

262Kトークンのコンテキストウィンドウは、大規模なコードベース全体を一度に参照しながら作業することを可能にします。数万行規模のリポジトリであればそのまま入力でき、ファイル間の依存関係やAPI境界を横断した一貫性のある変更提案が得意とされています。MoEアーキテクチャによって総パラメータ80Bの表現力を持ちながら、推論時のコンピュート量は実質的に3Bモデルと同等に抑えられており、大量のAPIリクエストを発行するエージェントシステムでのコスト削減に直結します。

Hacker Newsでは「AMD Instinct GPU上でのDay 0サポートが発表されており、Nvidia以外の選択肢が広がっている」との指摘があり、ZAYA1-8Bと同様にAMDエコシステムへの対応が進むトレンドとして注目されています。Ollamaによるローカルデプロイのサポートも発表されており、クラウドAPIを使わず自前の環境で動かしたい開発者からも関心を集めています。Redditでは「推論時に3Bのみアクティブになる設計はコスト効率が非常に高いが、実際のコーディング性能については独立レビューを待ちたい」という慎重な声もあります。

コーディングAIの競争は、Anthropicのclaude-code系モデルやOpenAIのo3など強力なライバルが揃うなかで激しさを増しています。Qwen3-Coder-Nextが$0.11/M tokensという低価格でどこまでの性能を実現しているか、独立機関によるベンチマーク結果が公表されれば、コスト重視の企業採用に向けた判断材料となるでしょう。

AlibabaがエージェントコーディングLLM「Qwen3-Coder-Next」公開——262Kコンテキスト・入力$0.11/Mトークンの低コスト設計

関連リンク