Model Releases Community 2026-04-20 Source →

Alibaba Qwen 3.6-Plus：SWE-bench 78.8%・100万トークンコンテキストでコーディングベンチマーク5部門首位、Apache 2.0で公開

AlibabaのQwenチームが2026年4月2日に正式公開した「Qwen 3.6-Plus」は、SWE-bench Verified（実際のGitHubイシューをAIが自律修正するベンチマーク）で78.8%のスコアを記録し、LiveCodeBenchを含む8つのベンチマークのうち5部門でトップを獲得しました。標準で100万トークンのコンテキストウィンドウを備え、Apache 2.0ライセンスのオープンウェイト版も公開されています。

Alibaba Cloudの公式ブログによると、Qwen 3.6-Plusはエージェント的なコーディング（agentic coding：AIが自律的にコードを調査・修正・テストするタスク）に特化した設計が施されており、モデルはリクエストのたびに推論プロセスを経ながらも従来比で少ないトークン数で回答に到達します。オープンソース版の「Qwen3.6-35B-A3B」はスパースMoE（Mixture-of-Experts：一部のパラメータのみを各推論で活性化するアーキテクチャ）構造を採用した350億パラメータモデルで、SWE-bench Verifiedで73.4%を達成しています。ローカル実行でも高いコーディング性能を発揮できる点が、開発者コミュニティから高い評価を受けています。

r/LocalLLaMAではコーディング性能の高さが広く評価されている一方、「中国製モデルへのデータプライバシー懸念」を理由に企業採用を見合わせるケースも報告されています。X上では「オープンソースAIの最前線は今や中国企業が主導している」という見解が多くのAI研究者から共有されており、DeepSeekとQwenの合計市場シェアが急増していることと合わせて、米中AI競争の構図を改めて浮き彫りにしています。

Qwen 3.6-Plusの登場は、高いコーディング性能をオープンウェイトで提供するモデルの水準を一段と引き上げることになりました。100万トークンのコンテキストウィンドウはコードベース全体の一括処理を可能にし、大規模リファクタリングや複雑なバグ修正といったユースケースでの活用が今後さらに広がることが期待されます。

Alibaba Qwen 3.6-Plus：SWE-bench 78.8%・100万トークンコンテキストでコーディングベンチマーク5部門首位、Apache 2.0で公開

関連リンク