Open Source Community 2026-04-28 Source →

AlibabaのQwen 3.5/3.6が8ベンチ中5つで首位——Apache 2.0でコーディング特化デプロイの最有力候補に

Alibabaが開発するオープンソースLLM（大規模言語モデル）シリーズ「Qwen 3.5/3.6」が、LiveCodeBench・SWE-benchを含む8つの主要ベンチマーク中5つで最高スコアを達成したことが明らかになりました。Apache 2.0ライセンスで公開されており、コーディング支援ツールや自律エージェントのバックエンドとして商用利用可能な選択肢として急浮上しています。

SWE-benchでも上位に食い込む実力

SWE-benchは実際のGitHubリポジトリのバグ修正タスクを使ったコーディング評価で、OpenAIのGPT-5.5が88.7%という高水準を記録したことで注目を集めているベンチマークです。Qwen 3.6がこの指標でも競争力を示したことは、プロプライエタリ（非公開）モデルに依存せずに高品質なコーディングエージェントを構築できる可能性を示しています。

X上では「コーディングベンチで5/8首位は本物。SWE-benchでも強いとなるとCopilot代替として真剣に検討できる」という声が上がっています。r/LocalLLaMAではQwenシリーズのファンたちが「中国オープンソースが西側クローズドモデルを食い始めた」と盛り上がっており、DeepSeek V4とあわせてオープンソースAIの勢力図が書き換わりつつあるという実感が広まっています。

Apache 2.0ライセンスの採用はエンタープライズ利用の障壁を大きく下げます。自社データでのファインチューニング、オンプレミスでの運用、商用サービスへの組み込みがすべて許容されるため、GitHub CopilotやCursor代替を自社構築したい企業にとっての現実的な選択肢になりそうです。今後はRAGやエージェントフレームワークとの組み合わせ評価が進み、実用デプロイの事例報告が増えてくることが予想されます。

AlibabaのQwen 3.5/3.6が8ベンチ中5つで首位——Apache 2.0でコーディング特化デプロイの最有力候補に

SWE-benchでも上位に食い込む実力

関連リンク