中国の知識AI企業・Zhipu AIが、総パラメータ数744億のMixture of Experts(MoE)モデル「GLM-5.1」をMITライセンスでオープンソース公開しました。推論時のアクティブパラメータは40Bで最大200Kトークンのコンテキストに対応しており、ソフトウェアエンジニアリングの標準ベンチマーク「SWE-bench」でClaude Opus 4.6とGPT-5.4を上回ったと同社は報告しています。商用利用も制限なく許可されるMITライセンスでの公開は、国産クローズドモデルを超えるオープンソースLLMという強いメッセージを持ちます。
GLM-5.1が採用するMoE(Mixture of Experts)アーキテクチャは、モデル全体のパラメータ数は744Bと巨大ながら、推論時には専門家モジュールの一部(約40B相当)のみを活性化させる仕組みです。これにより、Dense(密)モデルの744Bと比べてはるかに少ない計算資源で推論が可能になります。同様のアーキテクチャはDeepSeek V3やMixtral 8x22Bでも採用されており、大規模モデルを経済的に動かすための主流技術となっています。
Zhipu AIによると、GLM-5.1はSWE-bench Verified(実際のGitHubイシューを自律解決するタスク)で先行する商用モデルを上回るスコアを記録。200Kトークンの長コンテキスト対応は大規模コードベースの解析や長文ドキュメント処理に適しており、コーディングエージェント用途での採用が見込まれます。
X上では「MITライセンスの744BモデルがClaudeとGPTを超えたなら、オープンソースの勝利」「中国OSSが商用モデルを凌駕するペースが年々上がっている」という驚きの声が広がりました。r/MachineLearningでは「GLM-5.1のSWE-bench結果は独自評価か第三者評価かで信頼性が変わる」という慎重な議論が行われた一方、実際にコーディングを試したユーザーからは好評報告も相次いでいます。Hacker Newsでは「MITライセンスかつ商用利用可——これがローカル推論で動くなら即座に採用したい」という実務的なコメントが上位に入りました。
DeepSeek V4、Gemma 4に続く形で中国・Google発の高性能オープンウェイトモデルが続々と登場しており、クローズドAPIへの依存を避けたい企業・開発者にとっての選択肢が急速に広がっています。GLM-5.1の登場はそうした流れをさらに加速させる可能性があります。