← 2026-04-09
Open Source Community 2026-04-09 Source →

Z.aiのGLM-5.1がSWE-Bench Proで首位——58.4点でGPT-5.4とClaude Opus 4.6を超えたMITライセンスの巨人

中国・清華大学発スタートアップZ.ai(旧Zhipu AI)が、2026年4月7日にオープンソースモデル「GLM-5.1」をリリースしました。コーディング能力の実力測定として知られるSWE-Bench Proで58.4点を記録し、GPT-5.4(57.7点)とClaude Opus 4.6(57.3点)をいずれも上回って世界首位に立ちました。744億パラメータのMixture-of-Experts(MoE)構造を採用しつつ、ライセンスはMIT——商用利用も改変も無制限です。

「8時間労働」ができるAIエージェント

VentureBeatによると、GLM-5.1の最大の特徴は長時間の自律コーディングセッションへの対応です。Z.aiのリーダーが「昨年末はAIが約20ステップしか実行できなかったが、GLM-5.1は今や1,700ステップを実行できる」と述べているように、計画・実行・テスト・最適化のサイクルを8時間継続的に回せる設計となっています。実際のデモでは、LinuxデスクトップEnvironmentをゼロから655回の反復を経て構築してみせました。

モデルのスペックを見ると、総パラメータ数744Bに対して1トークンあたりのアクティブパラメータは40Bと、推論効率を高くキープしています。コンテキストウィンドウは20万トークン。HuggingFaceのzai-org/GLM-5.1で重みが公開されており、誰でもダウンロードして利用できます。なお、Z.aiは2026年1月8日に香港取引所にIPOを行い、約HKD 43.5億(約5.6億ドル)を調達済みです。

r/LocalLLaMAでは「MITライセンスで商用利用が自由、これはゲームチェンジャー」と歓迎の声が飛び交い、Hacker Newsでも「ベンチマーク選択への懐疑論はあるが、実際に試したユーザーの評価は概ね高い」というコメントが上位に並んでいます。一方、X(旧Twitter)ではZ.aiのリーダーが「自律労働時間はスケーリング則に次ぐ重要曲線」と発言し、AIエージェントのパラダイムシフトを示唆するポストが広く拡散されました。

オープンソースが頂点を取る意味

今回の結果は、クローズドな米国フロンティアモデルが「ベンチマーク上の優位性」を保てなくなった可能性を示す最初の明確な事例です。MIT Licenseという完全に開かれた条件での世界首位は、企業・研究者・個人開発者が独自モデルのベースとして活用できることを意味します。自律エージェントの能力競争が「モデルの規模」から「自律タスク継続時間」に移行しつつある現在、GLM-5.1の登場は業界全体のベンチマーク指標の再定義を促すことになりそうです。

関連リンク