← 2026-03-10
Model Releases Community 2026-03-10 Source →

MiniMax M2.5とGrok 4.20が2月にリリース―中国勢がSWE-Bench 80.2%で米国大手に迫る

2026年2月はAIモデルリリースの「ラッシュ月」となり、MiniMax M2.5、xAIのGrok 4.20、ByteDance Seed 2.0など、1か月だけで12の重要なアップデートが発表されました。中でも注目されているのが、中国のMiniMaxが2月12日にリリースしたM2.5です。

MiniMax M2.5は、コーディング、エージェント型ツール使用、オフィスワークといった経済的価値の高いタスクで最先端の性能を達成しています。SWE-Bench Verifiedで80.2%、Multi-SWE-Benchで51.3%、BrowseComp(コンテキスト管理付き)で76.3%を記録し、Claude Opus 4.6の20分の1のコストでこの性能を実現している点が衝撃的です。同モデルはWord、Excel、PowerPointファイルの生成・操作に対応し、異なるソフトウェア環境間のコンテキスト切り替えや、エージェント・人間混合チームでの作業にも長けています。

一方、xAIは2月17日にGrok 4.20をリリースしました。最大の特徴は「パラレルエージェントアーキテクチャ」で、複数のエージェントスレッドを同時に実行できる設計となっています。Redditでは「低コストの中国チャレンジャーがいかに速く差を縮めているかを示す好例」との評価が上がり、Hacker Newsでは「LLM Stats追跡で255以上のモデルリリースを確認。競争激化で価格低下の恩恵が消費者に」と報告されています。

2026年Q1は「一斉リリース日」ではなく、アップグレード・プレビュー・リリース予告が途切れなく続く「ローリングウェーブ」の様相を呈しています。MiniMax M2.5やZhipuのGLM-5の登場は、中国勢が米国大手との性能差を急速に縮めていることを示しており、AI業界の勢力図は大きく変わりつつあります。

関連リンク

- [March 2026's AI Launch Wave Integrated Cognition](https://integratedcognition.com/blog/march-2026s-ai-launch-wave-what-lawyers-should-make-of-gpt-54-claude-sonnet-46-gemini-31-pro-grok-420-glm-5-minimax-m25-and-the-deepseek-question)
- [MiniMax M2.5 near state-of-the-art VentureBeat](https://venturebeat.com/technology/minimaxs-new-open-m2-5-and-m2-5-lightning-near-state-of-the-art-while)