上海のAIラボMiniMaxは2026年6月1日、大規模言語モデル「M3」をリリースしました。コーディング能力を測るSWE-Bench Proで59.0%を達成し、GPT-5.5やGemini 3.1 Proを上回る初のオープンウェイトモデルとなっています。100万トークンのコンテキストウィンドウ、ネイティブマルチモーダル対応を備えつつ、入力0.60ドル/百万トークンという競争力ある価格設定も、開発者コミュニティの注目を集めています。
これまでSWE-Bench Pro(実際のGitHubバグ修正タスクの難問版)でフロンティアを超えるスコアを出せるオープンウェイトモデルは存在しませんでした。X上では「クローズドモデルのベンチマークを超えたオープンウェイトが登場」として開発者コミュニティが大いに盛り上がり、コスト面での優位性を評価する声が多く見られました。M3が採用するMSA(Mixture Sparse Attention、混合スパースアテンション)アーキテクチャについて、Hacker Newsでは技術的詳細への関心が高く、効率性と性能の両立を実現する仕組みへの分析コメントが活発でした。
r/LocalLLaMAでは、モデル重みの公開タイミングへの期待が高まる一方、「ローカル推論には重すぎる」という現実的な懸念も上位に挙がっています。
Hacker Newsでは同時に、SWE-Bench Pro 59.0%というスコアがMiniMax自社測定によるものであることへの懐疑的指摘が目立ちました。第三者機関による検証が行われるまで数字の信頼性は留保が必要という意見は、AI業界でのベンチマーク発表に対する成熟した受け止め方を反映しています。今後、研究コミュニティによる独立した再現実験が行われることで、M3の実力がより明確になることが期待されます。