Model Releases Community 2026-06-07 Source →

MiniMax M3がSWE-Bench Pro 59.0%でGPT-5.5超えを主張——100万トークンコンテキストのオープンウェイトモデル登場

中国のAIスタートアップMiniMaxが、100万トークンコンテキストとマルチモーダルなコンピュータ操作機能を備えた「M3」を発表しました。ソフトウェアエンジニアリングベンチマーク「SWE-Bench Pro」で59.0%を記録し、GPT-5.5やGemini 3.1 Proを上回ると主張していますが、学習コードなど一部コンポーネントは非公開で、完全なオープンソースではなく「オープンウェイト」にとどまっています。

M3の主な特徴は100万トークンという大規模コンテキストウィンドウと、画面操作や自動化を含むマルチモーダルなコンピュータ制御機能です。Redditでは「GPT-5.5超えのベンチマークは自社測定のため独立した第三者による検証が必要という慎重な意見が多数派」ながらも、「100万トークンコンテキストのオープンウェイトは評価されている」という声があり、自社発表スコアへの懐疑と機能面への期待が共存しています。

ライセンスについても議論が起きています。Hacker Newsでは「『MIT風ライセンス』と主張しているが商用利用に追加制限が付くためオープンソースと呼ぶのは誇張」という指摘が上位コメントを占めており、オープンウェイトとオープンソースの定義の違いへの認識が広がっています。LlamaやMistralなど先行するオープンウェイトモデルの文脈でM3を評価する声も多いです。

独立した第三者機関によるベンチマーク検証次第では、M3は企業・研究者向けの有力な選択肢となる可能性があります。ただしライセンスの透明性確保と実性能の独立検証が普及の鍵となるでしょう。

MiniMax M3がSWE-Bench Pro 59.0%でGPT-5.5超えを主張——100万トークンコンテキストのオープンウェイトモデル登場

関連リンク