← 2026-06-03
Open Source Community 2026-06-03 Source →

中国MiniMax M3がSWE-Bench Pro首位59.0%を主張——「オープンウェイト」を謳いながら重みは10日後に公開予定で批判噴出、株価は12%超急落

中国のAI企業MiniMaxが2026年6月1日、新モデル「M3」を公開しました。コーディング能力評価ベンチマークSWE-Bench Proで59.0%を達成し、GPT-5.5やGemini 3.1 Proを上回ったと主張。さらに100万トークンのコンテキストウィンドウとネイティブなマルチモーダル処理に対応するとしています。ただし「オープンウェイト」を謳いながらモデルの重みは約10日後(6月11日頃)に公開予定とされており、コミュニティから強い批判が集まっています。

MiniMax M3が注目を集める理由は、単一のモデルで「長文コンテキスト・マルチモーダル・高いコーディング性能」を同時に実現したとされる点にあります。従来、これらの能力は異なるモデルにトレードオフとして分散していることが多く、M3の仕様が本物であれば商用・オープンソースモデルの双方にとって競争上の脅威となります。100万トークンのコンテキストウィンドウは、大規模なコードリポジトリ全体を一度に処理したり、数百ページに及ぶドキュメントを参照したりする用途を可能にします。なお、ベンチマークの比較対象がAnthropic Opus 4.7であり、最新のOpus 4.8と比べると10〜13ポイントの差があると指摘する声もあります。

批判の焦点は「オープンウェイト」という表現の信頼性です。X(旧Twitter)では「重みを即公開しないのは詐欺的」との批判が拡散しました。r/LocalLLaMAでは「100万トークンコンテキスト+マルチモーダル+コーディング性能の組み合わせは前例がない」と期待感を示す声がある一方、重み公開後の実機テストを慎重に待つ姿勢が多数派です。Hacker Newsでは中国AI企業のベンチマーク信頼性を問う議論が続き、発表後にHong Kong市場でのMiniMaxの株価が12%超急落した事実も話題になりました。

AIベンチマーク競争において、自己申告の数値と独立した検証の間の乖離は慢性的な問題です。M3の重みが予定通り公開され、サードパーティによる再現実験が行われた際に初めてその真価が判明します。オープンウェイトモデルの普及が加速する中、MiniMaxの試みが成功すれば中国発のAIモデルが世界の開発者コミュニティに根付く新たな機会となるでしょう。

関連リンク