中国のAI企業MiniMaxは、100万トークンのコンテキストウィンドウとネイティブなマルチモーダル操作機能を持つ「M3」モデルを発表しました。コーディング評価の標準指標であるSWE-Bench Proでオープンウェイト最高スコアとなる59.0%を記録し、推論コストを従来比最大20分の1に削減したとしています。モデルの重みは公開されていますが、訓練コードは非公開です。
M3は100万トークンという極めて大きなコンテキストウィンドウを大きな差別化点としています。この規模のコンテキストをオープンウェイトで提供するのはM3が初めてとされており、大規模なコードベース処理や長文書の分析においてクローズドな商用モデルに匹敵する性能を低コストで実現できる可能性があります。Claude API経由での利用も想定されており、Vercel CEOのGuillermo Rauch氏が公式に推薦するなど、特にウェブ開発者コミュニティで注目されています。
X上ではVercel CEOのGuillermo Rauch氏が「コード生成でClaude Opus 4.8と同水準の性能を持つ」として公式に推薦したことで開発者コミュニティへの認知が広がりました。Redditでは「オープンウェイト」と「オープンソース」の概念の違いをめぐる論争が激化しており、中国ユーザーコミュニティからは価格変更への批判も出ています。Hacker Newsでは「open weightsとopen sourceを混同するな」という議論が上位を占め、訓練コードを非公開にすることで再現性と検証可能性が損なわれるという批判が集中しました。
59.0%というSWE-Benchスコアはオープンウェイトカテゴリで最高ですが、クローズドな商用フロンティアモデルとの差は依然としてあります。推論コスト削減と大コンテキスト対応を強みに、エンタープライズ向けのコスト効率の高い選択肢として今後の位置付けが注目されます。