Open Source Community 2026-06-11 Source →

中国MiniMaxの「M3」がSWE-Bench Pro 59%でGPT-5.5超えと主張——オープンウェイト公開も独立検証なしで議論沸騰

中国のAI企業MiniMaxが、100万トークンコンテキスト・マルチモーダル対応のオープンウェイトモデル「M3」を公開しました。SWE-Bench Pro（ソフトウェアエンジニアリングベンチマーク）で59%のスコアを記録し、GPT-5.5・Gemini 3.1 Proを上回るとMiniMaxは主張しています。ただし現時点で独立した第三者機関による検証は行われておらず、性能主張をめぐる議論が活発に続いています。

M3の技術的な特徴は100万トークンという長大なコンテキストウィンドウとマルチモーダル入力への対応にあり、長文コードベースの解析や複合的な指示理解において強みを持つとされています。Vercel CEOのGuillermo Rauchが公開支持を表明したことでX上では広く拡散しましたが、「自社ベンチマーク結果のみで第三者検証なし」という批判も相次ぎ、独立評価結果を待望する声が多数を占めています。

コミュニティの反応は地域によって温度差があります。海外では「トレーニングコードを未公開のためフルOSSとは言えない」という議論が中心で、オープンソースの定義を問い直す声が上がっています。一方、中国コミュニティではモデル公開よりもトークンプラン価格改定への不満が先行しているとの指摘もあり、MiniMaxの株価は発表当日に12%下落するという市場の慎重な反応も見られました。

中国発のオープンウェイトモデルはKimi K2.6やQwen 3シリーズなど複数が存在感を示しており、MiniMax M3もその競争に加わる形です。独立機関による検証が揃ったタイミングで、M3の真の実力が明らかになるでしょう。

中国MiniMaxの「M3」がSWE-Bench Pro 59%でGPT-5.5超えと主張——オープンウェイト公開も独立検証なしで議論沸騰

関連リンク