Microsoft Build 2026(6月2〜3日)にて、同社初の推論モデル「MAI-Thinking-1」が発表されました。350億パラメータ、256Kトークンのコンテキストウィンドウを備え、コーディング性能評価指標SWE-Bench ProでAnthropic Claude Opus 4.6と同等の結果を出したとMicrosoftは主張しています。現時点ではMicrosoft Foundryでプライベートプレビューとして提供中で、MAI-Thinking-1を含む計7つのMAIモデルが今回の発表で公開されました。
MAI(Microsoft AI)モデルシリーズは、MicrosoftがOpenAIとのパートナーシップに依存せず自社でフロンティアモデルを開発する方針を示すものです。MAI-Thinking-1は、長時間の推論ステップを踏んで複雑な問題を解く「推論モデル(Reasoning Model)」カテゴリに分類され、SWE-BenchではコードリポジトリのIssueを自律的に解決する能力が評価されます。256Kという広いコンテキストウィンドウは、大規模なコードベースや長文ドキュメントを一度に処理する用途に適しており、エンタープライズ向けの実用性を意識した設計といえます。Satya Nadella CEOがX(旧Twitter)でビハインドシーンの写真を投稿し、自社モデル開発への本気度をアピールしました。
しかしコミュニティの反応は冷静です。Hacker Newsでは「ブラインドテストではSonnet 4.6より好まれる」というMicrosoftの主張に懐疑的な意見が多数を占め、「自社ベンチマークは信頼性が低い」として独立した第三者評価を待つべきとの声が優勢でした。r/MachineLearningでは「エンタープライズ向けにはコスト効率の高い推論モデルは魅力的」とポジティブな評価がある一方、「Hazy timelines(曖昧なリリーススケジュール)」への批判も見られます。
MicrosoftがOpenAIへの依存を段階的に減らしながら自社AI技術を強化しているのは明らかです。MAI-Thinking-1が独立したベンチマーク機関による検証を経て一般公開された際に、その実力が問われることになります。Azureエコシステムとの統合や、既存のCopilot製品群へのMAIモデル組み込みが今後の焦点になるでしょう。