MiroMindは3月16日、検証中心アーキテクチャを採用した新AIモデル「MiroThinker-1.7」とそのフラッグシップシステム「MiroThinker-H1」を発表しました。多段階推論タスクにおける精度向上を目指し、法律分野など正確性が求められる用途向けに設計されています。
MiroThinker-H1の核心は、推論プロセスに直接統合された二層検証システムです。ローカル検証は中間推論を監査し、確率バイアスを排除して「最も可能性が高い」ではなく「正しい」経路を探索します。グローバル検証は証拠連鎖全体を監査し、最も確信度の高い回答ではなく、最も根拠のある回答を選択します。この仕組みは従来のLLMトレーニングパイプラインには存在しない、推論時に機能する独自の能力です。
トレーニングにおいても、MiroThinkerはエージェント中心の4段階統合パイプラインを採用しています。構造化された計画立案、文脈に基づく推論、ツール連携、回答要約という原子レベルのエージェント能力を段階的に強化していきます。Hacker Newsでは「検証可能な推論への注目が高まっている」「ハルシネーション対策として期待される」との声が上がっています。
同社によると、MiroThinker-H1はOpenAI、Anthropic、Google DeepMindのフロンティアシステムを上回り、最も難度の高い多段階推論・深層研究ベンチマークで最先端の結果を達成したとのことです。AIの「幻覚」問題が深刻化する中、検証重視アプローチが新たな標準になる可能性があります。