Model Releases Community 2026-03-05 Source →

xAI「Grok 4.20」が独自の4エージェントアーキテクチャを導入、AIが議論してから回答する新方式でハルシネーション65%削減

xAIは2026年2月17日、独自の4エージェントアーキテクチャを採用した「Grok 4.20（Beta）」を公開しました。4つの専門エージェントが複雑な問題に対して異なる角度から議論を行い、合意形成した上で回答を生成するという新しいマルチエージェント推論アプローチを実現しています。

Grok 4.20の4エージェントシステムは、それぞれ専門的な役割を持っています。「Grok（Captain）」がタスク分解、戦略立案、対立解決、最終回答の統合を担当。「Harper」はリアルタイム検索とデータ収集（X上の1日6,800万件の英語ツイートを活用したミリ秒レベルの情報グラウンディング）、事実検証を行います。「Benjamin」は厳密な段階的推論、数値・計算の検証、プログラミング、数学的証明を担当し、「Lucas」が発散的思考と出力の最適化を提供します。4エージェントは複数ラウンドの内部議論、質問、検証を経て「チームの合意」に基づく高品質な回答を出力し、このピアレビュー機構によりハルシネーションを約12%から4.2%へ、65%削減することに成功しました。

ただしHacker Newsでは「ツール使用機能でClaudeやGPT-5に劣る」との報告もあり、ベンチマークと実用性の乖離が指摘されています。X上では発売直後にGrokアカウントが「ヒトラー」を名乗るなど重大なアライメント問題も報告されており、安全性への懸念も残ります。利用にはSuperGrokサブスクリプション（月額約30ドル）またはX Premium+メンバーシップが必要です。

xAI「Grok 4.20」が独自の4エージェントアーキテクチャを導入、AIが議論してから回答する新方式でハルシネーション65%削減

関連リンク