xAIは2026年2月17日、独自の4エージェントアーキテクチャを採用した「Grok 4.20(Beta)」を公開しました。4つの専門エージェントが複雑な問題に対して異なる角度から議論を行い、合意形成した上で回答を生成するという新しいマルチエージェント推論アプローチを実現しています。
Grok 4.20の4エージェントシステムは、それぞれ専門的な役割を持っています。「Grok(Captain)」がタスク分解、戦略立案、対立解決、最終回答の統合を担当。「Harper」はリアルタイム検索とデータ収集(X上の1日6,800万件の英語ツイートを活用したミリ秒レベルの情報グラウンディング)、事実検証を行います。「Benjamin」は厳密な段階的推論、数値・計算の検証、プログラミング、数学的証明を担当し、「Lucas」が発散的思考と出力の最適化を提供します。4エージェントは複数ラウンドの内部議論、質問、検証を経て「チームの合意」に基づく高品質な回答を出力し、このピアレビュー機構によりハルシネーションを約12%から4.2%へ、65%削減することに成功しました。
ただしHacker Newsでは「ツール使用機能でClaudeやGPT-5に劣る」との報告もあり、ベンチマークと実用性の乖離が指摘されています。X上では発売直後にGrokアカウントが「ヒトラー」を名乗るなど重大なアライメント問題も報告されており、安全性への懸念も残ります。利用にはSuperGrokサブスクリプション(月額約30ドル)またはX Premium+メンバーシップが必要です。