Tavusが2026年2月18日、リアルタイム人物レンダリングモデル「Phoenix-4」をリリースしました。感情状態の生成・制御、アクティブリスニング行動、連続的な表情変化を統合した初のリアルタイムモデルとして、対話型AIアバターの新基準を確立します。
Phoenix-4は、Tavusが開発した「感情知能を持つリアルタイム人物レンダリングモデル」です。従来のフォトリアリスティックなアバター生成を超え、会話データを感情応答性のある、コンテキストを認識した顔の表情と頭部の動きに変換する「リアルタイム行動生成エンジン」として設計されています。
技術的には、3つの異なるモデルを統合したアーキテクチャを採用しています。Raven-1が感情認識を、Sparrow-1が会話のタイミングとターンテイキングを、そしてPhoenix-4が最終的なビデオ合成を担当します。これにより、1080pで40fps、エンドツーエンドのレイテンシ600ミリ秒未満という高性能を実現しています。
最大の特徴は「フルデュプレックス」能力です。モデルは聞くことと応答することを同時に行い、頭部から肩、個々の瞬きに至るまでのすべてのピクセルを生成します。開発者はEmotion Control APIを使用して、喜び、悲しみ、怒り、驚きなどの感情状態を動的に調整できます。
カスタムデジタルツイン(「レプリカ」)の作成も効率化されており、わずか2分間のビデオ映像から固有のアイデンティティを訓練し、Tavus SDKで展開可能です。WebRTCを使用したリアルタイムストリーミングにも対応しています。