Model Releases Community 2026-02-25 Source →

TavusがPhoenix-4ビデオ生成モデルをリリース

概要

Tavusは、ガウシアン拡散ベースのモデル「Phoenix-4」をリリースした。1080p・40fpsのリアルタイムアバター生成が可能で、感情制御や能動的傾聴行動に対応する、感情的知性を備えた初のリアルタイム人間レンダリングモデルである。

詳細

2026年2月19日にローンチされたPhoenix-4は、ライブ会話において感情的に反応し、コンテキストを認識した人間のプレゼンスを生成するリアルタイム行動生成エンジンである。

Phoenix-4は、感情状態、能動的傾聴行動、継続的な顔の動きを単一の統合システムとして生成・制御できる初のリアルタイムモデルとなる。フルデュプレックスモデルとして、聞くことと応答することを同時に行い、頭部と肩から個々のまばたきまで全ピクセルを生成し、話す状態と聞く状態の両方で感情表現を明示的に制御できる。

技術的には、事前に録画された映像や明示的な表現に依存するのではなく、実際の会話で人間がどのように動き、反応し、感情を表現するかを学習し、その行動をランタイムで再現する。音声波形から顔をアニメーション化するのではなく、発話と会話コンテキストを感情的に基盤を持つ顔の行動に変換する。

アーキテクチャは3つの異なるモデルで構成される。感情認識を担当するRaven-1、会話のタイミングとターンテイキングを担当するSparrow-1、そして最終的なビデオ合成を行うPhoenix-4である。

出力は1080p解像度で40fpsで動作し、Tavusプラットフォーム、API、PALs、40以上の新しいレプリカを含む更新されたStock Replicaライブラリを通じて利用可能。

ポイント

感情的知性を備えた初のリアルタイム人間レンダリングモデル
1080p解像度、40fpsでリアルタイム生成
フルデュプレックスで聞くと話すを同時に実行
Raven-1（感情）、Sparrow-1（タイミング）、Phoenix-4（合成）の3モデル構成
話す状態と聞く状態の両方で感情表現を制御可能

TavusがPhoenix-4ビデオ生成モデルをリリース

概要

詳細

ポイント

関連リンク