← 2026-03-20
Model Releases Community 2026-03-20 Source →

LTX 2.3発表:220億パラメータで4K 50FPS動画と音声を同時生成、オープンソースで公開

Lightricksが動画生成モデル「LTX 2.3」をApache 2.0ライセンスのオープンソースとして公開しました。220億パラメータを持ち、4K解像度・50FPS・最大20秒の動画と音声を単一のフォワードパスで同時生成できる点が大きな特徴です。

LTX 2.3はデュアルストリームアーキテクチャを採用しており、動画処理用の140億パラメータと音声処理用の50億パラメータで構成されています。前バージョンの約80億パラメータから約3倍に増加し、時間軸アテンション機構も全面的に再設計されました。音声ストリームは1D temporal RoPEを使用して順次処理を行い、動画ストリームとは双方向クロスアテンションレイヤーで接続されています。これにより、効果音、環境音、発話が後処理なしで動画と同期します。また、縦型動画(9:16)のネイティブサポートや、より鮮明なディテールを実現する更新されたVAEパイプラインも搭載されています。

Redditでは「動画生成の品質向上が著しく、クリエイティブ業界への影響に注目が集まっている」との声が見られます。X(旧Twitter)では「音声同期が革新的で、リップシンク精度の向上によりコンテンツ制作が大幅に効率化される」と評価されています。オープンソースで提供されることで、個人クリエイターから企業まで幅広い活用が期待されています。

関連リンク