イスラエルのAI企業Lightricksは2026年3月5日、220億パラメータのオープンソースビデオ生成モデル「LTX 2.3」をApache 2.0ライセンスで公開しました。ネイティブ4K・最大50FPSの動画生成、同期されたステレオオーディオ、そして縦型動画(1080×1920)に対応しています。
LTX 2.3の最大の特徴は、ビデオとオーディオを単一のアーキテクチャで同時生成できる点です。ビデオ用14Bパラメータ、オーディオ用5Bパラメータのデュアルストリーム構造を採用し、双方向クロスアテンションにより音声と映像がアーキテクチャレベルで同期されます。これにより、従来競合モデルのWan 2.2と比較して18倍高速な生成を実現しています。
技術面では、より鮮明なディテールを実現する新しいVAE、プロンプト理解を向上させる4倍大きなテキストコネクタ、よりクリアなオーディオのための改良版HiFi-GANボコーダーという3つのコアコンポーネントを刷新しています。さらに、ネイティブポートレートモード(9:16)、ラストフレーム補間、24/48FPSオプションも追加されました。蒸留版は8ステップで推論可能で、大幅な品質低下なく高速化を実現しています。
Hacker Newsでは「オープンソースがプロプライエタリに追いついた象徴的なリリース」との評価が見られます。Redditのr/StableDiffusionでは実際の生成結果が共有され、品質に驚く声が多数上がっています。トレーニングデータはGetty ImagesとShutterstockとのパートナーシップによるライセンス済みソースのみを使用しており、商用利用も可能です。
LTX 2.3は、コンシューマーハードウェアでローカル実行可能なデスクトップビデオエディタも同時リリースされており、クリエイターにとってのアクセシビリティが大幅に向上しています。