Hugging FaceがTransformersライブラリのv5.11.0をリリースし、2つの注目モデルの公式サポートを追加しました。ひとつはブロック単位でトークンを並列生成する「DiffusionGemma」、もうひとつは長文脈シナリオ向けにSparse Attention(疎注意機構)を採用した「DeepSeek V3.2」です。カーネルフュージョンと並列化の改善も含まれており、既存モデルの推論効率の向上も期待できます。
DiffusionGemmaは拡散モデルの発想をテキスト生成に応用した新しいアーキテクチャです。従来の自己回帰モデルが「次のトークンを1つずつ予測する」のに対し、DiffusionGemmaはブロック単位でトークンをまとめて並列生成します。X上では「自己回帰の制約を超える新世代アーキテクチャ」として研究者の関心が高まっており、r/MachineLearningでも実際の生成速度ベンチマークの共有が盛んに行われています。
Hacker Newsでは「Hugging FaceがAIエコシステムの標準的なゲートキーパーになりつつある」という観点から今回の追加モデルの意義が評価されました。Transformersライブラリにモデルが収録されることは、世界中の研究者・エンジニアがすぐに実験・応用できる状態になることを意味します。DeepSeek V3.2も今回のリリースで公式サポートに加わったことで、アクセスのしやすさがさらに高まりました。
DiffusionGemmaのような拡散ベースのテキスト生成手法が自己回帰モデルの実用的な代替となるには、品質と速度のトレードオフをどこで取るかという課題が残ります。しかし、Hugging Faceのエコシステムで標準サポートされることにより検証・改良のサイクルが加速することは間違いなく、今後の発展に期待が持てます。