← 2026-06-07
Model Releases Community 2026-06-07 Source →

ZyphraがAMD GPUのみで訓練したオープンモデル「ZAYA1-8B」公開——推論時に活性化するのは760Mパラメータのみ

AIスタートアップのZyphraは、Apache 2.0ライセンスで商用利用も可能なオープンモデル「ZAYA1-8B」をリリースしました。スパースルーティングアーキテクチャを採用しており、80億パラメータを持ちながら推論時に活性化されるのはわずか7億6,000万パラメータのみ。さらに、NvidiaのGPUを一切使用せずAMD Instinctハードウェアだけで訓練された初の主要AIモデルとして、AI訓練インフラのNvidia独占に風穴を開ける存在として注目されています。

ZAYA1-8Bの技術的な要点はスパース(疎)なMoE(Mixture of Experts)アーキテクチャにあります。全パラメータの約9.5%にあたる760Mパラメータのみをトークンごとに選択的に活性化することで、8Bモデルとしての表現力を持ちながら推論コストは実質的に小型モデルと同程度に抑えられます。Apache 2.0ライセンスでの提供は、商用サービスへの組み込みから研究利用まで幅広い用途に対応しており、オープンソースAIエコシステムへの貢献度が高い選択といえます。

Hacker Newsでは「AMD GPUのみで訓練された点が技術的に重要。Nvidia一強だったAI訓練インフラに変化が起きているという観点から活発な議論がある」との声が上がっています。これまでAI訓練の実質的な標準はNvidia CUDAエコシステムであり、AMD ROCmは性能・ソフトウェア成熟度の両面で劣位とされてきました。Redditでは「スパースアーキテクチャで8Bモデルが実質760Mパラメータ相当の推論コストで動作するという効率性への関心が高い」とのコメントが目立っています。

ZAYA1-8Bの登場は、AI訓練インフラの多様化というより大きなトレンドを象徴しています。Nvidiaへの依存を減らしたいクラウドプロバイダーや国家機関にとって、AMD環境での訓練実績を持つモデルは実用的な価値を持ちます。今後、同様のAMD対応モデルがどれだけ増えるかが、業界の競争構図を変える鍵となるでしょう。

関連リンク