カリフォルニア工科大学発のAIスタートアップPrismMLが4月4日、モデルの重みを1ビット({−1, +1})に完全量子化したLLMファミリー「Bonsai」を発表し、シードラウンドで1625万ドルを調達したことを明らかにしました。8Bパラメータのフラッグシップモデル「Bonsai 8B」はわずか1.15GBに収まり、クラウドインフラを必要とせずスマートフォンや組み込みデバイス上で動作します。
PrismMLによると、Bonsai 8Bは通常の8Bモデルと比べてフットプリントが14分の1、推論速度が8倍、エネルギー効率が5倍優れており、ベンチマーク上の性能は標準8Bモデルと同等を維持しています。小型モデルでは4Bバリアントが最新のM4 Proチップ搭載Macで毎秒132トークン、1.7BモデルがiPhone 17 Pro Max上で毎秒130トークンを記録しています。技術的な特徴として、従来の量子化手法(Microsoftが研究するBitNetなどが採用するternary方式={−1, 0, +1}の1.58ビット)とは異なり、Bonsaiは各重みを純粋に1ビットのバイナリ値に限定した「フルバイナリ化」アーキテクチャを採用している点が挙げられます。ライセンスはApache 2.0で、商用利用も無償で可能です。
Hacker Newsでは「BitNetの延長線上にある取り組みだが、実用レベルに近づいてきた」との評価が上位コメントに見られ、「これが本当にエッジAIのブレークスルーなら、スマートウォッチやIoTデバイスへのAI統合が一気に現実的になる」といった反応も上がっています。プライバシー保護とオフライン動作を重視する開発者からも高い関心が寄せられており、X上ではオンデバイスAIエージェントや医療・産業用途での活用可能性について活発な議論が展開されました。
AIモデルのエッジ展開は「クラウドに送れないデータを処理する」という実用ニーズと、「通信遅延のないリアルタイム処理」という要件から強い需要があります。Bonsaiのような1ビット量子化が実用化されることで、病院・工場・農村部など安定したネットワーク接続が得にくい環境でもAI推論が可能になります。オープンソースの1ビットLLMが本格的に商用利用可能な水準に達したことは、AIのインフラ民主化という観点からも重要な一歩といえるでしょう。