タフツ大学工学部のMatthias Scheutz教授が率いる研究チームは、ニューラルネットワークと記号的推論(シンボリック推論)を組み合わせた「ニューロシンボリックAI」アプローチを発表しました。ロボット向けの視覚言語行動モデル(VLA:Visual-Language-Action model)に適用したところ、訓練時間が36時間以上から34分に短縮され、エネルギー使用量が従来比1%に圧縮されました。精度はタワーオブハノイ(Tower of Hanoi)パズルで34%から95%へと劇的に改善しており、未見の複雑バリアントでも78%の成功率を記録——これに対して標準VLAはゼロ回成功でした。研究は2026年5月にウィーンで開催されるICRA(国際ロボット・オートメーション会議)で正式発表される予定です。
研究チームが採用したアプローチは、人間が物事をステップや概念に分解して考える「記号的推論」を、視覚・言語・動作を統合するニューラルネットワークと組み合わせたものです。標準的なVLAは大量の訓練データと計算資源を必要とし、国際エネルギー機関(IEA)の推計によれば米国のAIとデータセンターは2024年に415テラワット時の電力を消費しており、これは米国全体の10%以上を占めます。この数字は2030年までに倍増すると見られており、AIのエネルギー消費は世界的な課題になっています。Scheutz教授のアプローチは、学習フェーズのみならず実行フェーズでも1%のエネルギーで同等以上の結果を出せることを示しており、電力問題への根本的な解決策として注目を集めています。
Tufts Nowの発表によれば、このアプローチは訓練に使ったバージョンとは異なる「より複雑なタワーオブハノイ」にも78%の成功率で対応できており、汎化能力の高さが示されています。X(旧Twitter)では「エネルギー危機を解決するブレークスルーかもしれない」として研究者・エンジニアの間で積極的に共有されています。
一方でコミュニティの評価は慎重です。Reddit・r/MachineLearningのトップコメントは「タワーオブハノイはやや限定的なベンチマークだ。実世界タスクへの汎化を見るまでは手放しで喜べない」というもので、多くの支持を集めています。Hacker Newsでも「ニューロシンボリックは過去にも期待外れが多かった経緯があり、再現性が鍵。ICRAの発表とその後の追試を待ちたい」という慎重論が主流です。
ニューロシンボリックAIはLLM登場以前から研究されてきたアプローチですが、今回の成果は訓練コストと精度の両立という点で従来の研究より大きな実用的インパクトを持ちます。特に製造・医療・農業ロボットなど省エネが重要なエッジ環境での展開可能性が高まります。ICRAでの正式発表と査読済み論文の公開後に、より詳細な再現性の検証が行われる見込みです。AIのエネルギー問題に対するハードウェア・ソフトウェア両面からのアプローチが加速している中、このような「小さく賢いモデル」の研究は今後ますます重要性を増すと見られています。