マイアミを拠点とするスタートアップSubquadraticは2026年5月5日、シードラウンドで2900万ドル(約43億円)を調達すると同時に、独自アーキテクチャ「SSA(Subquadratic Sparse Attention、サブクオドラティック・スパース・アテンション)」を採用したLLM「SubQ」を公開しました。SiliconAngleの報道によると、同モデルは1200万トークンというコンテキストウィンドウ(入力可能な文脈の長さ)を実現しており、従来のトランスフォーマーモデルと比較して最大1000倍の計算コスト削減を主張しています。
通常のトランスフォーマーは、入力トークン数が増えると計算量がトークン数の2乗に比例して増大するという課題(二次計算量)を抱えています。Subquadraticが開発したSSAはこの問題に正面から取り組み、アテンション計算をスパース(疎)化することで計算量の増加を大幅に抑制する設計です。同社によると、Claude Opusと同等の精度をコストの300分の1で実現したとしており、1200万トークンという長大なコンテキストをリアルタイムで処理できるモデルを商用提供できるとしています。
同社の創業者はMetaの元Head of GenAIで、豊富な大規模モデル開発の経験を持ちます。X上では「MetaのAI部門トップが立ち上げたスタートアップが1200万トークンを実現。コンテキスト戦争の新章が始まった」として技術系アカウントを中心に拡散しています。
一方、発表内容に対して懐疑的な声も少なくありません。Hacker Newsのスレッドでは「1000倍削減という主張に対して独立した検証を強く求む」というコメントが多数を集めており、VentureBeatも研究者コミュニティから証拠の提示を求める声が上がっていると報じています。Redditでも「Claude Opusと同等の精度をコスト300分の1で実現するという主張は驚異的。ただしベンチマークの条件と評価手法を精査する必要がある」という実証的な視点からの分析が注目を集めています。
長大なコンテキストは、膨大なコードベースの一括解析、長時間の会話履歴の保持、数百ページに及ぶ文書の処理といった実用場面で直接的な価値を持ちます。SubQがその主張通りの性能を持つなら、法律・医療・ソフトウェア開発など多くの専門分野でゲームチェンジャーになる可能性があります。独立した第三者検証の結果が、この新興プレーヤーの市場での立ち位置を大きく左右しそうです。