Google I/O 2026(5月19日開催)を5日前に控えた5月14日、GeminiアプリのベータAPKから上位エージェント機能「Gemini Spark」の詳細が流出しました。9to5Googleが入手した情報によると、Sparkはスマートフォン上のアプリを横断して自律的にタスクを実行するエージェント機能で、購入・送金などの高感度アクションについては必ずユーザー確認を求める設計が実装されています。
流出したコードと設定ファイルからは、Sparkがカレンダー管理・メール返信・オンラインショッピングから、複数アプリをまたいだマルチステップタスク(例:フライト検索→ホテル予約→カレンダー追加)まで対応できる構造が確認されています。Android向けアクセシビリティAPIを活用してアプリの画面を直接操作する仕組みで、iOS版についてはAppleのAPIポリシーとの兼ね合いから提供時期が未定とされています。Google I/Oでの正式発表では料金体系と提供地域の詳細が明らかになる見込みです。
X上ではI/O前の期待感を高める話題として素早く拡散し、「Apple Intelligenceへの直接対抗」と評価する声が多く見られます。r/Androidでは「Gemini Spark vs Apple Intelligence」の比較スレッドが急上昇し、実機での使い勝手への関心が高まっています。一方でHacker Newsでは、アプリ横断で画面操作するエージェントのプライバシーリスクと「確認ステップで本当に安全か」という疑問が並立し、機能の革新性への評価と懸念が分かれた議論になっています。
Sparkが正式リリースされれば、Googleは「スマートフォン上のAIオペレーティングシステム」という新しいポジションを確立しようとしていることが明確になります。AppleのSiri・Microsoftのコパイロット機能との競争が激化する中、Google I/Oでどのようなデモが披露されるかが注目点です。