
广受好评的 Gemini Live 语音助理强调是速度反应,但核心是建基于轻量的 Gemini 2.5 Flash 模型。不过,根据最新的 Google App 17.2 Beta 版本揭示,Google 正在秘密测试一系列 Labs 实验性功能,似乎 Gemini Live 将来可升级至强大的 Gemini 3 核心。目前的 Gemini Live 追求的是低延迟(快),但代价是推理深度有限。引入 Thinking Mode 意味着用户可以根据需求,选择要“极速应答”还是“慢点但更聪明”。
这次泄露的代码显示,用户未来将可以手动开启以下四项新功能,让助理进化,不再侷限聊天:
1. Live Thinking Mode
让 Gemini Live 在回复前有更多的时间进行深度推理。不再只是快速应答,而是能处理复杂的逻辑、数学或专业咨询,提供更详尽、准确的语音回复。这预计是将 Gemini 3 Pro 的“Thinking”能力带入语音互动。
2. Live Experimental Features
助理能记住你之前给它看的图片、说过的对话,并在跨场景中连结资讯。显著提升在嘈杂环境(如捷运、大街)中的语音辨识度。即时视觉回应,当开启相机分享画面时,它能即时理解周围环境并与你对话。整合你的 Gmail、相簿等 Google App 数据。
3. UI Control
助理可控制手机完成任务,意味着可以用语音叫它“帮我在行事历找空档预约剪发”,AI 将会模拟人的操作,在不同 App 间点击、卷动来完成任务。
4. Deep Research
您可以交给它一个宏大的题目,AI 会自动浏览大量网页、整合数据并产出详细报告,不再侷限于简单的问答。
透过 UI Control 与视觉能力,Gemini 正在从一个装在手机里的“聊天盒”,变成一个真正能看见你的世界、能操作你手机的“虚拟助手”。
虽然这些功能出现在 Google App 17.2 的测试代码中,但目前尚未正式对外开放。考虑到 Google 通常会在重大更新或年度开发者大会前进行测试,预计这些 Labs 功能可能会在 2026 年上半年陆续开放给 Google AI Pro 与 Ultra 订阅者体验。










