
廣受好評的 Gemini Live 語音助理強調是速度反應,但核心是建基於輕量的 Gemini 2.5 Flash 模型。不過,根據最新的 Google App 17.2 Beta 版本揭示,Google 正在秘密測試一系列 Labs 實驗性功能,似乎 Gemini Live 將來可升級至強大的 Gemini 3 核心。目前的 Gemini Live 追求的是低延遲(快),但代價是推理深度有限。引入 Thinking Mode 意味著用戶可以根據需求,選擇要「極速應答」還是「慢點但更聰明」。
這次洩露的代碼顯示,用戶未來將可以手動開啟以下四項新功能,讓助理進化,不再侷限聊天:
1. Live Thinking Mode
讓 Gemini Live 在回覆前有更多的時間進行深度推理。不再只是快速應答,而是能處理複雜的邏輯、數學或專業諮詢,提供更詳盡、準確的語音回覆。這預計是將 Gemini 3 Pro 的「Thinking」能力帶入語音互動。
2. Live Experimental Features
助理能記住你之前給它看的圖片、說過的對話,並在跨場景中連結資訊。顯著提升在嘈雜環境(如捷運、大街)中的語音辨識度。即時視覺回應,當開啟相機分享畫面時,它能即時理解周圍環境並與你對話。整合你的 Gmail、相簿等 Google App 數據。
3. UI Control
助理可控制手機完成任務,意味著可以用語音叫它「幫我在行事曆找空檔預約剪髮」,AI 將會模擬人的操作,在不同 App 間點擊、捲動來完成任務。
4. Deep Research
您可以交給它一個宏大的題目,AI 會自動瀏覽大量網頁、整合數據並產出詳細報告,不再侷限於簡單的問答。
透過 UI Control 與視覺能力,Gemini 正在從一個裝在手機裡的「聊天盒」,變成一個真正能看見你的世界、能操作你手機的「虛擬助手」。
雖然這些功能出現在 Google App 17.2 的測試代碼中,但目前尚未正式對外開放。考慮到 Google 通常會在重大更新或年度開發者大會前進行測試,預計這些 Labs 功能可能會在 2026 年上半年陸續開放給 Google AI Pro 與 Ultra 訂閱者體驗。










