
本週四,Google 在 Play Store 上短暫上架了一款名為 「COSMO」 的應用程式,隨後又迅速將其撤下。然而,這短暫的現身已經洩露了 Google 針對 Android 系統下一步的 AI 佈局:一個能在背景默默運作、「主動預判」你需求的強大 AI 助理。
以下是從這次意外曝光中,我們掌握關於 COSMO 的核心細節:
1. COSMO 是什麼?與 Gemini 有何不同?
- 主動式 vs. 對話式:目前的 Gemini 屬於「對話式助理」,它需要你輸入指令(Prompt)才會做出回應。而 COSMO 則是一個 「主動式代理 (Proactive Agent)」,它會根據你當下的活動與情境,主動採取行動並提供協助。
- 超大容量與離線運作:與極度依賴雲端運算的 Gemini App 不同,COSMO 的檔案大小高達 1.13 GB。這是因為它在底層採用了 Gemini Nano 模型,具備強大的裝置端(On-device)處理能力,即使在離線狀態下也能順暢運作。
2. 核心技術:它如何「看懂」你的手機?
COSMO 之所以能做到「主動預判」,是因為它調用了 Android 系統深層的 無障礙服務 API (AccessibilityService API)。這賦予了 COSMO「看見」你螢幕內容的能力,讓它能隨時掌握你正在進行的任務上下文(Context Awareness),並在適當的時機跳出來幫忙。
3. COSMO 的 7 大超能力(Skills)
透過監聽螢幕活動與對話脈絡,COSMO 能自動觸發以下實用功能:
- 照片快速尋找 (Quick Photo Lookup):當你在聊天中向朋友提到某張特定的照片時,COSMO 會主動提議幫你在相簿中把那張照片找出來。
- 主動排程 (Calendar Event Suggester):偵測到你正在與他人討論開會或碰面時間時,它會自動彈出並幫你在日曆中建立行程。
- 文件起草與摘要 (Document Writer):如果你在訊息中提到需要一份文件,COSMO 會自動幫你起草信件,或是將長篇文字濃縮成摘要。
- 專有名詞解釋 (Jargon Definition):當你的螢幕上出現不懂的縮寫或專業術語時,COSMO 會即時為你提供解釋。
- 回憶檢索 (Recall):類似微軟的 Recall 功能,當你忘記某個看過的資訊時,COSMO 能幫你找回你試圖回憶的內容。
- 自動計時器 (Add Timer):當你提到某項需要計算時間的任務(例如:泡麵、烤箱定時),它會主動詢問是否要在時鐘 App 裡設定計時器。
- 人物與事件脈絡分析:自動為你提供畫面上提到的人物或事件的背景資訊。










