
本周四,Google 在 Play Store 上短暂上架了一款名为 “COSMO” 的应用程式,随后又迅速将其撤下。然而,这短暂的现身已经泄露了 Google 针对 Android 系统下一步的 AI 布局:一个能在背景默默运作、“主动预判”你需求的强大 AI 助理。
以下是从这次意外曝光中,我们掌握关于 COSMO 的核心细节:
1. COSMO 是什么?与 Gemini 有何不同?
- 主动式 vs. 对话式:目前的 Gemini 属于“对话式助理”,它需要你输入指令(Prompt)才会做出回应。而 COSMO 则是一个 “主动式代理 (Proactive Agent)”,它会根据你当下的活动与情境,主动采取行动并提供协助。
- 超大容量与离线运作:与极度依赖云端运算的 Gemini App 不同,COSMO 的档案大小高达 1.13 GB。这是因为它在底层采用了 Gemini Nano 模型,具备强大的装置端(On-device)处理能力,即使在离线状态下也能顺畅运作。
2. 核心技术:它如何“看懂”你的手机?
COSMO 之所以能做到“主动预判”,是因为它调用了 Android 系统深层的 无障碍服务 API (AccessibilityService API)。这赋予了 COSMO“看见”你萤幕内容的能力,让它能随时掌握你正在进行的任务上下文(Context Awareness),并在适当的时机跳出来帮忙。
3. COSMO 的 7 大超能力(Skills)
透过监听萤幕活动与对话脉络,COSMO 能自动触发以下实用功能:
- 照片快速寻找 (Quick Photo Lookup):当你在聊天中向朋友提到某张特定的照片时,COSMO 会主动提议帮你在相簿中把那张照片找出来。
- 主动排程 (Calendar Event Suggester):侦测到你正在与他人讨论开会或碰面时间时,它会自动弹出并帮你在日历中建立行程。
- 文件起草与摘要 (Document Writer):如果你在讯息中提到需要一份文件,COSMO 会自动帮你起草信件,或是将长篇文字浓缩成摘要。
- 专有名词解释 (Jargon Definition):当你的萤幕上出现不懂的缩写或专业术语时,COSMO 会即时为你提供解释。
- 回忆检索 (Recall):类似微软的 Recall 功能,当你忘记某个看过的资讯时,COSMO 能帮你找回你试图回忆的内容。
- 自动计时器 (Add Timer):当你提到某项需要计算时间的任务(例如:方便面、烤箱定时),它会主动询问是否要在时钟 App 里设定计时器。
- 人物与事件脉络分析:自动为你提供画面上提到的人物或事件的背景资讯。










