【Google I/O 2026】全新「世界模型」Gemini Omni 震撼登場!用日常對話拍片、改片,完美模擬真實物理世界

Gemini Omni

Google 在 I/O 2026 大會上正式發表了令人矚目的全新多模態生成模型家族 —— Gemini Omni。官方將其定義為「推理能力與創作能力的完美結合」,其終極目標是打造一個能「根據任何輸入素材,生成任何形式內容」的 AI 世界模型。

Omni 家族的首發版本 Gemini Omni Flash 已經由即日起正式陸續推送。首階段功能全面聚焦於影片生成與革命性的對話式剪片體驗,徹底顛覆傳統影片後製的工作流。


1. 革命性體驗:用「傾偈」就能剪片、改畫面

傳統影片剪輯需要依賴複雜的時間軸和特效軟體,而 Gemini Omni 讓你可以直接用日常口語對話來修改影片,就如同跟專業後製師溝通一樣:

  • 連續多輪編輯:每一次的指令都會基於上一個畫面進行疊加。AI 會記住前後文的邏輯,確保角色外貌不會變形(維持一致性)、場景細節不會穿幫,鏡頭角度也能自然過渡。
  • 重塑現實世界:你可以上傳一段自己拍的影片,然後指令 Omni:「將背景換成科幻電影的外星表面」、「在畫面中加入一個新角色」或「把手裡的杯子變成一團液態金屬」。那些你無法親自拍攝的震撼鏡頭,現在全憑一句话就能成真。

2. 內置「物理大腦」與真實世界知識

過去的 AI 影片生成常被人詬病出現「反物理」的怪異畫面(例如物體憑空漂浮或扭曲)。Gemini Omni 在這方面取得了重大突破:

  • 精準模擬物理定律:Omni 具備極強的直覺物理常識,能完美理解重力、動能、流體動力學與槓桿原理等自然規律,讓生成的液體流動、物體碰撞及人物動作顯得無比真實自然。
  • 知識與創意的融合:結合 Gemini 原有的龐大知識庫,它能理解歷史、科學與文化背景。即使你只給出簡短的提示詞,它也能為你製作出兼具畫面真實感與豐富敘事內涵的「複雜概念科普解說影片」。

3. 萬物皆可參考:隨意組合輸入素材

Omni 支援將文字、圖片、影片、錄音或手繪草圖自由混合輸入。
你可以提供一張動漫角色的相片(參考角色)、一段動作影片(參考動態)加上一段語音指示,Omni 就能將這些風馬牛不相及的素材融合成一段結構完整、風格統一的高質素新影片。

👉 延伸閱讀:  別了 QR Code!Google Messages 網頁版強制轉向「帳號登入」

4. 數秒建立「數碼分身」與資安防護

  • 個人專屬 Avatar:用戶可以利用這項技術,在短短數秒內為自己建立一個無論外貌還是聲音(利用自己的真實聲音進行語音參考)都極度擬真的「數碼分身」,並用它來生成演講或教學影片。
  • 嚴格資安與 SynthID 隱形水印:為防範 Deepfake 偽造技術與惡意資訊傳播,Google 暫時鎖定了更進階的他人語音改動功能。同時,所有由 Omni 生成的影片都會自動嵌入 Google DeepMind 開發的 SynthID 隱形數碼水印。人類肉眼無法察覺,但用戶隨時可以透過 Google 搜尋、Chrome 瀏覽器或 Gemini App 內建的透明度工具,一鍵驗證影片是否由 AI 生成。

5. 搶先體驗與推出時程

用戶類別 推出詳情
付費訂閱用戶 即日起全球陸續推出! 所有 Google AI Plus、Pro 及 Ultra 的訂閱用戶,可直接在 Gemini App 與全新的 Google Flow 中體驗。
大眾用戶(免費) 本週內陸續實裝! 將全面免費整合至 YouTube Shorts 以及 YouTube Create App 內,供創作者免費使用。
開發者與企業客戶 預計在未來數週內開放雲端 API 存取權限。
👉 延伸閱讀:  Sony Xperia 1 VIII 渲染圖流出:旗艦迎來 6 年首度大改版?

站長精選 你可能感興趣的 Android 密技: