【Google I/O 2026】全新「世界模型」Gemini Omni 震撼登場！用日常對話拍片、改片，完美模擬真實物理世界

Gemini Omni

Google 在 I/O 2026 大會上正式發表了令人矚目的全新多模態生成模型家族 —— Gemini Omni。官方將其定義為「推理能力與創作能力的完美結合」，其終極目標是打造一個能「根據任何輸入素材，生成任何形式內容」的 AI 世界模型。

Omni 家族的首發版本 Gemini Omni Flash 已經由即日起正式陸續推送。首階段功能全面聚焦於影片生成與革命性的對話式剪片體驗，徹底顛覆傳統影片後製的工作流。

1. 革命性體驗：用「傾偈」就能剪片、改畫面

傳統影片剪輯需要依賴複雜的時間軸和特效軟體，而 Gemini Omni 讓你可以直接用日常口語對話來修改影片，就如同跟專業後製師溝通一樣：

連續多輪編輯：每一次的指令都會基於上一個畫面進行疊加。AI 會記住前後文的邏輯，確保角色外貌不會變形（維持一致性）、場景細節不會穿幫，鏡頭角度也能自然過渡。
重塑現實世界：你可以上傳一段自己拍的影片，然後指令 Omni：「將背景換成科幻電影的外星表面」、「在畫面中加入一個新角色」或「把手裡的杯子變成一團液態金屬」。那些你無法親自拍攝的震撼鏡頭，現在全憑一句话就能成真。

過去的 AI 影片生成常被人詬病出現「反物理」的怪異畫面（例如物體憑空漂浮或扭曲）。Gemini Omni 在這方面取得了重大突破：

精準模擬物理定律：Omni 具備極強的直覺物理常識，能完美理解重力、動能、流體動力學與槓桿原理等自然規律，讓生成的液體流動、物體碰撞及人物動作顯得無比真實自然。
知識與創意的融合：結合 Gemini 原有的龐大知識庫，它能理解歷史、科學與文化背景。即使你只給出簡短的提示詞，它也能為你製作出兼具畫面真實感與豐富敘事內涵的「複雜概念科普解說影片」。

Omni 支援將文字、圖片、影片、錄音或手繪草圖自由混合輸入。
你可以提供一張動漫角色的相片（參考角色）、一段動作影片（參考動態）加上一段語音指示，Omni 就能將這些風馬牛不相及的素材融合成一段結構完整、風格統一的高質素新影片。

個人專屬 Avatar：用戶可以利用這項技術，在短短數秒內為自己建立一個無論外貌還是聲音（利用自己的真實聲音進行語音參考）都極度擬真的「數碼分身」，並用它來生成演講或教學影片。
嚴格資安與 SynthID 隱形水印：為防範 Deepfake 偽造技術與惡意資訊傳播，Google 暫時鎖定了更進階的他人語音改動功能。同時，所有由 Omni 生成的影片都會自動嵌入 Google DeepMind 開發的 SynthID 隱形數碼水印。人類肉眼無法察覺，但用戶隨時可以透過 Google 搜尋、Chrome 瀏覽器或 Gemini App 內建的透明度工具，一鍵驗證影片是否由 AI 生成。

用戶類別	推出詳情
付費訂閱用戶	即日起全球陸續推出！所有 Google AI Plus、Pro 及 Ultra 的訂閱用戶，可直接在 Gemini App 與全新的 Google Flow 中體驗。
大眾用戶（免費）	本週內陸續實裝！將全面免費整合至 YouTube Shorts 以及 YouTube Create App 內，供創作者免費使用。
開發者與企業客戶	預計在未來數週內開放雲端 API 存取權限。