Gboard App 加設 All-neural, On-device 語音辨識輸入功能, Pixel 裝置率先使用

Google Gboard App 本身已有語音辨識輸入功能,用家可以讀出內容,Gboard App 就會辨識並轉化為文字,但一向都要依賴網絡透過伺服器端配合使用,才可提供良好的辨認效果。

Google 近年來透過不同的架構和模型,利用 AI 等技術不斷改進語音辨識,最新就為 Gboard App 的語音輸入推出了 end-to-end, all-neural, on-device speech recognizer。Google 採用了 RNN-T 技術訓練的新模型,可以縮細至適合放在裝置內運行應用。即是話新的語音輸入不需再依賴網絡配合使用,不會有網絡延遲問題,用家就算是 Offline 也可應用。在新技術下,透過語音輸入的文字是會以逐一字母顯示,效果就如打字般,畫面看起來會更感流暢。

Gboard On Device Speech Recognizer

這個全新的 all-neural, on-device Gboard 功能,將會率先在 Pixel 裝置 (英文美國) 提供。隨著技術改進,稍後亦可應用在其他語音,拓展至其他應用層面。

Source: Google AI Blog

發佈留言