回到頂端
|||
熱門: 黃子佼 徐巧芯 地震

「神經網路」運算技術加持,Android語音辨識系統更有「智慧」!

WIRED.tw/Jasper Hsu 2013.04.23 00:00

Photo: Ariel Zambelich/Wired

網路龍頭Google開發出最新版Android作業系統Jelly Bean時,在語音命令轉譯功能上做了大改革,加入所謂以「神經網路」技術打造的語音辨識系統。

「神經網路」是種電腦化的學習系統,運作方式很像人類大腦。協助開發的Google研究科學家范豪克(Vincent Vanhoucke)表示,他很驚訝只要改變演算模式就可以有這樣戲劇化的進展。

「神經網路」運算降低系統25%出錯率

范豪克稱,Jelly Bean的語音辨識系統錯誤率較前代約降低25%,如此可以加強用戶使用語音功能的意願;並且能夠更傾向使用接近自然化的語言。而這只是「神經網路」演算技術正在改變今日科技的例子之一。

當Jelly Bean系統接收到語音訊號時,會將聲音頻譜分解並傳送到Google全球的伺服器,接著范豪克團隊所建立的「神經網路」模型便會開始處理這些訊號。為了能夠大量並快速處理這些數據,Google也將這項浩大的工程特別交給專門改造現代數據中心的迪恩(Jeff Dean)工程團隊。

范豪克這類的研究員時常必須分析龐大數據模式(如Jelly Bean使用者的語音頻譜),而「神經網路」技術就提供了解決方案,分析後若碰上未見過的模式,甚至可以進一步預測其代表意義。Google可能透過分析大量的真實數據後,在Jelly Bean使用的「神經網路」中添加多種語言運作模式。

研究風潮捲土重來

「神經網路」曾在1980年代紅極一時,後來消聲匿跡一段時間又捲土重來。除了Google之外,Microsoft和IBM也積極投入研究,探索「神經網路」還能應用於哪些實用領域。

「神經網路」的比喻源自生物學,人體內的神經元會與其他細胞連結構成「網路」,並以特定的方式處理訊號。

演進至今,「神經網路」演算技術的應用已經慢慢延伸至語音辨識與成像軟體;最近剛投入Google麾下的人工智慧研究強人、多倫多大學電腦資訊教授希頓(Geoffrey Hinton)認為,這項技術未來將可運用在所有需要「預測」的領域。例如去年11月,多倫多大學一個團隊就曾利用「神經網路」技術預測藥物分子在現實情況中的運動模式。

狄恩說,Google正將「神經網路」技術應用在各種產品,但Jelly Bean的語音辨識系統是目前進展最顯著的案例。

去年10月,Microsoft研究長拉希德(Rick Rashid)在中國天津現場展示了Microsoft以「神經網路」技術打造的語音處理軟體,過程他以英語演說,停頓一會後程式竟把他的演說現場翻譯成中文,甚至能根據拉希德語調調整譯文,使翻譯出的演說更接近主講人,令在場觀眾驚喜不已。

微軟研究長拉希德展示英中即時口譯技術

「神經網路」技術發展還有很多障礙須克服,但拉希德表示,這項技術前途不可限量,未來可望打破語言藩籬,創造出更美好的世界。

更多精彩文章,請看:

「百度」會是Google可敬的對手嗎?中國搜尋引擎龍頭前進矽谷成立「人工智慧研究所」神祕實驗室Google X:模擬人腦自學成功美國槍砲管理局想靠巨量資料打擊犯罪,「全民公敵」將真實上演?

社群留言

台北旅遊新聞

台北旅遊新聞