客委會110年啟動「臺灣客語語音資料庫」建置計畫,目前已經初步完成,四縣腔及海陸腔的語音辨識及合成資料,並且開放民眾授權申請,而語音資料庫是連接數位科技的重要基礎,搭配語音技術的發展,未來將應用在客語教學以及醫療長照領域,健全客語友善環境。 「我媽看到就很生氣的說,鬼畫符一樣。」 錄音員一字不漏地唸出句子豐富客語語音資料,客委會110年啟動「臺灣客語語音資料庫」建置計畫,經過2年的努力,近期總算正式上線。 客委會語發處處長 孫于卿:「我們這次做的這個語音資料庫,其實它最重要的功能就是說,它對於就是說,客語下次要進入數位的時代,要可以讓人應用,這是最重要的一個基礎,對於就是說,客家話的保存還有復振來說,是最重要的工具。」 「Hey,Siri,今天天氣如何?今天會下雨。」 記者 劉宜頻:「像這樣的語音功能,在我們的日常生活中已普遍應用,而現在有了客語語音資料庫後,要像這樣用客語跟語音機器人來對話,也不是問題了。」 「客家美食有什麼?客家美食種類繁多,包含了擂茶、鹹豬肉、桂花醬。」 國立陽明交通大學智能系統研究所所長 廖元甫:「應該說就是讓電腦聽得懂客語,然後也讓電腦可以講客語,這樣就可以跟真人對答這樣子,就是說這是初步讓它先會動,你假如真的要可以讓,像人跟人這樣講話,那我們需要更多的資料。」 學者表示縱使還有很多問題需要改善,但總得開始做,而目前客委會已將語音資料庫,投入客語學習,以及醫療長照領域的研發工作,紓解客語教學現場師資不足的問題,促進醫病溝通更加順暢。 客委會語發處處長 孫于卿:「我們是已經有投入了這樣的研發的工作,預計看明年是不是有一個初步,可以來、來讓大家來做應用,同時我們也很鼓勵,像是民間團體、企業,也可以應用到我們的這個語音,也可以來開發他們的商品。」 不過目前初步完成的,只有四縣腔及海陸腔的語音辨識及合成資料,客委會表示接下來將用2年的時間,逐步完成大埔、饒平、詔安的語音蒐集整理,建立「四海大平安」大語音庫,讓客語友善環境更加健全。