【洪存正特稿】大腦植入物可瞬間將想法轉化為語音

一種能將神經訊號轉換成可聽見的語音的讀腦植入物,讓一位癱瘓的婦女幾乎立刻就能聽到她想說的話。米里亞姆·納達夫 Miryam Naddaf發表在最新一期權威期刊《自然》(Nature)的<大腦植入物可瞬間將想法轉化為語音>( Brain implant translates thoughts to speech in an instant)指出,腦機介面的改進使該技術更接近自然對話速度。(Improvements to brain–computer interfaces are bringing the technology closer to natural conversation speed.)
研究人員利用人工智慧(AI)演算法增強了這種設備——即所謂的腦機介面(BCI),該演算法可以解碼女性想到的句子,然後使用合成聲音大聲朗讀出來。與之前只有在用戶說完整個句子後才能產生聲音的努力不同,目前的方法可以同時檢測單字並在三秒內將其轉換為語音。
這項研究結果於 3 月 31 日發表在《自然 神經科學》雜誌上,代表我們朝著實用化的 BCI 邁出了一大步。
荷蘭馬斯垂克大學計算神經科學家 Christian Herff 表示,舊式語音生成 BCI 類似於“WhatsApp 對話”,但他未參與此項研究。 「我寫一個句子,你寫一個句子,你又需要一些時間再寫一個句子......這不像正常的對話那樣流暢。”
他補充說,即時傳輸語音的 BCI 是研究的“下一個層次”,因為它們允許用戶傳達自然語音特有的語調和強調。
研究參與者安 (Ann) 在 2005 年腦幹中風後失去了說話能力。大約 18 年後,她接受了手術,在大腦皮質表面放置了一個薄如紙的矩形,其中包含 253 個電極。該植入物可以同時記錄數千個神經元的綜合活動。
研究人員透過對安的婚禮視訊錄音訓練人工智慧演算法,將合成聲音個性化,使其聽起來像安受傷之前的聲音。