【于思專欄】AI有助於解碼動物們的語言

銳傳媒

銳傳媒/特別報導

135 天前

2020 年 5 月， Pratyusha Sharma 煞費苦心地解析數據，準備與麻省理工學院的研究小組開會，希望能找到模式。這不僅僅是任何數據集——事實證明這個數據集是難以破解的。它包含了十多年來收集的數小時抹香鯨用於交流的吱吱作響的咔嗒聲。ByAnna Peele發表在最新一期《國家地理雜誌》(National Geographic) 的<動物們在說什麼？人工智慧可能有助於解碼他們的語言>( What are animals saying? AI may help decode their languages)指出，一個突破性的研究計畫最終正在建立工具來解釋鯨魚和其他生物的溝通方式。(A groundbreaking research project is finally building the tools to translate just how whales and other creatures communicate.)

發現座頭鯨會互相唱歌時，促成了「拯救鯨魚」運動

Sharma 是 CETI 計劃（鯨魚類翻譯計劃）的一部分，用該組織的話來說，該計劃旨在理解「鯨魚在說什麼」。目標很簡單，但極其困難：CETI 希望翻譯非人類溝通。因此，夏爾馬和團隊的其他成員招募了他們自己的非人類盟友，即一個基本的人工智慧程序，來幫助以新的方式組織聲音線索以獲得更多靈感。

CETI 希望，如果人類能夠了解鯨魚的內心想法，並最終了解其他動物的內心想法，這可能會激發更大的保護步伐。該組織有充分的理由相信它可以。例如，在 1960 年代，當研究人員發現座頭鯨會互相唱歌時，他們的工作促成了「拯救鯨魚」運動和《海洋哺乳動物保護法》的巨大成功。幾十年來受到嚴重威脅的座頭鯨和灰鯨數量開始恢復。

CETI 七年前在哈佛大學拉德克利夫研究所偶然開始。海洋生物學家兼國家地理探險家大衛·格魯伯（David Gruber）正在他的辦公室裡聆聽抹香鯨的錄音。電腦科學家沙菲·戈德瓦瑟（Shafi Goldwasser）碰巧路過，聽到了奇怪的咔噠聲，於是走進格魯伯的辦公室詢問它們是什麼。這個答案提供了一種新的動力。 Goldwasser 的許多同事已經在使用機器學習來嘗試改進人類語言翻譯。為什麼不對鯨魚應用類似的方法呢？

可以看到鯨魚的駝峰從海水露出來。在其上方是一項充當標記設備的技術。這會將標籤附加到鯨魚上以收集音訊。

他擁有最全面的鯨魚聲音資料庫

格魯伯說，一次點擊幾乎就像一個一和一個零——或者二進位代碼，這是最基本的電腦語言。 “如果您嘗試分析一段 20 分鐘的座頭鯨歌曲，而且該歌曲的頻譜非常複雜，那麼點擊效果會非常好。”它們很容易被人工智慧模型攝取並分析。

格魯伯聯繫了另一位國家地理探險家謝恩·傑羅（Shane Gero），他花了 13 年時間在加勒比海島國多明尼加研究抹香鯨。「他擁有最全面的鯨魚聲音資料庫，」格魯伯說。他們進行了一項試點研究，看看是否可以設計一個客製化的機器學習程序，能夠在這些互動中發現熟悉的序列，就像人類具有可識別的對話模式一樣。結果是一種新的處理模型能夠預測一些鯨魚接下來可能會溝通的內容。「預測下一次點擊的準確率達到了 99%，」格魯伯說。

標記鯨魚並記錄它們的聲音和動作

然後，該團隊將該模型應用於 Gero 和他的團隊正在進行的在多明尼加的研究，在那裡，科學家正在標記鯨魚並記錄它們的聲音和動作。當吊艙浮出水面時，無人機監視它們的行為。這些數據返回實驗室，希望將稱為尾聲的不同點擊組與明顯的行為聯繫起來，這可能是鯨魚積極傾聽彼此並做出行動回應的證據。

到2020 年，格魯伯的最初團隊已擴大到近20 名科學家，涵蓋哈佛大學、麻省理工學院、牛津大學和加州大學柏克萊分校，代表不同學科：機器學習專家、海洋生物學家、密碼學家，最重要的是，還有語言學家。他們利用人工智慧發現並編錄了從數千小時的錄音中提取的數千種不同的尾聲。

將音訊資料轉化為一種新型視覺化

夏爾瑪加入該計畫時，正在麻省理工學院攻讀研究生第二學期，學習電腦科學和人工智慧。她有一個主意。自從這個計畫開始以來，科學家一直以相同的方式表示單一尾聲：一系列破折號代表鯨魚每秒發出的聲音次數。在麻省理工學院同事的幫助下，夏爾馬將音訊資料轉化為一種新型視覺化——它不是水平軸上的小節，而是看起來更像管弦樂樂譜，展示了多個尾聲。平行的層疊點線並排呈現聲音。

這種方法揭示了每個尾聲節奏的微妙差異，即點擊之間的時間變慢或變快。借用古典音樂，研究人員將這些稱為自由節奏。該系統還揭示了鯨魚在尾聲末尾添加額外滴答聲的情況。研究人員稱這種「裝飾」似乎有意義。

節奏、節奏、裝飾和自由節奏的微妙變化讓夏爾馬和她的同事想起了音素，即人類組合和重新組合成單字的聲音片段。這些尾聲可能是複雜語言的基礎。直到現在，大多數細微差別都無法區分。

人工智慧在許多方面仍然很神秘

在加入 CETI 之前，Sharma 曾考慮獲得博士學位。在機器人技術中。她從未研究過動物。她甚至從未見過鯨魚。麻省理工學院的自然語言處理專家、該計畫的研究人員之一雅各布·安德烈亞斯(Jacob Andreas) 表示：「CETI 計畫的一個很酷的事情是讓一群真正認為自己是電腦科學家的人真正參與這個計畫。

這種工作不僅限於鯨魚。在自然界中，科學家和研究人員越來越多地求助於人工智慧來幫助了解動物的內部生活，以及維持它們的棲息地——海洋、森林，甚至商業農場。人工智慧在許多方面仍然很神秘，但它已經使人類與其他生物之間的聯繫成為可能，也許還提供了一種思考地球未來的新方式。

蘇雷什·尼提拉詹 (Suresh Neethirajan) 致力於另一種電腦動物互動的前沿研究。身為加拿大新斯科細亞省達爾豪斯大學的電腦科學和農業教授，他研究農民如何使用即時監控來解釋不同行為的真正意義。

利用技術來改善動物的生活品質

尼提拉詹在印度南部的一個乳牛場與牲畜一起長大。他的父母認為他們的乳牛是這項事業的伙伴——人類負責，但如果沒有這些生物和牛奶，他們就沒有生計。因此，當乳牛停止生產時，它們不會被送往屠宰場。他們在農場度過了自己的日子，以感謝他們的服務。尼提拉詹說，這是一個「社會經濟信仰體系」。

尼提拉詹不吃肉，大約十年前開始研究農場動物（雞、牛、馬、羊和豬）的內在生活。他說，作為一名“受過經典訓練的農業工程師和部分訓練有素的動物科學家”，他想知道如何利用技術來改善他們的生活品質。

識別出最有可能生病的五隻雞

首先，他必須收集數據。他用生物感測器以及血液、糞便和頭髮樣本監測體溫、皮質醇水平、荷爾蒙、呼吸和心率。然後他將其與音訊和視訊片段配對，並添加背景訊息，例如動物接受食物（正面）或聽到令人震驚的噪音（負面）。目標：了解動物舒適或不適時的樣子。

七年前，Neethirajan 開始使用人工智慧處理他的數據，包括對牲畜進行臉部辨識和步態分析的深度學習模型。與 Sharma 和麻省理工學院的團隊一樣，他使用自然語言處理工具來理解動物的發聲。他的分析可以找出雞在離開房間之前發出的具體叫聲。他解釋說，現在，可以將一個裝滿 5,000 隻雞的穀倉的視頻片段放入模型中，幾分鐘內它就可以識別出最有可能生病的五隻雞。

Neethirajan 的工作論證了為什麼動物福利即使在一個不總是優先考慮其生物產品福祉的行業中也是有價值的。及早發現疾病可以防止痛苦和經濟損失。有研究表明，快樂的動物是更有生產力的動物。生活在積極環境中的乳牛可以產出更多更好的牛奶。農場可以根據這些資訊採取行動。「它們是有思想的生物，」尼提拉詹談到動物時說道。 “他們有自己的喜好和厭惡。”他發現，當雞的棲息地被更頻繁地清潔時，雞發出的痛苦噪音就會減少，因為它們可以更輕鬆地呼吸，那麼為什麼不增加清潔時間呢？

新型人工智慧增強型“聽診器”

「身為人類，」他說，「我們與植物界、動物界和[其他]人類共存，我們的人口正在急劇增長……我們如何和平共處？我們如何創造和諧？對於這群新的人工智慧輔助研究人員來說，這些不再只是存在問題，這引發了更宏偉的實驗。

Jörg Müller 負責德國最古老的國家公園巴伐利亞森林國家公園的保育工作，並在維爾茨堡大學教授森林生態學。但他的研究跨越了半個地球，來到了南美洲，在那裡他正在開發一種新型人工智慧增強型“聽診器”，用於監測為農業而清理的熱帶生態系統。透過衛星和遙感來調查森林冠層的再生情況相對容易。很難知道需要多長時間才能恢復本地生物多樣性——生活在樹冠下的繁盛的生物和植物。穆勒與厄瓜多爾的統計學家、昆蟲學家、鳥類學家和當地社區合作，以了解他可以追蹤到的哪些訊號可能是振興努力發揮作用的證據。

鳥類是熱帶生態系整體活力的最佳指標之一

2021 年，穆勒聯繫了威斯康辛大學麥迪遜分校的助理教授祖扎娜·布日瓦洛瓦 (Zuzana Buřivalová)，他稱其為「健康生態學領域的年輕後起之秀」。她和她的同事開發了一種利用生物聲學根據森林中發出的聲音來估計有多少不同物種生活的方法。

Müller 和他的團隊應用了 Buřivalová 的方法，在厄瓜多爾喬科森林周圍約 50,000 英畝的數十個地點放置了記錄設備。他們連續兩週收集數據：近 2,000 小時的音景。

鳥類是熱帶生態系整體活力的最佳指標之一。穆勒表示，如果它們已經恢復，那麼食物鏈上下的其他物種，從美洲虎到昆蟲，也會恢復。因此，穆勒請鳥類專家胡安·弗雷萊（《厄瓜多爾鳥類》的作者）和魯迪·傑里斯從音頻中識別鳥類的聲音；他們記錄了 300 多個物種。然後，他將音訊與現有的人工智慧模型進行對比，該模型經過訓練可以識別 75 個物種，所有這些物種都是它在音景中「聽到」的。它也可以近似估計它們的豐度。穆勒認為這些結果很有希望，因為它們證明經過充分訓練的人工智慧可以與人類專家一樣有效，而且速度更快，並幫助科學家監測森林恢復的進展。根據專家和人工智慧識別，穆勒預測，雨林土地一旦被砍伐用於耕種，需要大約 55 年才能恢復其原生生物多樣性。

鯨魚不是天生就有語言，而是透過社交方式習得的

CETI 計畫正處於不同的轉折點，研究人員仍處於資訊收集階段。科學家知道鯨魚溝通時的樣子和聲音，但還不知道這些代表什麼。 “我們就像小鯨魚開始學習，”格魯伯說，“一次一小部分。”

儘管鯨魚的語言可能與人類語言有一些相似之處，但這並不意味著鯨魚的語言結構反映了我們的語言：我們有完全不同的生態和演化需求。安德烈亞斯解釋說，也許鯨魚只是在說，嘿，你能向左滑行嗎？他的 CETI 同事看到了這樣的航行模式：一群鯨魚沿著多明尼加島的一側遊動，然後突然轉向並移向公海，即使它們彼此都看不到對方。

夏爾馬希望有一天我們能夠了解語言是如何從母親傳遞到小牛的。和人類一樣，鯨魚不是天生就有語言，而是透過社交方式習得的。安德烈亞斯夢想更多地了解母系社會結構。幾年前的夏天，當他和格羅在船上觀察抹香鯨時，格羅指著一對抹香鯨告訴安德烈亞斯：「她們是部落的兩位老太太，她們是彼此最好的朋友，她們一直出去玩。安德烈亞斯想知道鯨魚的叫聲是否與大象和海豚的名字類似，以及它們是否能夠指稱不存在的鯨魚。

還有很多事情要做和學習。

儘管格魯伯最大的希望是對抹香鯨的深入了解將改善它們的生活，但他仍然對在哈佛的那一刻感到震驚。有人說：如果我們能翻譯抹香鯨所說的話，我們就可以利用這種平台與外星人溝通。這不是什麼新想法——它出現在一部古老的《星際爭霸戰》電影中。

不同的是，研究人員現在實際上正在取得進展。如果人工智慧可以幫助我們進入我們尚不了解的自然世界，誰知道有一天它會打開什麼樣的宇宙。

【于思專欄】AI有助於解碼動物們的語言

其它新聞

2025手機推薦排行榜: 旗艦/拍照/萬元/中階手機推薦 | 02月更新

探索威士忌的魅力：三大熱門產地特色與必買推薦

iPhone 16搭配5G吃到飽方案-這裡辦省超多！[02月市場快訊]

隱藏版！中華$399吃超飽 -4G吃到飽攜碼優惠比較-2025.02月最新

[2025.02更新] 拍照手機排行榜- P&P RANK | DXOMARK