破譯鯨魚的聲音（或將破譯鯨言鯨語）

2023-04-18 12:18:27

一條成年抹香鯨和幼鯨在加勒比地區多米尼加附近遊弋，通過咔噠聲交流。科學家計劃利用機器學習去破譯它們之間的對話，這可能是歷史上規模最大的跨物種交流嘗試。攝影：BRIAN SKERRY

撰文：CRAIG WELCH

　　2008年春天，一個神清氣爽的早晨，加拿大生物學家Shane Gero無意間聽見兩條鯨魚在聊天。Gero一直在追蹤加勒比地區多米尼加附近的抹香鯨，兩條來自同一家族的雄性鯨魚突然出現在距離船不遠的地方。它們是「水滴」（Drop）和「雙彎」（Doublebend），用四四方方的腦袋互相蹭了蹭，開始交談。

　　抹香鯨用「咔噠聲」交談，這是一系列有節奏的聲音，被稱為「密碼曲」（coda）。3年來，Gero用水下錄音機捕捉了幾百條鯨的密碼曲，但他從未聽過這樣的聲音。這些鯨魚「交談」了40分鐘，有時一動不動，有時像繩子一樣旋轉銀色的身體，很少長時間沉默。Gero從未這麼急切地想知道它們在說些什麼。他覺得自己好像在偷聽兩兄弟在自己的房間裡較勁。「它們就像兄弟姐妹那樣，聊天，玩耍，」他說：「很顯然，正在發生些什麼事。」

　　在之後的13年裡，國家地理探險家Gero記錄並認識了幾百條抹香鯨。但他不斷回想起聆聽水滴和雙彎對話時獲得的啟發：如果人類想要破譯鯨的語言，或者確定鯨是否有被稱之為語言的東西，那麼需要把它們的咔噠聲與周圍背景匹配起來。揭開鯨交流的關鍵在於了解這些動物是誰，它們發出聲音時正在做什麼。

海洋生物學家Shane Gero已經認識了多米尼加附近的幾百條抹香鯨，包括被他稱為「F家族」的這幾隻。他和鯨類動物翻譯計劃團隊希望，把鯨的咔噠聲與行為相匹配，從而了解它們發聲的含義。攝影：BRIAN SKERRY

　　人類一直有一個願望，那就是有朝一日可以和其他物種對話。Gero的觀點發表後的幾年裡（這是部分原因），彌合交流鴻溝不再是天方夜譚。4月19日，一組科學家宣布，他們以Gero的成果為基礎，開啟一項尖端研究項目，為期5年，嘗試破譯抹香鯨之間的對話。

　　就在幾年前，這樣的嘗試似乎還很荒唐。除了Gero外，研究團隊還包括語言學、機器人、機器學習和攝像工程方面的專家。他們很大程度上依賴人工智慧的進步；現在，人工智慧可以在不藉助羅塞塔石碑或語調的幫助下，把一種人類語言翻譯成另一種。這個項目被稱為「鯨類動物翻譯計劃」（Cetacean Translation Initiative，簡稱CETI），或將成為史上規模最大的破譯跨物種交流項目。

　　這些科學家已經開始製作視頻和音頻專業記錄設備。他們的目標是記錄幾百萬條鯨類密碼曲，並進行分析，從而了解鯨交流的底層架構：構成鯨交流的單位是什麼？是否存在語法、句法，或者類似單詞和句子的東西？專家們將追蹤鯨發出和聽到咔噠聲時的行為，並利用自然語言處理領域的突破，嘗試解讀這些信息。自然語言處理是人工智慧的一個分支，幫助Alexa和Siri響應語音命令。

　　我們訓練狗對指令作出反應，海豚會模仿人類的口哨聲；我們教黑猩猩和大猩猩學手語，通過敲擊鍵盤上的符號教倭黑猩猩回答問題。首爾的大象Koshik甚至會說幾句韓語。但從未有過這樣的嘗試。

　　這次的目標不是讓鯨了解人類（語言），而是人類去了解生活在野外的抹香鯨彼此間說些什麼。

「聽起來就像摩爾斯電碼」

　　這個項目始於另一位海洋生物學家和一個簡單的構想：多個快速發展的學科的頂級專家合作，往往會帶來巨大進展。

　　David Gruber也是國家地理探險家，但他的興趣早已跨越了傳統的學科界限。作為紐約城市大學的生物學和環境科學教授，他用潛水艇研究珊瑚礁。他在索羅門群島發現了一種具有生物螢光的海龜，一群群發光的魚利用亮光調節遊動情況；他還研究了讓貓鯊和一些鰻魚發光的分子，並製作了模仿鯊魚視角的相機。他曾與一位機器人專家合作，開發了一種有6根觸手的精巧裝置，方便研究人員拾取水母，同時不傷害它們。

　　語言學家認為，即便是最聰明的非人類動物，也沒有能被稱為語言的交流系統。鯨會是例外嗎？

　　2017年，Gruber是哈佛大學拉德克利夫學院的研究員，也是一名潛水員。他讀完一本關於研究抹香鯨的自由潛水員的書後，迷上世界上最大的齒鯨——抹香鯨。一天，他正在用筆記本電腦聽鯨類密碼曲，拉德克利夫學院的另一位研究員Shafi Goldwasser恰巧經過。

　　「那些聲音真的很有趣，聽起來就像摩爾斯電碼，」Gruber回憶Goldwasser說。她負責為拉德克利夫學院的研究人員組織關於機器學習的講座；機器學習是人工智慧的一個分支領域，利用算法來尋找和預測數據模式。今天，從搜尋引擎到魯姆巴家用真空吸塵器，再到自動駕駛汽車，機器學習已經融入了生活的各個方面。她催促Gruber與學院裡的研究團隊分享這些咔噠聲。

　　團隊裡有不少計算機領域的高手。Goldwasser是計算機科學家，也是全球密碼學最重要的專家之一。Michael Bronstein是倫敦帝國理工學院的機器學習教授，創立過一家機器學習公司，後賣給了推特，用來監測假新聞。團隊對Gruber的展示很感興趣。機器學習能幫助人類理解動物的交流嗎？

　　Gruber看到了機會。在職業生涯中，他一直在專注於各種神奇的事物，比如珊瑚、生物螢光和水母，讓人們感受海洋的魔力。也許這個項目可以激發人們的想像力，讓人們沉浸在大海的神秘和奇觀之中。「我曾想過，如果我能讓人們愛上水母，那他們也會愛上其他東西，」Gruber說：「而鯨的身上確實有一些東西引起了人們對好奇心。」

　　Gruber需要與了解鯨的人交流。於是，他找到了多米尼加抹香鯨計劃（該計劃旨在追蹤鯨家族動態）的創始人Gero，給他發了一封郵件。Gero同意聽聽Gruber的想法。

　　語言學家認為，即便是最聰明的非人類動物，也沒有能被稱為語言的交流系統。鯨會是例外嗎？人類語言進化的部分原因在於協調社會關係，而Gero已經證明抹香鯨有複雜的社會生活。

　　在動物王國裡，抹香鯨的大腦最大，比人類大6倍。它們的社會網絡以雌性為主導，通過一種跳音二重奏交流，尤其是靠近水面時。它們分成幾百或幾千個部族，用不同的咔噠聲密碼曲表明自己的身份。從某種意義上來說，部族之間有不同的方言。抹香鯨還會通過特別的咔噠聲模式辨別對方，仿佛在呼喚名字。它們學習密碼曲就像人類學習語言一樣，幼年時咿呀學語，直至掌握家族的全部技能。

　　多年來，Gero已經辨別出多米尼加兩大部族的幾百條抹香鯨。憑藉尾葉的獨特斑紋，他一眼就能認出很多。他還通過分析糞便和皮膚樣本的DNA，辨別出祖母、阿姨、兄弟和姐妹。

　　Gero保存著詳細記錄，包括幾千份有著詳盡注釋的咔噠聲記錄。這些咔噠聲描述了誰在說話，它們屬於哪個部族，它們和誰在一起，以及它們當時在做些什麼。

　　這足以展開測試。Gruber的機器學習領域的同事把人工智慧技術應用到Gero的一些音頻中，訓練計算機通過聲音辨別個體抹香鯨，正確率超過94%。

　　激動萬分的Gruber建立了一個工作組，希望擴展這次的研究成果。除了Gero和Gruber在拉德克利夫學院的計算機領域的同事，還有鯨類生物學家、麥克阿瑟獎得主Roger Payne，他在20世紀六七十年代推廣了迷人的座頭鯨之歌，幫助發起「拯救鯨類」運動；哈佛大學的機器人專家Robert Wood，他和Gruber一起製作了水母處理器，他的實驗室製作了自摺疊式摺紙和昆蟲大小的無人機；麻省理工學院的計算機科學和人工智慧主任Daniela Rus，同樣也是麥克阿瑟獎得主。

　　他們認為，人類首次掌握了某種工具，可以更充分地理解動物們在說什麼，甚至是那些大部分時間生活在黑暗中、在海面下300米處捕食魷魚的生物。

　　事實上，這些動物幾乎完全依賴聲音信息，這可能會讓任務變得簡單一點。在距離哈佛園幾個街區之外的一家餐廳裡，研究團隊草擬了新阿波羅計劃的方案，這一次的重點是破譯深海外星人的語言。一度有人甚至提出，如果他們成功了，那麼可能將為與外星生命對話提供一個框架。「我環顧四周，原以為會聽到笑聲，但並沒有，很多人在點頭，」Gruber說。

機器學習帶來突破

　　但這並不意味著科學家勝券在握。

　　過去的幾十年裡，我們已經了解了很多動物獨特的交流方式，草原犬鼠的叫聲取決於接近者是鷹，是郊狼，還是人類。它們甚至還會根據人的高矮、衣著是白色還是紅色，發出不同的聲音。有些猴子會對特定的危險發出不同警報，看到豹子靠近和看到鷹時的叫聲是不一樣的。

　　在人工智慧的幫助下，科學家發現了越來越多的動物交流。2016年，研究人員藉助機器學習，破譯了埃及果蝠爭搶食物和休息地時的不同叫聲。大鼠和小鼠交流的聲音遠遠超出人類的聽力範圍。2019年，科學家把這些聲音轉換成聲波圖，並把這些圖像投射到受人類大腦啟發開發的人工神經網絡上，把不同的聲音與行為聯繫起來，比如逃離危險或試圖吸引配偶。研究人員把他們的算法命名為「DeepSqueak」。

每小時裡只有10分鐘時間，抹香鯨會浮上海面，因此研究人員正在開發一系列視頻和音頻記錄設備，捕捉它們的深海對話。人工智慧將從它們喋喋不休的對話中，尋找規律。攝影：BRIAN SKERRY

　　現在這些想法之所以有可能實現，是因為過去10年裡，隨著算法更加複雜，計算機處理能力大幅提升，機器學習領域很快取得了突破。

　　一些計算機學習是「監督式的」，也就是說科學家給算法提供帶有人類注釋的案例，進行訓練。比如，通過分析上千張標記為「貓」的圖片，算法可以學習識別其他照片裡的貓。

　　但神經網絡則能在沒有人類幫助的情況下，發現語言等事物的規律。有了幾百萬條谷歌新聞，以及缺失一些元素的短語，神經網絡就能夠為這種語言建立一個數學模型。這個模型會學習單詞之間的聯繫，比如「巴黎」與「法國」，「羅馬」與「義大利」。現在，這些模型是自然語言處理的基礎，例如判斷Yelp網站的餐館評論是否是差評，或者檢測垃圾郵件。

　　但仍有很多挑戰要面對。對於人類來說，機器翻譯之所以行得通，有一部分原因是不同語言之間的詞語聯想是相似的，比如「月亮」與「天空」（英語「moon」與「sky」；法語「lune」與「ciel」）。「但對於鯨而言，最大的問題是這些事物是否存在，」麻省理工學院自然語言處理專家、CETI的團隊成員Jacob Andreas說：「這個交流系統中，是否存在像語言一樣的最小基本單位，它們之間是否存在組合規則？」

　　為了找到答案，研究團隊打算利用一系列技術。例如，深層網絡方法，從語言規則體系中隨機選出一些，檢查對話「單元」是否符合這些規則。如果不符合，進行調整，再次嘗試。計算機「調整和驗證規則的過程非常迅速，可以重複成千上萬次，生成一套比較貼合數據的規則，」Andreas說。

　　當然，研究進展取決於研究人員能否收集到足夠多的數據。機器學習需要大量信息，但Gero的記錄只有幾千條。尋找鯨的對話規律可能需要幾千萬條密碼曲，甚至更多。

　　而且，正如Gero對水滴和雙彎的推測，科學家認為需要把交流與行為進行匹配。在捕獵行為之前，是否有一個特別的密碼曲？或者在決定交配前，鯨類是否有特別的語言序列？

　　「這是雞尾酒會問題，」Gruber說。在聚會上放置好幾個麥克風，我們會聽到好幾段對話。但觀察現場，比如誰碰了誰的胳膊，或者誰掃視全場尋找更好的夥伴，「整個場景就會變得更有意義，」Gruber說。

動物交流研究革新

　　4月19日，研究團隊朝這個方向邁進了一大步。CETI領導者與多米尼加建立了夥伴關係，在該國的水域中採用了更多鯨類監測技術。CETI被列為TED「大膽計劃」，這個計劃會為8個大膽的項目籌集資金。研究團隊還得到了國家地理學會的資助。

　　CETI的研究人員已經用了一年時間研發出大量精密的高解析度水下傳感器，在Gero研究鯨類的大部分水域，一天24小時記錄聲音。其中3個監聽系統與水面浮標相連，可以直接沉入幾百米之下的海底，每隔幾百米就有一個水聽器。

　　聆聽鯨在自己的環境中，按照自己的方式說話。我們想知道它們在說些什麼，我們很在意這一點。

David Gruber，海洋生物學家，國家地理探險家

　　國家地理勘探技術實驗室和哈佛大學的機器人專家、國家地理探險家Wood幫助設計了新一代攝像機，它可以用吸盤附著在鯨類身上。不同於之前的版本，這款攝像機可以經受住鯨類捕食深度的海水壓力，在幾乎漆黑的環境中拍攝畫面，錄製高質量的音頻。

　　麻省理工學院的Rus正在研究其他機器人技術，幫助開發空中、漂浮和水下無人機，悄然記錄聲音和視頻。她最近幫助開發了一款泳動機器人，可以模仿巖礁魚類擺動尾巴，悄無聲息地遊動。

　　「我們想儘可能多知道一些情況，」Gruber說：「天氣怎麼樣？誰在和誰說話？10公裡以外發生了什麼事？鯨魚餓了，病了，懷孕了，還是在交配？但同時我們也希望自己儘可能地隱形。」

　　外界專家表示，CETI可能會徹底改變野生動物研究，喬治敦大學的教授Janet Mann在澳大利亞研究海豚已有幾十年，她表示，這個計劃「不僅對研究抹香鯨，對研究其他動物的交流系統，都具有開創性意義。」

　　康奈爾大學的聲學生態學家Michelle Fournet說，這項計劃解決了動物研究中的一個關鍵難題。包括科學家在內，人們總是希望從動物的行為中看到類似人類的規律。「我們看見座頭鯨擺動胸鰭，會覺得它們在打招呼。」但座頭鯨通常只是在展現攻擊性。人工智慧可以消除我們的偏見，更準確地發現交流與行為的意義，Fournet說。

　　對於CETI研究人員來說，更多的價值在於發現過程本身。阿波羅計劃把人類送上了月球，而在這個過程中，人類發明了計算器、尼龍搭扣和電晶體，幫助開啟了數字時代。即使CETI無法破譯抹香鯨的密碼曲，研究人員也會在機器學習、動物交流和了解世界上最神秘的動物方面，取得重大的進步。

　　而且，多年之後，如果我們對抹香鯨的發聲結構有了更清晰的了解，研究團隊可能會嘗試與它們進行交流，不是進行跨物種對話，而是觀察抹香鯨的回應是否與預測的一樣。這麼做的目的是驗證研究團隊對抹香鯨交流的評估。

　　「問題出現了：你打算對它們說些什麼？這似乎有點不得要領，」Gero說：「我們假設，它們有一種語言，來談論我們，談論船、天氣，或者我們想問它們的事情。」

　　Gruber也同意這一點。「不是我們和它們對話，」他說：「是我們在聆聽鯨類在自己的環境中，按照自己的方式說話。我們想知道它們在說些什麼，我們很在意這一點。」

（譯者：Sky4）