在剛果民主共和國的熱帶雨林深處,夜幕降臨時(shí),倭黑猩猩的叫聲此起彼伏,尖叫聲、哼聲、啾聲、哨聲,交織成一場(chǎng)“大合唱”。法國雷恩大學(xué)靈長類學(xué)與語言學(xué)研究者梅麗莎·貝爾泰蹲守在林間,記錄下這些聲音的節(jié)奏與組合。她發(fā)現(xiàn),這些靈長類動(dòng)物并非隨意發(fā)聲,而是在用不同的叫聲“拼句子”,表達(dá)出合作、安撫或邀請(qǐng)的意思。
這項(xiàng)發(fā)表于今年4月的研究,是近年來多個(gè)揭示非人類動(dòng)物復(fù)雜語言能力的案例之一。研究人員在一些靈長類、鯨類和鳥類身上發(fā)現(xiàn)了與人類語言相似的特征和規(guī)律。這些發(fā)現(xiàn)挑戰(zhàn)了長期以來“語言是人類獨(dú)有”的觀點(diǎn),也迫使研究人員重新思考“語言”這一概念的定義。隨著人工智能(AI)被引入動(dòng)物聲音分析,研究人員開始設(shè)想:或許有一天,人們真的能聽懂動(dòng)物在說什么。
創(chuàng)建鯨語“字母表”
過去,研究人員往往依靠漫長的野外觀察和人工標(biāo)注,逐一記錄動(dòng)物的聲音特征。那是一項(xiàng)孤獨(dú)、緩慢、近乎“手工藝”的工作。而如今,AI的加入讓這一切發(fā)生了質(zhì)變。它能在短時(shí)間內(nèi)分析上百萬小時(shí)的錄音,從噪聲中識(shí)別出不同聲紋、節(jié)奏和語境之間的微妙變化。
在鯨類研究中,算法被用來分辨海洋噪聲中細(xì)微的“鯨語”差異。美國非營利組織“鯨類交流計(jì)劃”正在多米尼克島海域跟蹤并錄制抹香鯨的行動(dòng)與聲音。
據(jù)美國塞拉俱樂部海豹協(xié)會(huì)官網(wǎng)報(bào)道,為了獲取足夠的“語料”,研究人員正在全球海域收集海量數(shù)據(jù)。水面上,無人機(jī)拍攝鯨群活動(dòng);水下,水聽器記錄鯨魚發(fā)出的咔嗒聲。有的固定在漂浮的監(jiān)聽站上,有的由科研船拖曳,還有的裝載在可追隨鯨群移動(dòng)的水下滑翔器中。最清晰的聲音,來自直接吸附在鯨體表面的傳感標(biāo)簽,它們不僅記錄聲音,還同步記錄心率、體溫、深度和姿態(tài)數(shù)據(jù)。所有數(shù)據(jù)按時(shí)間戳精確對(duì)齊,構(gòu)成一套龐大的“鯨語檔案”。
2024年,美國麻省理工學(xué)院計(jì)算機(jī)科學(xué)家丹妮埃拉·魯斯團(tuán)隊(duì)基于這些數(shù)據(jù),提出了首個(gè)“抹香鯨字母表”。研究發(fā)現(xiàn),“鯨語”的意義并不只體現(xiàn)在節(jié)奏與停頓的差異上,細(xì)微的時(shí)間變化,或在熟悉的聲型中加入新的聲段,都可能傳遞不同的信息。
分析鳥類鳴唱規(guī)律
除了鯨類,鳥類的鳴叫也展現(xiàn)了驚人的規(guī)律性。
據(jù)英國《自然》雜志報(bào)道,澳大利亞陽光海岸大學(xué)西皮唐斯分校的鳴禽研究員多米尼克·波特文表示,AI工具尤其適用于那些鳴叫變化不大且研究者已收集大量錄音的鳥類。她正在使用AI分析鳥鳴錄音。例如,山雀的叫聲每次聽起來幾乎相同,但AI可輕松識(shí)別、分類并分析其發(fā)聲規(guī)律。對(duì)于像華麗琴鳥這樣的擬態(tài)鳥,或棕色嘲鶇這樣叫聲復(fù)雜的鳥類,AI系統(tǒng)目前的表現(xiàn)仍有限,需要更多數(shù)據(jù)和算法優(yōu)化。
日本東北大學(xué)神經(jīng)科學(xué)家開發(fā)了一款模型FinchGPT,可分析白文鳥的鳴唱規(guī)律。該模型學(xué)習(xí)了3只鳥共3.2萬首“歌”,每個(gè)短音型被轉(zhuǎn)為一個(gè)“字母”,用于預(yù)測(cè)下一個(gè)音型,從而掌握鳥鳴的序列模式。
此外,AI還被用于監(jiān)測(cè)稀有鳥類的存在。據(jù)英國《衛(wèi)報(bào)》報(bào)道,澳大利亞維多利亞動(dòng)物園在墨爾本西部安裝了35個(gè)音頻記錄器,收集了數(shù)萬小時(shí)的錄音。AI分析這些錄音,成功識(shí)別出瀕危鳥類“平原漫步者”的獨(dú)特叫聲,這是30多年來首次在該地區(qū)發(fā)現(xiàn)該物種。
挑戰(zhàn)跨物種“對(duì)話”
“AI讓我們能做到傳統(tǒng)手段無法實(shí)現(xiàn)的事?!泵绹暗厍蛭锓N計(jì)劃”研究員大衛(wèi)·羅賓遜說。該計(jì)劃正利用機(jī)器學(xué)習(xí)算法建立跨物種的“語音模型庫”,嘗試在不同動(dòng)物群體之間尋找共通的表達(dá)結(jié)構(gòu)。研究人員希望,AI不僅能幫助人類破譯動(dòng)物語言,還能重建動(dòng)物間的“對(duì)話圖譜”。
生成動(dòng)物叫聲本身并不困難,但讓這些聲音“有意義”,仍是科學(xué)界面臨的最大挑戰(zhàn)。不過,有些項(xiàng)目已將跨物種交流作為目標(biāo)。例如,“科勒-杜利特挑戰(zhàn)”提供最高50萬美元現(xiàn)金或1000萬美元投資,鼓勵(lì)A(yù)I實(shí)現(xiàn)跨物種交流的突破。
但研究人員也警告,理解并不等于翻譯。即使算法能還原聲波模式,人們也未必真正理解動(dòng)物的“語義”。同時(shí),與動(dòng)物“對(duì)話”存在生態(tài)與倫理風(fēng)險(xiǎn)。例如,向座頭鯨播放人造歌聲,可能改變它們的社交和求偶模式,并通過文化傳遞影響后代。
波特文認(rèn)為,人類與其他動(dòng)物感知世界的方式差異太大,真正的“雙向交流”也許永遠(yuǎn)無法實(shí)現(xiàn)。“我們不是鳥,所以根本無法知道一只鳥聽另一只鳥歌唱時(shí)在想什么。”她補(bǔ)充說,“我們能做的只有盡力而為,而世界始終會(huì)留下一點(diǎn)神秘”。