朱崇愷
想象一下當(dāng)你參加派對(duì)的時(shí)候,周圍播放著音樂,有很多人在跳舞,但是,你還是可以和你想要交流的人對(duì)話。是不是很神奇?我們的大腦具有可以在嘈雜的環(huán)境中篩選出某個(gè)人的聲音的卓越能力,而即使最高端的助聽器也做不到這一點(diǎn)。哥倫比亞大學(xué)電氣工程專業(yè)副教授梅斯卡拉尼(Nima Mesgarani)博士說:“在擁擠的地方,比如喧鬧的街道上使用助聽器時(shí),會(huì)同時(shí)放大周圍所有的聲音。雖然一些高級(jí)的助聽器可以抑制特定類型的背景噪聲(例如交通),但還是會(huì)將周圍的對(duì)話音量無差別放大。這嚴(yán)重阻礙了佩戴者的有效交流。”一些人工智能交互設(shè)備,例如手機(jī)上的語音對(duì)話軟件和智能音箱也有著同樣的困擾。科學(xué)家將其稱為“雞尾酒會(huì)問題”,名字來源于在喧鬧的聚會(huì)中混合在一起的刺耳聲音。
“我們發(fā)現(xiàn),當(dāng)兩個(gè)人開始交談時(shí),說話者的腦電波會(huì)逐漸接近聽者的腦電波。”梅斯卡拉尼博士說。利用這些知識(shí),該團(tuán)隊(duì)將強(qiáng)大的語音分離算法與神經(jīng)網(wǎng)絡(luò)結(jié)合,從而創(chuàng)建了一個(gè)系統(tǒng):首先從一組聲音中分離出單個(gè)說話者的聲音,然后將每個(gè)說話者的聲音與聽者的腦電波進(jìn)行比較,再將聲音模式與聽者腦電波最為匹配的說話者的聲音放大。
為了測(cè)試該算法的有效性,研究人員與神經(jīng)外科醫(yī)生(同時(shí)也是該論文合著者)梅塔博士(Ashesh Dinesh Mehta)合作。在梅塔博士負(fù)責(zé)治療的癲癇患者中,一些人必須定期接受手術(shù)。梅斯卡拉尼博士說:“這些患者自愿在我們通過植入患者大腦的電極監(jiān)測(cè)他們的腦波時(shí),聽取多個(gè)發(fā)言者的聲音,然后我們將新開發(fā)的算法應(yīng)用于這些數(shù)據(jù)。”受到研究結(jié)果的鼓舞,研究人員正在研究如何將它轉(zhuǎn)變?yōu)闊o創(chuàng)設(shè)備,屆時(shí)只需將其置于頭皮外部或耳朵周圍就可以工作。
“到目前為止,我們只在室內(nèi)環(huán)境中進(jìn)行了測(cè)試,”梅斯卡拉尼博士說。“但我們希望確保它也能在繁華的城市街道或嘈雜的餐廳中工作,這樣無論走到哪里,使用者都可以充分地感受周圍的世界和人群。”