解碼人腦辨聲

2019-07-01 02:38:47朱崇愷

知識(shí)就是力量 2019年7期

關(guān)鍵詞：博士

朱崇愷

想象一下當(dāng)你參加派對(duì)的時(shí)候，周圍播放著音樂，有很多人在跳舞，但是，你還是可以和你想要交流的人對(duì)話。是不是很神奇？我們的大腦具有可以在嘈雜的環(huán)境中篩選出某個(gè)人的聲音的卓越能力，而即使最高端的助聽器也做不到這一點(diǎn)。哥倫比亞大學(xué)電氣工程專業(yè)副教授梅斯卡拉尼（Nima Mesgarani）博士說：“在擁擠的地方，比如喧鬧的街道上使用助聽器時(shí)，會(huì)同時(shí)放大周圍所有的聲音。雖然一些高級(jí)的助聽器可以抑制特定類型的背景噪聲（例如交通），但還是會(huì)將周圍的對(duì)話音量無差別放大。這嚴(yán)重阻礙了佩戴者的有效交流。”一些人工智能交互設(shè)備，例如手機(jī)上的語音對(duì)話軟件和智能音箱也有著同樣的困擾。科學(xué)家將其稱為“雞尾酒會(huì)問題”，名字來源于在喧鬧的聚會(huì)中混合在一起的刺耳聲音。

“我們發(fā)現(xiàn)，當(dāng)兩個(gè)人開始交談時(shí)，說話者的腦電波會(huì)逐漸接近聽者的腦電波。”梅斯卡拉尼博士說。利用這些知識(shí)，該團(tuán)隊(duì)將強(qiáng)大的語音分離算法與神經(jīng)網(wǎng)絡(luò)結(jié)合，從而創(chuàng)建了一個(gè)系統(tǒng)：首先從一組聲音中分離出單個(gè)說話者的聲音，然后將每個(gè)說話者的聲音與聽者的腦電波進(jìn)行比較，再將聲音模式與聽者腦電波最為匹配的說話者的聲音放大。

為了測(cè)試該算法的有效性，研究人員與神經(jīng)外科醫(yī)生（同時(shí)也是該論文合著者）梅塔博士（Ashesh Dinesh Mehta）合作。在梅塔博士負(fù)責(zé)治療的癲癇患者中，一些人必須定期接受手術(shù)。梅斯卡拉尼博士說：“這些患者自愿在我們通過植入患者大腦的電極監(jiān)測(cè)他們的腦波時(shí)，聽取多個(gè)發(fā)言者的聲音，然后我們將新開發(fā)的算法應(yīng)用于這些數(shù)據(jù)。”受到研究結(jié)果的鼓舞，研究人員正在研究如何將它轉(zhuǎn)變?yōu)闊o創(chuàng)設(shè)備，屆時(shí)只需將其置于頭皮外部或耳朵周圍就可以工作。

“到目前為止，我們只在室內(nèi)環(huán)境中進(jìn)行了測(cè)試，”梅斯卡拉尼博士說。“但我們希望確保它也能在繁華的城市街道或嘈雜的餐廳中工作，這樣無論走到哪里，使用者都可以充分地感受周圍的世界和人群。”