王哲
一聲令下,讓無(wú)數(shù)機(jī)器設(shè)備為你效犬馬之勞已經(jīng)走近現(xiàn)實(shí)。“一語(yǔ)千金”時(shí)代,你準(zhǔn)備好了嗎?
在古代,聲音是最快速的傳播途徑。“一聲令下”,千軍萬(wàn)馬縱橫千里沙場(chǎng)。老子《道德經(jīng)》里說(shuō),“大音希聲、大象無(wú)形”,聲音包含了最樸素的、深刻的辯證法。今天,我們已經(jīng)在人工智能領(lǐng)域?qū)崿F(xiàn)了人臉識(shí)別、指紋、虹膜、靜脈等人工智能技術(shù),但聲音作為語(yǔ)義表達(dá)最基礎(chǔ)的功能,其獨(dú)特性是無(wú)法取代的。
經(jīng)過(guò)無(wú)數(shù)科學(xué)家數(shù)十載的辛苦耕耘和默默鉆研,借科技成果產(chǎn)業(yè)化的助力,語(yǔ)音識(shí)別技術(shù)正逐步成為計(jì)算機(jī)信息處理中的關(guān)鍵技術(shù),語(yǔ)音技術(shù)的應(yīng)用已經(jīng)形成一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè),受到越來(lái)越多人的關(guān)注,聲紋識(shí)別學(xué)科進(jìn)步和產(chǎn)業(yè)發(fā)展高效融合、相互促進(jìn)的時(shí)代已經(jīng)到來(lái)。如今,一聲令下,無(wú)數(shù)機(jī)器設(shè)備為你效犬馬之勞已經(jīng)走近現(xiàn)實(shí)。“一語(yǔ)千金”時(shí)代已經(jīng)到來(lái),你準(zhǔn)備好了嗎?
識(shí)破偷來(lái)的聲音
聲紋識(shí)別技術(shù)意味著一句話(huà)可以實(shí)現(xiàn)銀行轉(zhuǎn)賬:比如說(shuō)“給張三轉(zhuǎn)1000元”,馬上可以做語(yǔ)音識(shí)別、意圖理解,得出指令,進(jìn)行身份確認(rèn),最后進(jìn)行銀行轉(zhuǎn)賬。但是安全性如何保證?
近日,在清華大學(xué)舉行的“清華前沿論壇——人工智能與信息安全”論壇上,清華大學(xué)控股的得意音通信息技術(shù)研究院宣布正式成立。在論壇現(xiàn)場(chǎng),得意音通信息技術(shù)研究院院長(zhǎng)鄭方博士接受本刊記者采訪時(shí)介紹說(shuō),聲紋識(shí)別技術(shù)是基于每個(gè)人聲道的長(zhǎng)、短、粗、細(xì)以及每個(gè)人說(shuō)話(huà)的節(jié)奏、口音、發(fā)音,還有聲音所對(duì)應(yīng)的喉管、聲道、鼻腔的形狀與尺寸等特征進(jìn)行本質(zhì)識(shí)別,因此就算其他人模仿得再像,出現(xiàn)在計(jì)算機(jī)上的聲紋圖譜也是千差萬(wàn)別的。但人的聲音在表象上經(jīng)常會(huì)出現(xiàn)變化,比如感冒發(fā)燒引起的鼻塞、嗓子變啞以及隨著年齡增大等因素引起的聲音的改變,這是否會(huì)影響到聲紋識(shí)別?鄭方對(duì)此解釋說(shuō),人本身的聲道構(gòu)成、口音、節(jié)奏、發(fā)音還有很多身體特征都是不會(huì)改變的,因此這些表象的改變只是人耳會(huì)察覺(jué)到不同,但并不會(huì)影響計(jì)算機(jī)的識(shí)別。
對(duì)聲紋識(shí)別最大的威脅是“竊取聲音”,比如,在你說(shuō)話(huà)的時(shí)候別人錄下你的聲音,然后用錄音去登錄你的銀行賬戶(hù)。“為了防止這種情況,我們發(fā)明了一個(gè)名為‘聲密保的產(chǎn)品,這是我們獨(dú)有的專(zhuān)利產(chǎn)品。”鄭方介紹說(shuō),“聲密保”就是基于動(dòng)態(tài)密碼語(yǔ)音的身份確認(rèn)系統(tǒng)及方法,其利用動(dòng)態(tài)密碼,結(jié)合語(yǔ)音識(shí)別和聲紋識(shí)別技術(shù),來(lái)實(shí)現(xiàn)用戶(hù)身份的雙重驗(yàn)證。簡(jiǎn)單來(lái)說(shuō),就是需要念出的數(shù)字每次都會(huì)改變,即使是用戶(hù)自己,也要把動(dòng)態(tài)碼念對(duì)才可以通過(guò)身份認(rèn)證。更重要的是,錄音在播放時(shí),它的聲音頻譜已經(jīng)被破壞,與直接說(shuō)的聲音并不相同,完全可以被聲紋識(shí)別系統(tǒng)檢測(cè)出來(lái)。
在論壇現(xiàn)場(chǎng),得意音通首席架構(gòu)師肖永明針對(duì)聲紋技術(shù)的安全性進(jìn)行了演示,“主人”回家開(kāi)門(mén),利用聲紋技術(shù)系統(tǒng)只需第一次使用時(shí)留下聲音,日后通過(guò)說(shuō)話(huà)方式就可把門(mén)打開(kāi),但是靠“主人”的錄音卻無(wú)法開(kāi)鎖,聲紋識(shí)別技術(shù)真正實(shí)現(xiàn)了防“偷聲音”的安全性功能。肖永明具體介紹說(shuō),在極為特殊的情況下,如遭遇犯罪分子脅迫發(fā)聲開(kāi)門(mén),都無(wú)法逃過(guò)得意音通的識(shí)別系統(tǒng),這是因?yàn)樵谄渎暭y技術(shù)中包含聲音固定和特殊變化的識(shí)別特征,讓其安全性達(dá)到了極高的層次。
聲紋識(shí)別技術(shù)還具有一系列的優(yōu)越特性,比如穩(wěn)定性高。檢測(cè)結(jié)果顯示,在壓力測(cè)試連續(xù)工作運(yùn)行中,接收3300萬(wàn)次請(qǐng)求服務(wù),聲紋識(shí)別系統(tǒng)出現(xiàn)失敗或故障次數(shù)為0次。聲紋識(shí)別系統(tǒng)靈活多變,肖永明對(duì)此解釋說(shuō),這是因?yàn)椴捎昧俗灾鲃?chuàng)新分布式并發(fā)處理、分布式協(xié)同處理等技術(shù),不同的場(chǎng)景有不同的解決方案,可以有效避免超大規(guī)模用戶(hù)數(shù)導(dǎo)致的一些瓶頸陷阱,還有高并發(fā)運(yùn)行時(shí)的一些沖突。聲紋識(shí)別支持的用戶(hù)數(shù)范圍比較廣,最少幾個(gè)人都可以用,最多可以20億人。
語(yǔ)音識(shí)別納入人工智能
美國(guó)工程院院士莊炳湟介紹說(shuō),自上世紀(jì)50年代開(kāi)始,經(jīng)過(guò)數(shù)十年發(fā)展,語(yǔ)音識(shí)別技術(shù)出現(xiàn)了諸多新進(jìn)展。但直到2007年,學(xué)術(shù)界才認(rèn)為,語(yǔ)音識(shí)別是人工智能的一部分。“實(shí)際上,科學(xué)家最早開(kāi)展語(yǔ)音識(shí)別研究工作時(shí),幾乎沒(méi)有想過(guò)其是人工智能的一部分。”莊炳湟表示,“但1991年就已證明,機(jī)器對(duì)聲音的識(shí)別一定比人分辨得精準(zhǔn)。因?yàn)橐话闳艘R(shí)別聲音,需要轉(zhuǎn)換,記憶會(huì)產(chǎn)生困難。在這個(gè)過(guò)程中,人很容易出錯(cuò)。對(duì)于一秒鐘的聲音,聲紋技術(shù)識(shí)別錯(cuò)誤率極低。而一秒鐘的聲音,對(duì)人耳而言時(shí)間太短,難以判別。”語(yǔ)音信號(hào)在各種感覺(jué)器官里交互性非常強(qiáng),語(yǔ)音信號(hào)可以全方位無(wú)死角傳播,正所謂隔墻有耳,聲音的傳播方向非常寬,接收能力很強(qiáng)。語(yǔ)言包含信息量非常豐富,口音的信息、語(yǔ)種的信息、內(nèi)容的信息、情感的信息、性別的信息、聲紋的信息……利用這些信息,可以有助于進(jìn)行精準(zhǔn)的身份認(rèn)證。
目前,國(guó)家頒發(fā)了人工智能的發(fā)展規(guī)劃,聲紋識(shí)別技術(shù)是其中重要的一環(huán)。相對(duì)于其他生物識(shí)別技術(shù),在安全性上,聲紋識(shí)別名列前茅,如可以有效防止錄音假冒。如果把人工智能和情感識(shí)別結(jié)合起來(lái),可以檢測(cè)這個(gè)人的聲音是否是真實(shí)意圖、是否被人脅迫,這一點(diǎn),聲紋識(shí)別相比其他人工智能技術(shù)已經(jīng)遙遙領(lǐng)先。未來(lái),聲紋識(shí)別的重點(diǎn)應(yīng)用將在安防領(lǐng)域,如刑偵破案、門(mén)禁、銀行交易、智能家居等,這些特殊的場(chǎng)景對(duì)安全要求尤其高,得意音通的聲紋識(shí)別技術(shù)解決了這些場(chǎng)景中對(duì)身份認(rèn)證的安全需求。
據(jù)中國(guó)銀聯(lián)統(tǒng)計(jì),有14.1%的直銷(xiāo)用戶(hù)在經(jīng)營(yíng)活動(dòng)中會(huì)發(fā)生個(gè)人隱私數(shù)據(jù)泄密,甚至發(fā)生資金損失。使用智能手機(jī)或使用智能設(shè)備的人未必是合法的,人機(jī)的一致性或所謂信息安全的“最后一厘米”問(wèn)題亟待解決,而采用人工智能的最新聲紋識(shí)別技術(shù),可有效為“錢(qián)袋子”保駕護(hù)航。中國(guó)建設(shè)銀行的95533系統(tǒng)已率先應(yīng)用聲紋身份認(rèn)證技術(shù),在一段時(shí)間的試運(yùn)營(yíng)和測(cè)試后,成功地實(shí)現(xiàn)了客戶(hù)的零投訴率。未來(lái),中國(guó)銀聯(lián)將與得意音通合作,把聲紋識(shí)別產(chǎn)品應(yīng)用到更廣泛的領(lǐng)域。
鄭方表示,在移動(dòng)互聯(lián)網(wǎng)改變?nèi)藗兩罘绞健⑿畔踩艿教魬?zhàn)的當(dāng)下,聲紋識(shí)別的應(yīng)用場(chǎng)景將非常廣闊。endprint