汪 露,陳美華
(東南大學,南京 211189)
隨著信息技術的飛速發展,個人生物信息被越來越多地運用在日常生活、財政金融、公共安全中。生物信息包括指紋、面容、虹膜和聲紋等,這些個人生物特征是獨一無二的,承載了許多個人信息與個人隱私。作為生物信息的一種,語言信息已被廣泛應用于數字化時代,針對人類語言所表現出的可識別特征,可以對個體聲紋進行身份識別認證和對群體聲紋進行方言識別鑒定。聲紋是一種獨特且易于訪問的生物特征,無須說話人的同意就可以從遠程收集,且只需一個麥克風或一部手機或電腦就可以收集聲紋。聲紋具有普遍性、特定性、相對穩定性和不易復制性,是個體生物獨一無二的語言生物信息,也是語言生物信息的重要內容。
聲紋是對語音中所蘊含的、能表征和標識說話人的語音特征,以及基于這些特征參數所建立的語音模型的總稱[1]。聲紋具有普遍性,可廣泛應用于身份認證等領域。由于每個人說話時的短時頻譜、韻律及語言學特征均有所差異,因此每個人的聲紋都是唯一而獨特的。即使有些人可以模仿他人說話,但是他們無法模仿說話人聲音中最本質的特性,在聲紋特征分析中仍會有所差異,因此聲紋是無法復制的。成年以后,人的發音習慣趨于穩定,人的聲紋特征在長時間內保持穩定不變,因此聲紋具有相對穩定性。
聲紋識別,又稱為說話人識別,是指根據待識別語音的聲紋特征識別該段語音所對應的說話人的過程,是一種通過對聲音的光譜檢查來識別人的方法[1-2]。聲紋識別使用人們話語中的獨特特征,聲紋的獨特性是由聲腔和發音器官所決定的。就算聲音被模仿、扭曲或掩蔽,也改變不了說話者的聲道特征與發音特征,世界上任何兩個人的聲紋圖譜都不一樣,因此也就不會破壞聲紋識別[2-3]。
按照實際應用的范疇,聲紋識別可以分為聲紋辨認和聲紋確認兩類。聲紋辨認是指判斷一條語音屬于模型庫中的哪一個人的過程,而聲紋確認是指確認一條語音是否來自其所宣稱的說話人的過程[3]。聲紋辨認技術常常被廣泛應用于公安司法和軍事領域,而聲紋確認技術的應用更加貼近廣大群眾的實際生活,目前已被廣泛應用于金融和聲紋鎖控等領域。
1.2.1 聲紋辨認技術的應用
1)聲紋辨認技術已廣泛應用于公安技偵領域,幫助公安與司法人員解決眾多事務。如,廈門公安局指揮中心與廈門天聰智能軟件有限公司合作,搭建了報警聲紋采集與輔警系統;北京得意音通技術有限責任公司(以下簡稱北京得意公司)與深圳市中大信通科技有限公司合作,將聲紋識別技術應用于社區矯正項目[3]。聲紋識別技術在公安司法領域具體的實際應用表現在智慧警務建設、構建重點人員聲紋庫、日常治安防控、電詐打擊和案件偵破等方面[4-5]。
將聲紋識別技術融入警務部門的人口信息采集與案件辦理過程,可以提高基層民警的工作效率、節省警力資源,同時將社區人口的聲紋信息納入社區聲紋數據庫,完善智慧警務語音云平臺的建設。
采集如涉恐、涉毒等重點人員的聲紋信息,構建重點人員聲紋庫,通過對比數據,公安部門可以有效遏制和打擊涉恐、涉毒人員,維護社會長治久安。建立海量聲音數據庫,通過對比聲音數據庫和犯罪現場捕捉到的聲音來識別嫌疑犯,鎖定嫌犯的定位。
將聲紋識別技術與打擊電話詐騙相結合,采集詐騙分子的語音,提取其聲紋特征,通過聲紋對比可以快速識別詐騙信息,對廣大民眾預警詐騙信息,并快速鎖定詐騙分子身份[6]。在偵查案件時,可以利用聲紋識別技術對犯罪嫌疑人的語音信息提取聲紋特征,推斷其性別、年齡、身高、體態、文化水平和出生地等信息,刻畫嫌疑人外在特征與心理特征,提供破案線索,縮小搜捕范圍。對刑滿釋放人員或在逃人員運用聲紋識別技術進行監聽,能夠阻止其再次犯案或快速有效實施逮捕[7]。
2)聲紋辨認技術在軍事領域有著重要的應用價值,目前已在軍事保密、指令確認、情報偵聽等方面得以應用[8]。
在軍事系統應用聲紋辨認技術進行身份驗證,可以防止非法用戶進入系統,也可以實現對軍用計算機進行加密,保護機密文件不被竊取、篡改、破壞等。將聲紋辨認技術應用至軍事要地或軍事禁地的門禁系統中,進行聲紋身份認證,可以有效識別合法與非法出入者。
語音指令是軍事行動中較為常用的信息傳遞方式,應用聲紋辨認技術對命令發出者進行身份確認,可以避免敵軍偽裝我方指揮者發出假命令的情況出現。
軍事活動非常重視情報,將聲紋識別技術應用至電子監聽系統,當截獲到敵方的語音通話后,就可以準確識別出通話者的身份,尤其是高層領導者的身份,從而掌握大量的絕密情報,并判斷情報的價值。
1.2.2 聲紋確認技術的應用
2004 年,美國Beep Card 公司發明了聲紋識別信用卡;2006 年,荷蘭銀行(ABN AMRO)使用美國Voice Vault 聲紋識別系統,實現了用戶身份認證;2008 年,Voice Commerce Group 推出了基于聲紋識別的Voice Pay 服務;2011 年,中國建設銀行與北京得意公司合作開發了聲紋電話銀行系統;2016 年,中國建設銀行通過聲紋認證技術對手機用戶身份進行認證;2019 年,平安科技、金融壹賬通與廣發銀行簽署了聲紋核身項目[3];2022 年,中國建設銀行與北京得意公司合作建立金融科技“聲紋+”聯合創新中心。由此可見,聲紋確認技術在金融領域的應用十分廣泛,目前主要包括移動金融業務、電話銀行業務、雇員管理業務[9]。
在網銀賬戶登錄、網絡支付、線上轉賬和信用卡還款等方面,尤其是在征信機構[10],聲紋可以被當作登錄憑證來核驗身份,可以有效提高資金交易的安全性與客戶身份的驗證速度。在遠程開戶和核保核賠等業務中,聲紋確認技術可以輔助人工核實用戶身份,提高工作效率,而線上業務中的語音資料也會被存檔作為依據,便于未來追蹤。
作為金融行業的一項重要業務,電話銀行業務所有的操作都需要通過語音交互完成,因此聲紋識別技術在電話銀行業務中具有非常廣泛的應用和非常重要的作用。當來電客戶開通了聲紋識別業務后,就可以直接通過聲紋識別系統進行身份核實,節省大量時間。
將聲紋識別系統與門禁系統相結合,聲紋識別門禁系統可應用于銀行等高度戒備的場所,尤其是保障加鈔間出入口的門禁安全[11],實現進出權限管理、實時監控、異常報警等功能。
聲紋識別技術的普遍應用給人們的生活帶來了極大的便利,但由于聲紋承載著人們獨特的生物信息,聲紋信息一旦被泄露,基于生理特征的身份識別系統將會徹底崩潰[12]。隨著越來越多的語音助手的出現,保護聲紋一類的生物識別碼變得越來越重要。
2019 年,亞馬遜旗下的語音助手Alexa 和智能音箱Echo Dot Kids 被控訴在未經兒童或其父母同意的情況下,對數百萬名兒童進行錄音并收集聲紋信息,收集兒童觀看與收聽的習慣,即使用戶刪除了設備上的語音記錄,亞馬遜仍保留了這些個人信息。此外,亞馬遜擁有數千名負責審核語音對話的員工,將對話進行轉錄并發送給公司內相關的團隊以便于更好地理解人類語言,但亞馬遜在此之前從未對外公開過這一團隊的存在,也沒有對廣大用戶說明Alexa 語音技術背后有人工的介入。語音助手和智能音箱已經深入人們生活的方方面面,諸如此類的聲控語音設備通過聲紋識別、語音識別等技術與用戶進行互動,逐漸對用戶的數據提出了越來越多的要求。聲紋信息中含有大量個人隱私,如用戶的性別、年齡、個人愛好、家庭成員與家庭地址等敏感信息,不論是將用戶的聲紋信息運用于提高聲紋識別功能以便于提高用戶體驗,抑或是將用戶聲紋信息轉賣給第三方企業以便于從中牟利,都觸犯到了廣大用戶的隱私保護權利。
“滴滴出行”App 在乘客使用順風車服務時頻繁索取用戶手機的電話權限,自2021 年9 月起,在網約車業務中試運營全程錄音功能,用戶在使用該軟件時必須授權錄音功能,否則將無法使用滴滴出行服務。啟動錄音功能后,可以通過一定長度的語音識別出乘客的聲紋信息,進而泄露用戶的個人隱私與敏感信息,與個人相關的大量深層信息將會面臨曝光的風險。聲紋信息一旦被泄露,所有與生物信息認證相關的活動都會受到影響,如出入門禁、工作考勤、支付驗證和行蹤記錄等,將嚴重影響公民的日常生活。滴滴公司違法處理647 億余條個人信息,其中包含人臉識別信息、聲紋信息、精準位置信息等敏感信息,嚴重違反了《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》。
眾多互聯網企業的類似案例表明用戶的聲紋數據面臨泄露、買賣與曝光的風險,隨之而來的是用戶個人信息與個人隱私的泄露。生物信息的應用與發展給個人隱私與國家安全帶來了新的挑戰,保障生物信息安全是各國目前發展所面臨的重點。
大數據和人工智能技術的廣泛應用和快速發展使得聲紋信息以各種方式被泄露,不法分子和不良企業利用聲紋識別技術的漏洞鉆空子,侵害人身安全、財產安全、個人隱私,個人生物信息保護問題亟待解決。可以從建立健全相關法律法規、規范行業標準、處理整頓相關企業和平臺,以及提高個人信息安全意識與能力4 個方面來應對。
聲紋識別技術是近幾十年新興的生物特征識別技術,部分國家已有保護公民聲紋數據的相關條例,我國正處于聲紋識別技術應用的上升期,利用聲紋數據泄露個人隱私的案例時有發生,國家應從法律法規層面予以規范。目前我國越來越重對視語言生物信息的保護,逐步出臺了相關的法律法規,如2020 年在《中華人民共和國民法典》中明確了自然人聲音等生物信息的保護,進一步規范了個人生物信息的采集、存儲、使用和加工等方面的要求。完善生物信息安全法治建設需從立法、執法、司法3 個方面共同推進,對違法違規的服務提供商與個人進行處罰、教育與管理,凈化生物信息識別技術行業環境,為個人生物信息安全保駕護航。
聲紋識別技術廣泛應用于金融和公安等行業領域,各行各業可以針對聲紋技術在行業的發展情況推行各自的行業標準,一方面有利于聲紋技術的應用與發展,另一方面也有助于行業未來的發展進步。比如,2019 年,中國標準化研究院聯手聲紋識別技術研發公司在福建廈門建立了我國首個聲紋識別技術標準化研究基地,推動了多行業制定聲紋識別技術的應用標準。金融和公安領域已經推行了聲紋識別技術的應用標準與規范,中國人民銀行于2018 年發布了聲紋識別技術的金融行業標準,即JR/T 0164—2018《移動金融基于聲紋識別的安全應用技術規范》,并將此規范下發給全國各大銀行和金融機構,對聲紋識別技術在金融行業的功能、性能、安全等方面做出了嚴格的要求[13]。
企業應當遵守語言生物信息相關的法律法規和認真執行行業的相關標準,明確聲紋識別技術的應用范圍,不強制要求用戶授權,杜絕過度采集用戶個人信息;在儲存和上傳用戶的語音文件前,應詢問使用者是否同意,并向用戶明確說明所需信息內容、語音數據用途、文件保存時間等重要信息;杜絕傳送用戶的全部錄音,必要情況下只選取用戶部分特定的語音傳輸至云端,所有和用戶本人個人信息相關的信息應保存在用戶的本地設備上,以避免用戶個人聲紋的要素被泄露[14]。此外,服務提供商或運用聲紋識別技術的企業應提高身份認證系統的多樣性,為用戶提供多種登錄方式。
聲紋是個人生物特征之一,承載了個人身份信息與眾多個人隱私,但仍有許多人對聲紋識別技術的概念的應用缺乏認知與了解,因此要盡快向公眾普及語言生物信息安全知識,提高人們對聲紋的認識,了解聲紋所包含的個人信息及聲紋識別技術的應用情況,加強每一個人對個人聲紋信息保護的重視,不輕易允許應用程序授權使用和收集設備與數據中的個人生物信息;在使用聲紋密碼登錄賬號或認證身份時,選擇較為私密的地點,避開其他人在場;不隨意將自己特定的錄音文件發送給他人,尤其是清晰地朗讀數字、字母表,以免被有心之人剪輯和拼接用于電話詐騙或身份認證;仔細閱讀應用程序中與個人信息相關的使用條例,主動了解國家地方的個人信息相關政策和維權的有效途徑。
聲紋是語言生物信息的重要內容,聲紋識別技術已被廣泛應用于公安、軍事、金融等領域,應用前景廣闊,受到高度重視。聲紋承載了眾多個人隱私與敏感信息,但仍有許多人缺乏對語言生物信息的認知與自我保護意識,同意或在不知情的情況下允許部分不良企業與平臺不斷要求自己提供個人生物信息。不法分子通過收集聲紋數據竊取、泄露或買賣公民個人信息,嚴重威脅公民的人身財產安全。語音輸入、語音助手等與個人語音相關的功能使得用戶聲紋信息被迫暴露給企業商家或應用程序,由聲紋識別而帶來的個人信息泄露也導致個人原始生物特征的泄露,嚴重侵犯個人隱私與人身安全,因此保護個體和群體聲紋信息是保護語言生物信息安全和我國語言生物信息安全體系建構的重中之重。