張 倩/南京藝術學院
生物特征識別技術指提取人體固有的、唯一的先天生理特征(如指紋、掌紋、面像、虹膜等)或后天形成的行為特征(如步態、聲音、筆跡等),并將這些生物特征數字化,以用于個人身份鑒定的一種智能技術,一般分為生理特征識別技術和行為特征識別技術。“高校檔案云”服務平臺是一種云計算平臺,它通過搭建統一的IT基礎架構,將各高校檔案館(室)連接成互聯互通的信息共享平臺,并提供標準規范、靈活便捷的檔案信息管理“協同運作服務”。將生物特征識別技術應用到“高校檔案云”服務平臺,有利于提升“高校檔案云”服務平臺的集成和協同水平。本文通過考察生物特征識別技術的應用場景及其實用價值,探究將其引入“高校檔案云”服務平臺的可行性,并指出應用中需要注意的問題。
世界上沒有兩個相同特征的指紋,高校檔案館(室)可通過在“高校檔案云”服務平臺建立指紋識別引擎,配置“采集、存儲、比對”等一系列指紋數據集成圖像的算法功能,實現用戶指紋特征分析識別之目的。其主要應用價值如下:
首先,指紋識別技術可用于檔案庫房等需要高度安全防護的地方,對來訪人員進行身份驗證。高校檔案館(室)安裝指紋門禁系統,使用時只需將手指平放在指紋采集器的采集窗口上即可完成開鎖任務,且可避免機械鎖、密碼鎖、芯片卡等其他門禁系統易被遺忘、盜用、偽造、破譯的弊端。其次,指紋識別技術可用于涉密檔案信息系統的用戶身份驗證和鑒定。目前服務平臺主要靠“用戶名+密碼”等傳統身份識別手段來進行登錄,不僅操作繁瑣,而且密碼易忘。采用指紋識別技術,用戶可實現“一觸即發”,即刻登錄“高校檔案云”服務平臺。再次,創建用戶指紋“一卡通”信息服務窗口,可有效提升便民服務水平。高校檔案管理機構可在師生辦理“校園卡”時,將其指紋采集錄入指紋檔案數據庫平臺中,師生無需重復注冊或擔心密碼遺忘。
高校檔案館(室)不能忽視指紋識別技術的局限性。當用戶的手指有疤痕,或手指是濕的、有油污時,指紋解鎖的成功率易受影響。此外,指紋識別技術會受指紋傳感器面積的限制難以完整采集用戶的指紋數據,并且存在被“萬能指紋”等模擬器破解的可能性。因此高校檔案館(室)應關注并應用超聲波指紋識別技術、指紋靜脈傳感器等更為先進的指紋識別技術,確保指紋驗證具有更強的安全性。
作為2017年10大全球突破性技術之一的人臉識別技術[1],是指通過攝像頭采集人臉信息并借助各種智能算法,對數以億計的用戶臉部關鍵點進行學習、訓練、總結,再將“三維建模”數據庫中的原始數據與需驗證的人臉數據進行比對的一種生物安全驗證手段。其主要應用價值如下:
首先,高校檔案館(室)可將采集到的師生人臉圖像數據錄入歸檔系統,并利用該系統保存的人臉圖像數據創建師生人臉檔案數據庫。如“高校檔案云”服務平臺集成人臉識別功能,師生只需對著攝像頭“刷臉”,即能迅速而準確地完成身份鑒驗。其次,人臉識別技術還可用于檔案館(室)的門禁安防等領域。人臉識別技術具有不被被測個體察覺、能夠進行遠距離身份識別的特點。利用這項技術不僅可從監控視頻畫面中實時查尋人臉,而且可與人臉檔案數據庫中存儲的人臉數據進行實時比對,實現遠距離快速鑒驗人員身份。再次,人臉識別技術還可提升高校檔案館(室)所開發手機APP的智能化水平。作為“數字原住民”一族的大學生[2],在使用APP時直接用臉部對著手機就能解鎖并查閱利用檔案,能獲得較好的使用體驗。
需要指出的是,高校檔案館(室)可采用更為先進的技術來提高人臉識別系統在實際使用中的安全性,比如讓用戶根據系統指令做出動作或表情,作為系統智能驗證碼,如眨眼、左右搖頭、唇語等,通過這樣的方式強化人臉識別技術的防偽鑒驗能力。
虹膜是位于人眼黑色瞳孔和白色鞏膜之間的圓環狀部分,具有高度的獨特性、穩定性和不可更改性等生物特點,可作為檔案用戶身份識別的物質基礎。虹膜識別技術的主要應用價值如下。
首先,可用于檔案安防設備或有高度保密需求的場所。檔案庫房作為有高度保密需求的場所,以虹膜信息作為密碼不僅無法復制,而且每一次活動都會留下“痕跡”(日志記錄),便于追溯與查詢,如遇非法操作還可自動報警。其次,高校檔案館(室)根據安防需要,既可在特定區位安裝虹膜識別裝置實施安全監控,也可靈活授權并調整用戶權限,隨時了解用戶動態和活動范圍,實現實時智能管理。
值得注意的是,虹膜識別技術成本高昂,短時間內無法大范圍推廣;虹膜識別設備會發生鏡頭捕獲圖像畸變的問題,使可靠性降低;將虹膜作為“密碼”雖然具有更好的“長期安全性”,但被檢測用戶必須是活著的狀態才能正常識別。
2017年,美國Synaptics公司推出了全新的多因素生物特征融合引擎,該引擎將傳統的指紋識別與面部識別技術融為一體,為移動設備提供更為安全的驗證方式。其主要應用價值如下。
首先,鑒于多數高校檔案館(室)不具備強大的開發實力和后期維護、升級的能力,因此使用第三方專業廠家提供的技術不失為一種明智之舉。引入多重生物特征融合引擎,即可有效彌補應用單一生物識別技術的缺陷,又可大大增強安防鑒驗功能。其次,應用多重融合引擎可讓用戶根據自己的偏好或環境因素,隨意選用任何一種生物認證方式。再次,當用戶使用敏感應用時,擁有多種生物驗證功能的多重生物特征融合引擎可確保更高的安全性。例如,Pure Print防欺騙算法的Quantum Matcher技術以及具有防欺騙功能的面部識別技術、指紋認證與安全面部生物特征技術,可無縫集成于“高校檔案云”服務平臺之中,使平臺具有更高的安全性。
語音識別技術于20世紀90年代末面世,隨著移動互聯網時代的到來其優勢日益明顯。其主要應用價值如下。
首先,將其直接嵌入檔案語音識別模塊,不僅可讓“高校檔案云”服務平臺擁有生動的對話接口來支持語音檢索,而且人機互動性強(凡需打字的地方,都可用語音來代替)。語音識別模塊具有不斷學習新的聲音和語調的功能,可提供對話式的“應答”,并能通過“用戶知識庫”來判斷和過濾搜尋的結果。如,檔案管理員可邊看檔案邊對著手里的麥克風說話,麥克風中的聲音不僅能夠實時轉化成文字,還能自動錄入檔案網絡系統的數據庫。其次,嵌入語音識別模塊的“高校檔案云”服務平臺借助隱藏其后的強大“后端”,包括人工神經網絡技術、深度神經網絡技術、網頁檢索技術、知識檢索技術、知識庫技術、問答以及推薦技術等,不僅能結合用戶提出的上下文結構進行智能研判,而且能在一定程度上理解用戶所發布的命令并直接做出反應,或者用自然語音進行檢索并獲得精準答案。再次,嵌入語音識別模塊的“高校檔案云”操作流程十分簡捷。如,用戶只需對著移動設備的麥克風說話,這些語音數據就會被“高校檔案云”的語音識別系統進行自動錄制、壓縮、解析,并即刻將最匹配的服務反饋給用戶。
應用這項技術需要注意三個問題:一是由于目前計算機技術還不能直接識別用戶說話發出的聲波,需要“語音到文本分析器”將其轉化為計算機可識別的二進制編碼、字符序列等,實現所謂的Speech-Text;二是由于“語法分析器”技術不夠成熟,需要通過“字符串”查找關鍵“短語”并建立簡單模型來理解用戶想要的目標;三是語音識別精準率不高,如在嘈雜環境中,引擎捕獲用戶語音并進行識別的時間較長、語音識別錯誤率較高。
首先,利用語音合成技術,高校檔案館(室)可將文本信息轉化成語音信息,“讓計算機像人一樣開口說話”。如,內置語音合成模塊的“高校檔案云”服務平臺可以實現“無人值守”,用戶撥打檔案服務熱線電話,系統可與其進行“對話”;用戶坐在檔案接待大廳,就可與系統的某臺智能服務器進行交流。其次,高校檔案館(室)通過不斷優化語音合成技術,可提供更優質的語音服務,使計算機智能合成的“說話”聲音更自然和有個性。
聲紋識別是根據說話人的發音生理和行為特征自動識別說話人身份的一種生物識別方法,它與語音識別的系統構成較為相似,都具有“特征提取”與“模式匹配”的功能,但是語音識別的技術核心在于從語音波形中提取反映語音特征的相關信息,目的是讓機器“聽懂”人說的話并能將其轉換成文本,因此需要關注“語言內容的精準性”;而聲紋識別則是要提取語音信號中說話人的聲紋特征,因此這項技術更注重“說話人聲音的基本特征”。聲紋識別在特征提取和模式匹配(模式識別)的過程中,最關鍵的是語音特征參數的求取。聲紋識別技術主要應用價值如下。
“高校檔案云”服務平臺設置聲紋識別模塊,首先通過提取說話人的語音信號,能自動認證用戶身份,大大提高系統運行的安全性。其次能便捷地獲取蘊含聲紋特征的語音,有助于提高使用者的接受度。再次可為用戶提供友好的個性化服務,如,為注冊用戶構建聲紋模型,利用從注冊語音中提取的聲紋特征序列,提高檢索服務的準確率。
目前聲紋識別技術的應用存在背景噪音、信道差異、語音過短等問題[3],尚待解決。
語音是人工智能時代人機交互最好最方便的形式[4],隨著語音識別、自然語言理解和語音合成等應用技術的成熟,能夠融合這些功能的語音交互技術也迅猛發展。其主要應用價值如下。
首先,應用語音助手可提升個性化服務能力。如,借助Bing、Cortana、Google Assistant、Deep Speech、DeepVoice等,不僅可讓用戶從多種信息來源中廣泛采集碎片化信息,而且能夠享受略讀和掃讀各類檔案信息的服務。其次,應用語音交互技術可增強文化休閑功能。如,Siri、Echo、DingDong等,都是可供“高校檔案云”服務平臺構建文化休閑功能的上乘產品和服務模式。高校檔案館(室)還需要通過建立一個新的循環,即數據—知識—用戶體驗—新的數據[5],尋找到合適的智能語音設備作為生態入口,改變傳統檔案“生態行業閉環”,提高檔案館(室)構建的多生態圈跨平臺語音交互服務水平。
本文為2016年度江蘇省檔案局科技項目“電子檔案“云災備”數據安全策略及其實現研究”(項目編號:2016-12)研究成果之一。
參考文獻:
[1]科技之巔2:《麻省理工科技評論》2017年10大全球突破性技術深度剖析[M].北京:人民郵電出版社,2017:156.
[2]中央電視臺大型紀錄片《互聯網時代》主創團隊.互聯網時代[M].北京:北京聯合出版公司,2015:163.
[3]郭浩婷.基于聲紋識別的應用難點研究[C].第十四屆全國青年通訊學術會議論文集.2009:169-171.
[4]喻彩華等.智能音箱大躍進[N].電腦報,2017-7-24:03.
[5]李彥宏:智能革命[M].北京:中信出版社,2017:67.