北方工業(yè)大學(xué)信息學(xué)院 楊麗紅 尚澤昊
區(qū)塊鏈作為一個分布式數(shù)據(jù)賬本,具有去中心化、非實名化、不可篡改、全網(wǎng)一致的特點,這使區(qū)塊鏈適合身份認證的場景,以避免因中心服務(wù)器遭受攻擊或權(quán)限管理不當而造成的大規(guī)模數(shù)據(jù)丟失或泄露。模糊提取器可解決生物特征模板泄露導(dǎo)致永久不可用的問題。本課題針對身份認證安全問題,提出一種基于區(qū)塊鏈和模糊提取的多特征融合身份認證模型,并通過模擬實驗和安全性分析證明了該模型的安全性。
生物特征識別方案在全世界范圍已有廣泛應(yīng)用,其在識別和匹配過程中需要傳遞生物特征模板,生物特征模板在開放網(wǎng)絡(luò)上的直接傳輸很容易受到攻擊,帶來了數(shù)據(jù)安全與隱私保護問題。為了解決這個問題,眾多研究者聚焦于生物特征模板的保護工作,主要包含基于特征變換的方法和基于加密的方法。區(qū)塊鏈的關(guān)鍵技術(shù)整合了分布式存儲、現(xiàn)代密碼學(xué)、點對點網(wǎng)絡(luò)、共識機制和智能合約。將區(qū)塊鏈技術(shù)應(yīng)用于身份認證場景能解決身份認證方式存在的安全問題。然而,當下基于區(qū)塊鏈的身份認證主要將生物特征模板以明文方式存儲在區(qū)塊當中,對隱私構(gòu)成威脅。基于此,本文使用模糊提取器加密生物特征模板,再存儲于區(qū)塊鏈,提高身份認證模型的安全性。
肖珂等通過卷積神經(jīng)網(wǎng)絡(luò)提取人臉和虹膜特征、參數(shù)化t-SNE算法特征降維和支持向量機分類組合進行融合識別,使得魯棒性和識別性能得到提升。呂婧淑等詳細闡述了身份認證和區(qū)塊鏈的發(fā)展歷史和原理,針對傳統(tǒng)身份認證存在的安全問題提出了基于區(qū)塊鏈的人臉識別與口令雙因子認證框架,該模型在安全性、準確率、效率上都得到了較好的驗證,但將人臉特征值以明文形式存儲在區(qū)塊鏈上,存在著用戶隱私泄露的風險。M.Mahe-sh Kumar等提出了第一個使用區(qū)塊鏈的多實例虹膜身份認證方法,其采用的同態(tài)加密保證了虹膜模板的隱私性,其存儲、計算成本較高。Renau-d Brien提出一種改進的模糊提取器,用于人臉識別,在不影響準確率的情況下提高了人臉特征模板的安全性。
本文提出的身份認證模型如圖1所示,用戶發(fā)起注冊請求時,服務(wù)節(jié)點返回服務(wù)和公鑰;用戶發(fā)起驗證請求時,服務(wù)節(jié)點返回服務(wù)和新公鑰。模糊提取器接收客戶端輸入的生物特征圖像,進行訓(xùn)練后輸出該用戶的生物特征密鑰R和輔助數(shù)據(jù)P,并返回給客戶端。區(qū)塊鏈基于聯(lián)盟鏈,每個服務(wù)節(jié)點都是區(qū)塊鏈的聯(lián)盟節(jié)點。

圖1 基于區(qū)塊鏈和模糊提取的多特征融合身份認證模型Fig.1 Multi-feature fusion identity authentication model based on blockchain and fuzzy extractor
特征提取模塊由基于VGG16的CNN構(gòu)成,對單幅人臉和虹膜圖像,首先將其歸一化為160×160的圖像。然后通過若干卷積層和池化層進行降采樣提取特征,其中卷積層采用ReLU激活函數(shù),池化層采用最大池化,將提取到的特征進行串聯(lián)融合并采用參數(shù)化t-SNE算法降維。
采用模糊提取技術(shù)保護生物特征模板。以一種容錯的方式輸出一個隨機的字符串R。當輸入的生物特征B'和B相差不大時,模糊提取器輸出的隨機字符串R不發(fā)生改變。基于模糊提取器的身份認證包含設(shè)置、注冊與驗證三個階段,如圖2、圖3所示,設(shè)置階段輸入許多用戶的生物特征以生成全局碼本,用戶注冊時輸入生物圖像,由卷積神經(jīng)網(wǎng)絡(luò)提取生物特征并進行降維之后,計算其生物特征的中值向量作為該用戶的隨機密鑰,輔助數(shù)據(jù)的數(shù)值由量化后的密鑰與密鑰的差值所表示。用戶驗證身份時,輸入生物圖像并經(jīng)過CNN特征提取模塊,借助輔助數(shù)據(jù)生成密鑰,判斷密鑰是否與數(shù)據(jù)庫一致,對身份認證結(jié)果做出判斷。

圖 2密鑰生成過程Fig.2 Key generation process

圖3 密鑰驗證過程Fig.3 Key verification process
通過模擬實驗,本文驗證了方案的可行性,模糊提取器是基Python編寫的,數(shù)據(jù)集為CASIA Iris Distance。模糊提取器的正確性如圖4所示,驗證時用戶提供的生物特征與注冊時樣本相似,則提取到的隨機密鑰R一致。

圖4 模糊提取器的正確性Fig.4 Correctness of fuzzy extractor
在該聯(lián)盟鏈中,非聯(lián)盟節(jié)點無法獲得用戶隱私信息,即使非法攻擊者進入了區(qū)塊鏈,獲得了加密的R值SignInfo,也無法反向推算出密鑰,無法獲得更多用戶數(shù)據(jù)。R以密文形式存儲在區(qū)塊鏈上,其安全性由哈希二叉樹Merkel樹所保證。如圖5所示,若攻擊者想計算出R:(1)要找到非對稱加密的公鑰將SignInfo解密為Ha-shRInfo1234;(2)將HashRInfo1234拆解為HashRInfo12和HashRInfo34;(3)將HashRInfo12拆解為HashRInfo1和HashRInfo2;(4)將HashRInfo34拆解為HashRInfo3和HashRInfo4;(5)還需破解HashRInfo1、HashRInfo2、HashRInfo3、HashRInfo這4個單項信息。基于哈希加密算法不可逆的特點,攻擊者只能通過暴力破解等遍歷的手段嘗試解密,難度巨大,模型的安全性得到驗證。

圖5 Merkel數(shù)結(jié)構(gòu)Fig.5 Merkel structure
本文針對身份認證存在的安全問題,提出了一種基于區(qū)塊鏈和模糊提取器的多特征融合身份認證模型,與中心化的身份驗證方式相比,本模型采用區(qū)塊鏈對用戶數(shù)據(jù)進行存儲與驗證,去中心化保證了用戶數(shù)據(jù)的安全性,與現(xiàn)有的區(qū)塊鏈單因子身份認證方式相比本模型采用了多特征融合的身份認證方式,且將生物特征模板加密存儲,提高了身份認證模型的安全性能。經(jīng)實驗?zāi)M與安全性分析,本模型的安全性得到了驗證。