李亞楠,張雪鋒
西安郵電大學 通信與信息工程學院,西安 710061
隨著全球經濟和信息技術的飛速發展,信息安全逐漸被人們所關注,越來越多的領域需要進行身份認證。傳統的身份認證方法在性能與安全方面有一定的局限性,已經很難滿足認證系統的需求。指紋、掌紋、虹膜和人臉等這些人類所特有的生物特征開始被人們所研究,生物特征識別技術得到了良好的發展。然而在實際應用中,生物特征識別技術也暴露出了其固有的一些缺點,比如生物特征模板的丟失,虛假生物特征的攻擊等[1]。因此,基于生物特征模板的身份認證方法在安全性上有待進一步改進。
近年來,可撤銷的生物特征模板匹配技術取得了一定的成果[2-3]。可撤銷生物特征模板匹配技術的基本思路是對生物特征進行單向不可逆變換,在生物特征模板丟失的情況下,可以通過不同的變換或者秘鑰參數生成新的生物特征模板,從而有效地保護用戶的生物特征信息。生物特征可撤銷模板保護算法應滿足以下要求[4]:
(1)多樣性:同一個生物特征在不同的系統中可以生成不同的模板,并且各個模板之間,以及模板與原始生物特征之間不能相互匹配。
(2)可撤銷性:在生物特征模板丟失的情況下,可以通過采用不同的變換或者秘鑰參數,重新生成一個不同的模板。
(3)不可逆性:任何條件下均不能通過生物特征模板恢復出原始的生物特征信息。
(4)精確性:滿足以上三個條件的基于生物特征的身份認證性能能夠滿足信息系統對安全性、識別率等性能需求。
在眾多的生物特征中,掌紋因紋理信息豐富、識別精度高、用戶可接受性強等特性,已經引起了研究者們的廣泛關注[5]。針對基于掌紋的可撤銷模板生成技術的研究,目前已取得了一些成果。Ratha等[6]利用不可逆變換首次引入了可撤銷生物特征的概念。Goh等[7]提出了BioHashing算法,通過用戶令牌生成的輔助數據與生物特征進行融合生成可撤銷模板,在令牌安全的情況下取得了等錯誤率(Equal Error Rate,EER)為0的識別效果。Kong等[8]解釋了BioHashing中EER之所以能達到0的理想值是因為用戶令牌的隨機化,不同的令牌增大了用戶的類間距離。而且當令牌被盜時識別性能會有大幅的下降,甚至倒不如普通的生物認證方法有效。事實上,在令牌泄露且不進行閾值量化的情況下,BioHashing相當于隨機映射算法[9],很難達到理想的識別率。Teoh等[10]將BioHashing思想應用于掌紋的識別當中,提出了PalmHashing算法,但該算法同樣依賴于令牌的安全性,在令牌丟失后也很難達到很好的認證性能。Leng等[11]通過對Gabor濾波器參數隨機化處理生成了隨機Palm Code,但此方案與Palm Code[12]相比,在認證性能上并沒有很大的提高。隨后,Leng等[13]采用Gabor濾波器多方向分數級融合的思想提出了識別精度更高的Palm-Phasor算法,并對其進行了理論分析[14],但該算法的計算復雜度較高。文獻[15]將掌紋圖像投影到一個隨機矩陣中,使圖像的像素值發生不可逆變換,將投影后圖像的特征向量作為掌紋模板。雖然該算法有良好的認證性能,但是安全性依賴于隨機矩陣。文獻[16]提出一種適用于掌紋的可撤銷模糊金庫(Fuzzy Vault)算法,該算法實現了掌紋模糊金庫的可撤銷性,然而認證性能有待進一步改進。
針對現有掌紋可撤銷模板安全性與高效性很難同時實現的問題,本文提出一種基于安全概略(Secure Sketch)的可撤銷掌紋模板生成算法。首先對掌紋圖像進行Gabor濾波得到不同方向、不同尺度的幅值特征,通過主成分分析(Principal Component Analysis,PCA)算法對其進行降維,然后將加密后的特征向量與BCH碼異或融合,得到基于安全概略的可撤銷掌紋模板。理論分析和實驗結果表明,該算法具有良好的識別性能,能較好地滿足可撤銷性、多樣性和不可逆性,即便在單密鑰丟失的情況下,也具有較高的識別率。
安全概略[17]由一對算法

圖1 安全概略模型圖
定義1 一個(M,m,σ,ε,γ)的安全概略是一對隨機過程
(1)向量w作為概略算法SS的輸入,w∈M,輸出為向量s。
(2)w′和s作為恢復算法REC的輸入,w′∈M 。如果w′和w差值的漢明距離小于σ,則

(3)如果w′和w差值的漢明距離大于σ,則

對于任意的M上的分布W,如果W的最小熵大于m,安全概略滿足條件:

則稱此安全概略是L安全的。本文中所指的熵都是最小熵,而不是香農熵,如果安全概略由多項式時間的算法來實現,稱安全概略是有效的。
近年來,Gabor濾波器[18]已經廣泛應用于生物特征提取過程中。Gabor濾波器是一組帶通濾波器,調節不同的參數可以獲得圖像空間域、頻率域等結構信息。二維Gabor濾波器的定義為:

對于圖像F(x,y),其Gabor特征Gu,v(x,y)可通過圖像與Gabor濾波器卷積得到:

式中,?為卷積算子,本文的Gabor特征為圖像經Gabor濾波后的幅值部分,如圖2所示。

圖2 掌紋圖像的Gabor紋理特征提取
在掌紋特征提取過程中,高維的特征數據會導致識別過程復雜、識別時間長等問題,因此,基于PCA[19]算法的掌紋特征提取和識別得到了廣泛的運用。源于通信理論中K-L變換的PCA算法,其基本原理是將原有的高維特征數據線性變換,得到一組單位向量正交基,通過正交基的線性組合重構特征空間。經降維后的特征數據不僅保持了原有特征數據的有效信息,而且占用系統資源少,因此通過PCA對掌紋特征數據降維可以提高識別效率。
針對現有的多數可撤銷掌紋模板生成算法在密鑰或令牌泄露的情況下,攻擊者很容易冒充真實用戶進行身份認證的安全問題,本文提出一種可撤銷掌紋模板生成算法。首先對掌紋圖像進行Gabor濾波得到5個尺度、8個方向的幅值特征,并通過PCA算法對其進行降維;然后將加密后的特征向量與BCH碼異或融合,得到基于安全概略的可撤銷掌紋模板。與直接提取Gabor特征相比,采用PCA對Gabor濾波后的特征向量進行降維的方法,減小了光照、噪聲對識別性能的影響,提高了識別效率。同時引入BCH碼,實現了安全概略的構造,提高了算法的安全性,算法流程如圖3所示。

圖3 基于安全概略的可撤銷模板生成流程
算法的注冊階段步驟如下所示:
步驟1預處理
提取分辨率為128×128的掌紋圖像感興趣區域,并對圖像進行中值濾波降噪處理。
步驟2特征提取
(1)Gabor的核函數能夠很好地提取目標圖像的不同空間位置、頻率和方向上的特征,所以在本文算法中生成5個尺度v∈{0,1,2,3,4}和8個方向u∈{0,1,2,3,4,5,6,7}所對應的40個Gabor濾波器組,然后對預處理后的圖像進行濾波,每幅掌紋圖像分別得到40個幅值圖。
(2)經過Gabor濾波后得到的特征含有大量的冗余信息,嚴重影響識別效率。因此,對每個幅值圖分別進行PCA降維生成維數為40的特征向量,每個幅值圖特征串聯得到掌紋圖像的特征向量Γ∈Rm,m=1 600。
(3)由密鑰key1生成服從標準正態分布的偽隨機數(PN),由PN組成向量,其中
步驟3二值化
為了有效減小用戶特定密鑰泄露對認證性能的影響,本文采用錯位比較的非線性量化方法對特征向量進行不可逆變換,量化后產生維數為n的二值序列。其基本的思想是根據掌紋特征向量X,定義由該特征生成的二值序列Y=[y1,y2,…,yl] 為:

式中,p為步長參數,p∈{1 ,2,…,n-1},本文實驗中p取3。
步驟4重新洗牌
將二值序列Y從左向右每4位分塊,共128塊,本文中Y的維數為511,所以最后一塊的位數為3。生成128位的二進制密鑰key2,令key2的順序與特征塊依次對應,特征塊與密鑰位的1相對應依次左排,與密鑰位的0相對應依次右排,洗牌后的二值序列即為掌紋特征模板w。對提取的特征向量進行重新洗牌不僅增強了算法的安全性,而且提高了密鑰的多樣性與可重用性。
步驟5異或融合
生成一個隨機數(RN),對其進行BCH編碼得到碼字c,將c與w異或融合得到概略,實現安全概略的構造,提高算法的可容錯性。
算法的認證階段步驟如下所示:
步驟1采用與注冊階段相同的方法對掌紋圖形進行預處理。
步驟2對預處理后的掌紋圖像采用與注冊階段相同的用戶密鑰key1進行特征提取,其特征為向量X′。
步驟3將特征向量X′不可逆變換得到二值序列Y′。
步驟4對二值序列Y′采用與注冊階段相同的密鑰key2進行重新洗牌,得到w′。
步驟5 計算′,如果c′與c比特位不同的個數t小于BCH糾錯碼的糾錯個數t′,即t PalmHashing算法是一種重要的可撤銷掌紋模板生成算法,通過用戶令牌生成的輔助數據與掌紋特征做內積,然后選取一個固定閾值將結果二值化,得到二值序列,通過比較二值序列達到身份認證的目的,在令牌被盜后認證性能會有大幅下降。本文算法采用錯位比較的非線性量化方法對掌紋特征向量二值化,有效地消除掌紋特征向量間的大小關系;對二值序列進行分塊重新洗牌,避免了令牌被盜認證性大幅下降的情況,同時擴大了密鑰空間,提高了算法的可撤銷性與不可逆性;引入BCH碼,實現了安全概略的構造,提高了算法的可容錯性。 為評價所提出算法的性能,本文在Intel?CoreTMI3-6100,CPU@3.10GHz 4.00GB內存的PC,MatlabR2014a的開發環境下進行實驗仿真。采用的數據庫為標準掌紋庫IITD Palmprint V1.7z[20]。數據庫中包含有230個樣本,樣本分為左右手,每個樣本采樣6次,而且提供了樣本的感興趣區域標準數據庫,如圖4所示。 圖4 掌紋圖像示例 本次實驗選取100個樣本的前4幅圖像作為訓練樣本。在真匹配實驗中,每個樣本的第一幅圖像作為注冊掌紋,第二、三、四幅圖像作為查詢掌紋,共進行100×3=300次真匹配。在假匹配實驗中,每個樣本的第一幅圖像作為注冊掌紋,剩余樣本的第一幅圖像作為查詢掌紋,共進行次假匹配。評價掌紋識別性能的主要參數是誤識率(False Accept Rate,FAR)和誤拒率(False Reject Rate,FRR)。其中,FAR、FRR值越低可認為算法整體性能越高,所以本文用FAR、FRR來評價算法的有效性。 表1給出了密鑰泄露時本文算法的FAR、FRR,可以看出不同糾錯能力的BCH碼,算法的認證性能也不相同。在使用糾錯碼BCH(511,76,85)情況下,FAR、FRR的值為0,獲得了良好的認證性能,即使在單一密鑰泄露的情況下仍然具有較好的識別率。因此,本文重點分析使用糾錯碼BCH(511,76,85)情況下算法的可撤銷性、多樣性和安全性 表1 本文算法的認證性能 圖5給出了在使用糾錯碼BCH(511,76,85)情況下,本文算法在真假匹配過程中c′與c漢明距離的分布情況。可以看出密鑰安全時真匹配的漢明距離分布在0到0.18區間,假匹配的漢明距離分布在0.42到0.58區間,可以全區分不同用戶的掌紋,表明本文算法具有較好的識別性能。 圖5 本文算法的真假匹配情況 在攻擊者獲得多個概略s的情況下,攻擊者的目標是恢復生物的原始特征。在本文提出的算法中,采取雙密鑰對掌紋特征進行加密的方式,使不同的用戶可以通過不同的密鑰生成不同的模板,即便是同一用戶生成的模板也是隨機的。因此,本文通過定量分析的方法來驗證掌紋模板的可撤銷性和多樣性。具體方案是:選取100個樣本的第一幅圖像作為實驗掌紋,隨機生成100對密鑰,第一對密鑰生成注冊模板,其余的密鑰生成查詢模板,然后將注冊模板與查詢模板進行匹配(偽假匹配),共進行100×99=9 900次匹配。 圖6給出了使用糾錯碼BCH(511,76,85)情況下,本文算法在真假、偽假匹配過程中與c′與c漢明距離的分布情況。可以看出,真匹配的漢明距離分布在0到0.18區間,假匹配的漢明距離分布在0.42到0.58區間,偽假匹配的漢明距離分布在0.42到0.59區間,說明偽假匹配與假匹配高度相似。所以同一用戶可以通過不同的密鑰生成不同的模板,本文提出的算法滿足可撤銷性。 圖6 本文算法的真假匹配、偽假匹配分布情況 生物特征模板的多樣性要求不能通過模板間的交叉匹配騙過認證系統。給定兩個掌紋圖像F1、F2生成的概略分別是s1、s2,攻擊者的目的是猜測F1與F2是否來自同一個用戶。而s1與s2比特位不同的個數t′的大小取決于F1與F2的相似程度,如果t′小于BCH糾錯碼的糾錯個數t,即t′ 圖7(a)和圖7(b)分別給出了在使用糾錯碼BCH(511,76,85)情況下,密鑰key1、key2泄漏時 c′與 c漢明距離的分布情況。密鑰安全時真匹配的漢明距離分布在0到0.18區間,密鑰key1泄漏時假匹配的漢明距離分布在0.41到0.59區間,密鑰key2泄漏時假匹配的漢明距離分布在0.42到0.59區間,表明本文算法在單一的密鑰泄漏時仍然具有較好的識別性能。在密鑰key1、key2全泄漏的情況下,本文算法的識別性能會下降,但是在實際應用過程中可以通過獨立生成密鑰key1、key2的方式避免密鑰全部丟失的情況。例如,其中的一個密鑰可以由密碼輸入的方式來得到,另一密鑰則可以從硬件或軟件令牌中產生。 本文算法采用錯位比較的非線性量化方法對掌紋特征向量進行二值化,有效地消除掌紋特征向量間的大小關系。另外,本次實驗生成的掌紋模板長度為511位,當模板遭受到暴力攻擊時攻擊者需進行2511次嘗試,在計算上不可行。因此,系統具有較好的安全性。 圖7 密鑰泄漏時真假匹配分布情況 時實現的問題,提出一種基于安全概略的可撤銷掌紋模板生成算法。在特征加密過程中,采用錯位比較的非線性量化方法對掌紋特征向量進行二值化,有效地消除掌紋特征向量間的大小關系。同時引入BCH碼,實現了安全概略的構造,提高了算法的可容錯性。實驗結果表明,該算法具有良好的識別性能,能較好地滿足可撤銷性、多樣性和不可逆性,在單密鑰丟失的情況下也保持較高的識別率。需要指出的是單模態生物特征仍然存在一些安全缺陷,因此基于多模態生物特征的模板生成方法,把多種生物特征協同使用以提高特征模板的安全性,是下一步研究的問題。 針對現有掌紋可撤銷模板安全性與高效性很難同4 實驗仿真與性能分析

4.1 認證性能分析


4.2 可撤銷性分析

4.3 多樣性分析
4.4 安全性分析
5 結束語
