陳春蘭 許立志
摘 要:分析Zernike矩人耳特征提取和非負矩陣分解(NMF)人耳特征提取的利弊。將線性判別分析的思想融入到NMF算法中,對傳統的NMF方法進行改進。介紹一種融合特征人耳識別方法:將Zernike矩和傳統非負矩陣分解融合提取人耳特征,得到一個分類能力更強的人耳特征矩陣,并采用BP神經網絡進行分類識別,實驗結果表明,應用融合特征方法提取人耳圖像特征,可以提高識別效果。
關鍵詞:人耳識別;特征融合;Zernike矩;BP神經網絡;非負矩陣分解
中圖分類號:TP391
隨著科技的發展,社會的進步,身份驗證的要求也日益迫切,包括指紋識別、人臉識別、虹膜識別等。人臉識別已經取得了可喜的研究成果,但在實際應用中存在很多的困難:人臉是非剛體,存在表情變化會對人臉識別造成影響。
[JP2]人耳特征與其他的生物特征一樣是每個人與生俱來的,為人的內在屬性,具有較高的穩定性及個體差異性。而人耳特征與其他生物特征不同的是,他具有普遍性、可采集性和不可偽造性等特點。人耳有著可靠、穩定和豐富的生理特征,并且人耳作為一種生物特征,具有獨特的優點:人耳不受表情、化妝的影響;不易受傷,不受耳環、眼鏡架等的影響;比人臉具有更一致的顏色分布;人耳表面更小,信息存儲和處理量更少[1,2]。人耳識別作為一種新的人體特征識別技術正引起人們的關注。[JP]
Zernike矩方法提取具有旋轉不變性的人耳幾何特征,具有穩定性強,有利于分類識別,但是當人耳圖像受到其他因素如光照的影響時,這種識別率就會降低。改進的非負矩陣分解是將線性判別融入到傳統的非負矩陣分解方法中,通過最大化樣本類間差異,最小化樣本類內差異,提取具有判別能力的低維人耳特征。在此將這兩種具有互補性的特征串行融合,得到一個分類能力更強的特征。
1 Zernike矩方法特征提取
Zernike矩是一種正交復數矩,它利用的正交集是一個在單位圓內的正交集
設二維離散圖像函數用f(x,y)表示,n+mЫ譠ernike不變矩表示為:
實質上,它是一種映射,將圖像函數變換到一組正交基函數上。圖像f(x,y)的玓ernike矩是該圖像在一組正交多項式V﹏m(x,y)上的投影。所謂的正交是指V﹏m(x,y)在單位圓內x2+y2≤1滿足下列條件:
離散形式為:
由于Zermike矩的定義中引入了完全正交基的基函數集,取代了原點矩定義中的非正交基函數集,因此在理論上Zermike矩比原點矩具有更好的數學性質[3,4]。
對人耳圖像進行大小調整后,求取Zermike矩的幅值作為特征,具有穩定性強,有利于分類識別。但是當人耳圖像受到其他因素,如光照的影響時,這種識別能力就會大大降低。對Carreira[CD*2]Perpinan建立的人耳圖像庫進行人耳Zernike矩特征提取:
(1) 讀入人耳圖像,將圖像坐標原點移至圖像中心;
(2) 將圖像像素的坐標映射到單位圓內,落于單位圓外的像素不予考慮;
(3) 調用zernlpol函數,計算Zernike矩值;
(4) 根據步驟(3)提取人耳特征。
其中,玭的變化計算出圖像不同階的Zernike矩,在玭確定的情況下,玬的變化計算出玬階的各個Zernike矩值。本實驗中取玭=6,不考慮玬<0的情況。這些矩值可以看成是具體圖像的Zernike矩特征,把計算出的Zernike矩的各階矩值按玭遞增的次序并且在玭確定的情況下按玬遞增的次序排列:Z=(z1,z2,…,z璱,…)。求取Zernike矩幅值作為特征,得到一個15維的人耳矩特征向量。
2 改進的NMF特征提取
2.1 改進的NMF方法
利用傳統的方法可以得到好的識別效果,但是當圖像受外在因素的影響時,NMF的識別率會降低。線性判別分析是一種常用的子空間分析方法,通過最大化樣本類間差異,最小化樣本類內差異,提取最具有判別能力的低維特征,對光照等都不太敏感。本文介紹了一種改進的NNF算法:將線性判別分析的思想融入到NMF算法中,對NMF進行改進。根據NMF算法計算基圖像;將原始的人耳圖像向NMF基圖像做投影,在投影子空間上進行線性判別分析[5]。
設矩陣[WTHX]V[WTBX]是由n幅人耳圖像V1,V1,…,V璶構成的訓練集,對其進行玁MF分解,得到由r個基圖像構成的子空間[WTHX]W[WTBX]=[W1,W2,…,W璻]。為了提高分類精度,從﹔個Щ圖像中選擇主要反映類間差異的基圖像來構造新的子空間:
令c為所有樣本可分的類數;c璳為屬于第k類的樣本數;[WTHX]μ[WTBX]璳為第k類樣本的平均向量;[WTHX]μ[WTBX]為所有樣本的平均向量;[WTHX][WTBX]璚為第i個基圖像的一維投影子空間所對應的類內散布矩陣;[WTHX][WTBX]瑽為第i個基圖像的一維投影子空間所對應的類間散布矩陣。式(6)中的玍ar﹊nter([WTHX]W[WTBX]璱)為第i個基圖像[WTHX]W[WTBX]璱所代表的類間差異:
根據式(8)進行基圖像選擇時,保留了主要反映類間差異的基圖像來構造子空間,從而能夠壓制圖像之間的與識別信息無關的差異,能夠得到具有判別力的局部特征。
改進的NMF特征提取的算法如下:
(1) 對矩陣玔WTHX]V[WTBX]進行NMF分解,得到玶個基圖像。
(2) 根據式(7)和式(8)計算Var﹊nter([WTHX]W[WTBX]璱)和¬ar﹊ntra([WTHX]W[WTBX]璱);
(3) 根據式(6)從玶個基圖像中選取玴個主要反映類間差異的基圖像來構造子空間[WTHX]W[WTBZ];
(4) 將測試圖像向子空間[WTHX]W[WTBZ]投影進行特征提取。
2.2 改進的NMF方法進行人耳特征提取
改進的NMF算法對人耳進行特征提取:
(1) 隨機初始化非負矩陣矩陣[WTHX]W[WTBX],[WTHX]H[WTBX];
(2) 更新[WTHX]W[WTBX]和[WTHX]H[WTBX]直到收斂:
(3) 計算人耳子空間玶個基向量:
(4) 根據式(7)和式(8)計算
(5) 根據式(6)從計算r個基圖像選取p個主要反應類間差異的基圖像來構造子空間[WTHX]W[WTBX];
(6) 將測試圖像向子空間[WTHX]W[WTBX]ё鐾隊,計算人耳特征。
訓練圖像和訓練子集如圖1,圖2所示。從表1可以看出,當訓練和測試人耳圖像的角度差別不大時(子集2),這兩種方法均取得了較高的識別率,都達到80%以上;當訓練圖像和測試圖像的角度差別較大時(子┘1),識別率最高的是改進的NMF算法,雖然這兩種方法的識別率都有降低,可是改進的NMF算法降低4.8%,傳統NMF降低30%。改進的NMF對角度的改變有較好的魯棒性。
3 實驗結果
實驗采用了Carreira[CD*2]Perpinan建立的人耳圖像庫(如圖3所示的部分人耳圖像),該圖像包括17人,每人6幅,共102幅人耳圖像,由于該人耳圖像庫中的所有圖像已經經過剪裁和旋轉,長寬比例為1∶6(這是由人耳的結構特點決定的,人耳長寬比例均值大致在1∶6附近),[LL]并進行了亮化處理,因此圖像較理想,在此不在進行圖像的預處理。該實驗在Matlab 7.1環境下進行。
將Zernike矩提取具有旋轉不變性的人耳幾何特征和改進的非負矩陣分解提取具有判別能力的低維人耳特征串性融合,得到一個分類能力更強的特征。采用BP神經網絡分類器進行分類,結果如表2所示。實驗結果表明利用融合特征方法可以提高人耳識別率。[HJ1][HJ]
4 結 語
本文介紹了一種融合特征方法用于人耳識別,該方法結合Zernike矩和NMF的優缺點,得到一個分類能力更強的人耳特征,提高了分類識別率。
參 考 文 獻
[JP2][1]Hanna[CD*2]Kaisa Lammi.Ear Biometrics[EB/OL].http://www.it.lut.fi/kurssit/03[CD*2]04/010970000/seminars/Lammi.pdf.
[2]Burge M J,Burger W.Using Ear Biometrics for Passive ㊣dentification猍A].Proceedings of 14th,International Information Security Conference[C].Vienna,Austria:Kluwer Academic,1998:139[CD*2]148.[JP]
[3]Khotanzad A,Yaw HH.Invariant Image by Zernike Moments[J].IEEE Trans.on PAMI,1990,12(5):489[CD*2]497.
[4]劉茂福,胡慧君,何炎祥.主成分分析在圖像Zernike矩特征降維中的應用[J].計算機應用,2007,27(3):696[CD*2]700.
[5]張志偉,夏克文,楊帆,等.一種改進NMF算法及其在人臉識別中的應用[J].光電工程,2007,34(8):121[CD*2]126.
[6]魏海坤.神經網絡結構設計的理論與方法[M].北京:國防工業出版社,2005.
[7]曾黃麟.智能計算[M].重慶:重慶大學出版社,2004.
[8][JP2]Paatero P,Tapper U.Positive Matrix Factorization:A Non[CD*2]negative Factor Model with Optimal Utilization of Error Estimates of Data Values[J].Environmetrics,1994(5):111[CD*2]126.[JP]
[9]Lee D D,Seung H S.Learning the Parts of Objects by Non[CD*2]negative Matrix Factorization[J].Nature,1999,401(6 755):788[CD*2]791.
[10]張兆禮,趙春暉,梅曉丹.現代圖像處理技術及Matlab實現[M].北京:人民郵電出版社,2001.
[11]張偉偉,夏利民.基于多特征融合和Bagging神經網絡的人耳識別[J].計算機應用,207,26(8):1 870[CD*2]1 872.[HJ0][HJ]
作者簡介
陳春蘭 女,1983年出生,碩士研究生。主要研究方向為人工神經網絡、模式識別。
許立志 男,1980年出生,碩士研究生。主要研究方向為粗集理論、智能信息處理。[LM]
科學計算與信息處理趙 杰等:基于神經網絡的兩種巖性識別方法的研究