摘 要:針對人耳識別問題,提出一種二維主分量分析(2DPCA)的人耳識別方法,該方法不需要預先將圖像轉換為一維向量,而是基于圖像矩陣,直接計算圖像協方差矩陣的特征向量作為人耳特征提取,大大加快特征提取的速度,從根本上克服了傳統PCA在進行圖像特征提取時耗時過多的缺點。并通過BP神經網絡進行分類識別。實驗結果表明,應用2DPCA方法提取人耳圖像特征,可以大大提高識別效果。
關鍵詞:人耳識別;主分量分析;二維主分量分析;BP神經網絡
中圖分類號:O235,TP391文獻標識碼:B文章編號:1004373X(2008)2015102
A New Kind of Ear Recognition Based on 2DPCA
CHEN Chunlan,ZENG Huanglin
(Sichuan University of Scicnce Engineering,Zigong,643000,China)
Abstract:Based on ear recognition,2DPCA method is given.This method doesn′t need transform image into ID vector,but image-based matrix,which computs the image covariance matrix directly for image feature extraction,it overcomes time-consuming of traditional PCA in image feature extraction.BP network is used for classification.Simulation shows that using 2DPCA to extract ear image feature can achieve satisfactory results.
Keywords:ear recognition;PCA;2-dimensional PCA(2DPCA);BP network
隨著科技的發展、社會的進步,身份驗證的要求也日益迫切,包括指紋識別、人臉識別、虹膜識別等。人臉識別已經取得了可喜的研究成果,但在實際應用中存在很多的困難:人臉是非剛體,存在表情變化會對人臉識別造成影響。
人耳特征與其他的生物特征一樣是每個人與生俱來的,為人的內在屬性,具有較高的穩定性及個體差異性。而人耳特征與其他生物特征不同的是,他具有普遍性、可采集性和不可偽造性等特點。人耳有著可靠、穩定和豐富的生理特征,并且人耳作為一種生物特征,具有獨特的優點:人耳不受表情、化妝的影響;不易受傷,不受耳環、眼鏡架等的影響;比人臉具有更一致的顏色分布;人耳表面更小,信息存儲和處理量更少[1,2]。人耳識別作為一種新的人體特征識別技術正引起人們的關注。
目前人耳識別提取的特征主要分為2類:一類是基于幾何特征的方法[2],這種方法通過尋找人耳輪廓和內部結構上的關鍵點,形成幾何特征;另一類是基于代數特征的方法,如主元分析法[3]。
主元分析法(PCA)在處理圖像識別問題時是基于向量的,且沒有充分利用訓練樣本的類別信息。本文提出了一種直接基于圖像矩陣的2DPCA方法,與傳統的PCA相比,不需要預先將圖像轉換為一維向量,其是基于圖像矩陣,直接計算圖像協方差矩陣的特征向量,最突出的優點是加快了特征提取的速度,提高了人耳的識別率。
1 二維主分量分析(2DPCA)
考慮一個大小為m×n的圖像A,令投影矩陣X∈Rn×d(n≥d),將圖像矩陣A投影到X,將產生一個m×d的矩陣Y=AX。在2DPCA方法中,用投影后向量的總離散度作為準則函數J(X)來衡量投影矩陣X的優劣:
J(X)=trace{E[(Y-EY)(Y-EY)T]}
=trace{E[(AX-E(AX))(AX-E(AX))T]}(1)
=trace{XTE[(A-EA)T(A-EA)]X}
定義圖像協方差矩陣:
G=E[(A-EA)T(A-EA)]
G是一個n×n的非負正定矩陣。假設有M幅m×n的測試樣本人耳圖像Ak(k=1,2,…,M),其平均圖像矩陣為=1M∑Mk=1Ak,則G可以被估計為:
G=1M∑Mk=1(Ak-)T(Ak-)(2)
所以式(1)可以寫成:
J(X)=tr(XTGX)
可以證明,準則函數J(X)最大的X中每列向量是由協方差矩陣G的r個非零特征值對應的前面最大的d個特征向量組成:
X=(X1,X2,…,Xd)=arg max[J(X)]
滿足XTiXj =0,i≠j;i,j=1,2,…,d。在獲得投影矩陣X=(X1,X2,…,Xd)后,可以對人耳圖像進行特征提取和分類,給定一幅人耳圖像A,令:
Yk=AXkk=1,2,…,d
于是可以得到一組投影后的特征向量Y1,Y2,…,Yd,稱作樣本A的特征矩陣。與傳統PCA方法不同,在2DPCA方法中,不需要預先將圖像轉換為一維向量,是基于圖像矩陣,直接計算圖像協方差矩陣的特征向量方法。
2 基于2DPCA和BP神經網絡的人耳識別
2.1 BP網絡結構的設計
人工神經網絡具有并行處理和大規模平行計算能力,能高度地逼近非線性系統并對不確定問題具有自適應能力,而BP網絡是目前實際應用中使用最為廣泛的網絡模型,但是由于該網絡容易陷入局部極小點,收斂速度慢,所設計的網絡泛化能力不能保證等缺點。本文采用改進的三層結構網絡來實現2DPCA特征提取后的人耳分類。輸入由提取的特征數來決定,隱層為28個神經元,輸出采用n取1的方法,為了提高算法的收斂速度,采用動量法和學習速率自適應調整的方法[4],降低了網絡對于誤差曲面局部細節的敏感性,有效地抑制了網絡陷入局部極,提高了算法的收斂性和可靠性。
2.2 實驗方法和結果
2DPCA和BP網絡人耳識別算法結構,如圖1所示。
圖1 2DPCA人耳識別算法結構框圖
在實驗中采用Carreira-Perpinan建立的人耳庫[5],該圖像庫包括17人,每人6幅,共102幅人耳圖像,每幅圖像為64×40大小。部分人耳圖像如圖2所示。
在人耳圖像庫中,取每人的前3組人耳圖像作為訓練樣本,共51幅;取每人的后3組作為測試樣本,共51幅。分別采用2DPCA方法和PCA方法進行特征提取,三層BP網絡進行分類識別,在Matlab 7.0環境下進行,結果見表1。
表1 實驗結果
人耳圖像庫特征數
訓練時間/s識別率
2DPCAPCA2DPCAPCA
Carreira-Perpinan 1330.35372.5100%100%
圖像庫1739.735213.8100%100%
2650.52101.56100%100%
圖2 部分人耳圖像
該實驗結果表明,在相同的人耳庫上,基于2DPCA方法的和PCA方法雖然識別率相同,但是2DPCA加速了圖像的特征提取。這是因為每幅64×40大小的圖像,用傳統的PCA方法,需要處理64×40=2 560階的矩陣,盡管用奇異值分解定理可以加速特征提取的速度,但是計算量仍然很大,而利用2DPCA方法,只需要處理40階的矩陣即可。
3 結 語
本文提出一種2DPCA方法用于人耳識別,該方法直接基于圖像矩陣。他的突出優點是大大加快了特征提取的速度,從根本上克服傳統PCA在進行圖像特征提取時耗時過多的缺點。
參考文獻
[1]Hanna-Kaisa Lammi.Ear Biometrics[EB/OL]http://www.it.lut.fi/kurssit/03-04/010970000/seminars/Lammi.pdf.
[2]Burge M J,Burger W.Using Ear Biometrics for Passive Identification [A].Proceedings of 14th,International Information Security Conference [C].Vienna,Austria:Kluwer Academic,1998:139-148.
[3]張海軍,穆志純,張克君,等.基于主元分析的人耳圖像識別方法\\.北京工商大學學報,2005,23(6):28-30.
[4]魏海坤.神經網絡結構設計的理論與方法\\.北京:國防工業出版社,2005.
[5]Carreira-Perpinan M A.Compression Neural Networks for Feature Extraction:Application to Human Recognition from Ear Images [D].Spain:Technical University of Madrid,1995.
[6]Wang Liwei.Is Two-dimensional PCA a New Technique.Act Automatica Sinica,2005,5(31):782-787.
[7]Yang J,Yang J Y.From Image Vector to Matrix:A Straight Forward Image Projection Technique-IMPCA.vs.PCA[J].Pattern Recognition,2002,35(9):1 997-1 999.
[8]張海軍,穆志純,危克.人耳識別技術研究進展綜述[J].計算機工程與應用,2004(33):5-9.
[9]祝振宇.基于主成分分析的人耳識別系統研究[J].科技廣場,2007(7):33-36.
[10]王秀琴,趙金憲,王忠禮.人耳識別的應用研究與實現[J].黑龍江科技學院學報,2004,14(4):241-244.
作者簡介 陳春蘭 女,1983年出生,碩士研究生。主要研究方向為人工神經網絡、模式識別。
曾黃麟 男,1955年出生,博士,教授。主要研究方向為粗集理論、神經網絡、智能信息處理等。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文