(1. 北京科技大學(xué) 信息工程學(xué)院, 北京 100083; 2.河北經(jīng)貿(mào)大學(xué) 計(jì)算機(jī)中心, 石家莊 050061)
摘 要:提出了一種新的快速對人耳圖像進(jìn)行特征提取的方法,先對人耳圖像進(jìn)行二維的離散小波分解,然后使用正交質(zhì)心算法對小波分解后得到的低頻信息進(jìn)行降維,進(jìn)而獲得圖像的特征向量。實(shí)驗(yàn)證明,該方法與模式識別領(lǐng)域中廣泛應(yīng)用的Fisherfaces方法相比,在識別率大體相當(dāng)?shù)那疤嵯拢哂杏?jì)算量小、降維速度快的優(yōu)點(diǎn),是對人耳圖像進(jìn)行特征提取的一種有效手段。
關(guān)鍵詞:人耳識別; 小波變換; Haar小波; 正交質(zhì)心算法
中圖分類號:TP391.4 文獻(xiàn)標(biāo)志碼:A
文章編號:10013695(2009)03114803
Ear recognition based on wavelet transform and orthogonal centroids algorithm
ZHAO Hailong1, MU Zhichun1, ZHANG Xia1,2
(1. School of Information Engineering, University of Science Technology Beijing, Beijing 100083, China; 2.Computer Center, Hebei University of Economics Business, Shijiazhuang 050061, China)
Abstract:This paper proposed a quick new vectors construction method for ear retrieval based on wavelet transform and orthogonal centroids algorithm. It also compared the new method to the famous PCALDA method. The experimental results on USTB79 ear database show that the proposed method can get approximately equal retrieval accuracy to PCALDA method, but it performs much better in speed than the latter.
Key words:ear recognition; wavelet transform; Haar wavelet; orthogonal centroids algorithm
0 引言
隨著社會的發(fā)展,對身份驗(yàn)證的需求也日益增加,如電子商務(wù)、網(wǎng)上銀行、公共安全等領(lǐng)域都在不斷地對身份驗(yàn)證提出新的要求和挑戰(zhàn)。生物特征是人的內(nèi)在屬性,具有較強(qiáng)的自身穩(wěn)定性和個體差異性,可以作為身份認(rèn)證較好的依據(jù)。人耳作為人的生物特征之一,除了具備普遍性、惟一性、穩(wěn)定性、可接受性和防偽性等特點(diǎn)[1]之外,與人臉等其他生物特征識別技術(shù)相比,還具有不易受表情和化妝影響、不易損傷以及圖像顏色分配一致等獨(dú)特優(yōu)勢。因此人耳識別技術(shù)近年來已成為計(jì)算機(jī)視覺和模式識別領(lǐng)域中的一個前沿課題。
一個完整的人耳識別系統(tǒng)應(yīng)該包括以下幾個過程:人耳圖像采集(信息獲取)、圖像預(yù)處理、特征提取與選擇、分類器設(shè)計(jì)以及分類決策[2]。其中特征提取是解決問題的一個關(guān)鍵,其結(jié)果將直接影響到最終分類的正確率和識別速度。在模式識別領(lǐng)域中,常見的特征提取方法有基于幾何特征的方法、子空間分析和基于頻域變換的方法。
基于幾何特征方法的基本思想是把生物特征的構(gòu)成部件及它們之間結(jié)構(gòu)關(guān)系的集合描述作為識別的特征,具體到人耳就是首先定位耳垂、對耳輪、耳屏等特征點(diǎn),然后計(jì)算這些特征點(diǎn)的相對位置和距離用其作為人耳特征的度量。子空間方法的基本思想是通過最優(yōu)化一個準(zhǔn)則函數(shù)得到一個投影矩陣,將高維的原始樣本圖像投影到一個低維的子空間,使低維子空間中的樣本圖像特征更加緊湊、有更好的可分性;子空間分析也是模式識別領(lǐng)域目前應(yīng)用最廣泛的特征提取方法。M.Turk等人[3,4]提出的基于主成分分析(principal component analysis,PCA)的特征臉,P.N Belhumeur等人[5]提出的先利用PCA對原始圖像降維,再進(jìn)行通常的Fisher線性鑒別的Fisherfaces(即PCA+LDA)以及獨(dú)立成分分析(independent componentanalysis,ICA)的方法都屬于子空間分析的范疇。隨著模式識別中特征提取理論的不斷發(fā)展,基于頻域變換的方法也被引入進(jìn)來,同時頻域變換的方法與傳統(tǒng)特征提取理論相結(jié)合的方法也得到了廣泛的應(yīng)用。常見的頻域變換方法有傅里葉變換、小波變換、離散余弦變換等。
針對人耳圖像自身的特點(diǎn)并通過對現(xiàn)有方法的研究,筆者將基于頻域變換的方法和子空間分析方法相結(jié)合,提出了一種首先對原始人耳樣本圖像施行二維離散小波變換;然后再利用正交質(zhì)心算法對小波變換的低頻系數(shù)進(jìn)行特征提取;最后使用最近鄰法分類的人耳識別新方法。
1 小波變換和Haar小波
1.1 小波變換
小波變換是20世紀(jì)80年代中期發(fā)展起來的一種時頻分析方法,逐漸在數(shù)學(xué)上形成了一個新的分支,被廣泛用于信號處理、圖像壓縮、模式識別、量子物理以及眾多非線性領(lǐng)域。小波分析在時域和頻域都具有良好的局部化特性,被譽(yù)為“數(shù)學(xué)顯微鏡”。
小波變換的含義[7]:將一個稱為基本小波的函數(shù)ψ(t)作位移τ后,再在不同尺度a下與待分析信號x(t)作內(nèi)積:
WTx(a,τ)=1/a+∞-∞x(t)ψ*[(t-τ)/a]dt(1)
等效的頻域表示是
WTx(a,τ)=a/(2π)+∞-∞X(ω)ψ*(aω)ejωτdω(2)
其中:X(ω)、ψ(ω)分別是x(t)、ψ(t)的傅里葉變換;a和τ分別為伸縮因子和平移因子。
根據(jù)信號x(t)的連續(xù)性,小波變換可以分為連續(xù)小波變換(continuous wavelet transform,CWT)和離散小波變換(discrete wavelet transform,DWT)。對于離散小波變換,其尺度和平移參數(shù)a和τ也必須是離散的。
小波變換由一維推廣到二維,根據(jù)構(gòu)造的方式可分為兩種類型,即多尺度分析方式(multiresolution analysis)和張量積(tensor product)方式。
1.2 Haar小波變換
Haar小波是小波分析發(fā)展過程中用得最早的小波,也是最簡單的小波,Haar小波本身是一個階躍函數(shù),可以用解析的方法表示成如下形式:
ψ(x)=1 當(dāng)0≤x<1/2-1當(dāng)1/2≤x<1 0其他(3)
Haar小波尺度函數(shù)ψij(x)可定義為
ψij(x)=ψ(2jx-i),i=0,…,(2j-1)(4)
Haar小波在時域上是不連續(xù)的,但其用于圖像分解與重構(gòu)時具有速度快、重構(gòu)圖像壓縮比高、對圖像容易進(jìn)行各種分析處理等優(yōu)點(diǎn),因此在對人耳圖像進(jìn)行二維離散小波分解時選用Haar小波作為基函數(shù)。
原始圖像經(jīng)小波分解后可得到一系列不同分辨率的子圖像,不同分辨率的子圖像對應(yīng)的頻率是不同的。高分辨率(即高頻)圖像上的大部分點(diǎn)的數(shù)值都接近于0,越是高頻這種現(xiàn)象越明顯。對一個圖像來說,表現(xiàn)圖像最主要的是低頻部分,因此為了壓縮圖像實(shí)現(xiàn)降維的目的,可以去掉圖像的高頻部分而只保留圖像的低頻部分。如圖1所示,(a)為原始圖像;(b)為原始圖像經(jīng)過二維離散小波分解后的低頻和高頻信息;(c)為利用一層小波分解的低頻系數(shù)重構(gòu)得到的圖像;(d)為利用二層小波分解的低頻系數(shù)重構(gòu)得到的圖像。需要說明的是,為了看起來更加簡潔直觀,這里筆者把它們調(diào)整到統(tǒng)一的大小。
2 正交質(zhì)心算法
對于給定的一組樣本向量組成的矩陣A=[a1,…,an]∈m×n。其中:ai∈m×1{i=1,…,n},樣本的個數(shù)為n。正交質(zhì)心算法的目標(biāo)是要由A找到一個最優(yōu)變換矩陣GT,通過GT可以把任意向量x映射到向量x^ (l<m):
GT:x∈m×1→x^∈l×1 i.e GTx=x^(5)
這里的“最優(yōu)”是指A經(jīng)過GT變換后,A中樣本的分類信息要盡可能多地被保留下來。
假設(shè)給定的樣本集A分為r個類別:A=[A1,…,Ar],Ai∈m×ni且r/2ni;Ni表示第i類樣本的列索引值組成的集合。那么每一類別Ai的質(zhì)心ci和A的總體質(zhì)心c可分別表示為
ci=(1/ni)Aiei,ei=[1,…,1]T∈ni×1(7)
c=(1/n) nj=1aj(8)
正交質(zhì)心算法總結(jié)如下[8]:
對任一給定的具有r個類別樣本矩陣A∈m×n和向量x∈m×1,通過計(jì)算矩陣Qr∈m×r,可進(jìn)一步得到向量x的r維表示x=QrT x∈r×1。
a)計(jì)算各個類別的質(zhì)心向量ci,1≤i≤r。
b)由各個類別的質(zhì)心向量ci可形成質(zhì)心矩陣
C=[c1,…,cr]∈m×r(9)
c)計(jì)算質(zhì)心矩陣C的QR(正交)分解:
C=QR0=[Qr,Qm-r]R0=QrR(10)
d)計(jì)算向量x的r維表示x^=QrTx
3 實(shí)驗(yàn)過程和結(jié)果
3.1 人耳庫介紹
筆者把本文提出的基于小波變換和正交質(zhì)心算法的方法分別在USTB(79)人耳庫上進(jìn)行了實(shí)驗(yàn)。這里先對人耳庫作一個簡單的介紹。
USTB(79)人耳庫共包括869幅人耳圖像,共79人,每人11幅灰度圖像,如圖2所示。其中(a)為頭部的正側(cè)面圖像,即人耳的正面圖像;(b)~(k)分別為頭部逆時針旋轉(zhuǎn)5°、10°、15°、20°、25°、30°、35°、40°、45°、60°時的人耳圖像。
3.2 實(shí)驗(yàn)過程
如圖3所示,本實(shí)驗(yàn)大致分為以下幾個步驟:
a) 對人耳庫中的圖像進(jìn)行預(yù)處理,包括直方圖均衡和尺寸歸一化。直方圖均衡的目的是降低光照條件對圖像的影響,提高對比度;尺寸歸一化的目的是把圖像縮放到同樣大小以方便特征的提取,根據(jù)不同庫中圖像尺寸的實(shí)際大小,本文把USTB(79)人耳庫中的圖像調(diào)整為56×112(寬×高)。
b) 按照人耳圖像拍攝時旋轉(zhuǎn)的角度,可以把USTB(79)人耳庫中的樣本分為11組;選定訓(xùn)練集和測試集。在USTB(79)人耳庫中分別選取了1~11組數(shù)據(jù)作為測試集,每次選定某一組樣本作為測試集后,該庫中所有其他組的樣本均作為訓(xùn)練集。
c) 對訓(xùn)練集中的人耳圖像進(jìn)行二維離散小波分解(在此對圖像進(jìn)行一層小波分解),單個樣本圖像對應(yīng)的小波分解低頻系數(shù)矩陣?yán)斐傻囊粋€列向量,相當(dāng)于正交質(zhì)心算法中的ai;訓(xùn)練集中各樣本對應(yīng)的ai可形成矩陣A;由A按照正交質(zhì)心算法計(jì)算得出變換矩陣Qr。
d) 把訓(xùn)練集樣本和測試集樣本經(jīng)二維離散小波分解后的低頻信息作為新的訓(xùn)練集A和測試集X,A和X再經(jīng)過Qr投影變換形成Ωtrain和Ωtest,最后計(jì)算Ωtest和Ωtrain中各向量之間的歐式距離并利用最近鄰分類器判別測試樣本的所屬類別。
圖3中的①表示利用訓(xùn)練集樣本小波分解后的低頻系數(shù)矩陣計(jì)算Qr;②表示測試集樣本小波分解后的低頻系數(shù)矩陣A經(jīng)Qr投影變換;③表示測試集樣本小波分解后的低頻系數(shù)矩陣X經(jīng)Qr投影變換。這樣標(biāo)注的目的是為了顯式地說明這三個步驟之間的先后順序。
3.3 實(shí)驗(yàn)結(jié)果
筆者把本文提出的Wavelet+OC方法與Belhumeur等人提出的經(jīng)典的Fisherfaces(PCA+LDA)方法在識別率和識別時間兩個重要的性能方面作了比較。下面給出本文的Wavelet+OC和PCA+LDA兩種方法在USTB(79)人耳庫上的實(shí)驗(yàn)結(jié)果,如表1所示。
從實(shí)驗(yàn)結(jié)果可以看出,在識別率方面兩種方法的性能大體相同;但是在識別時間方面,本文提出的方法要明顯優(yōu)于Fisherfaces(PCA+LDA)方法,原因在于主成分分析過程中投影矩陣的計(jì)算依賴于所有訓(xùn)練樣本拉伸成的向量的協(xié)方差矩陣,并且還要計(jì)算該協(xié)方差矩陣的特征向量和特征值,計(jì)算量非常大;隨著訓(xùn)練樣本數(shù)量的增加,計(jì)算會變得越來越困難、越來越耗時。本文提出的方法首先使用二維離散小波分解只保留圖像的低頻系數(shù)部分,在正交質(zhì)心算法中也無須計(jì)算協(xié)方差矩陣及其特征值和特征向量,只對各類的質(zhì)心向量組成的矩陣進(jìn)行QR分解,大大降低了計(jì)算的復(fù)雜度,因此具有較快的識別速度。
4 結(jié)束語
人耳識別是目前比較活躍的研究領(lǐng)域之一,本文提出的將小波變換與正交質(zhì)心算法相結(jié)合的特征提取方法計(jì)算量小、耗時較少,并且具有較高的識別率,被證明是一種有效的特征提取手段,特別適用于樣本數(shù)量龐大、對識別速度要求高的場合。
參考文獻(xiàn):
[1]BELL D E,LaPADULA L J.Secure computer system: unified exposition multics interpretation, MTIS ADA023588[R].[S.l.]:MITRE Corporation,1975.
[2]鐘珞,潘昊,封筠,等.模式識別[M].武漢:武漢大學(xué)出版社,2006.
[3]TURK M,PENTLAND A. Face recognition using Eigenfaces[C]//Proc of IEEE Conference on Computer Vision and Patter Recognition.1991: 586591.
[4]TURK M,PENTLAND A. Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(l):7186.
[5]BELHUMEUR P N ,HESPANHA J P,KRIEGMAN D J. Eigenfaces vs.Fisherfaces:recognition using class specific linear projection[J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1997,19(7): 711720.
[6]BARTLETT M S,MOVELLAN J R,SEJNOWSK T J.Face recognition by independent component analysis[J].IEEE Trans on Neural Networks,2002, 13(6):14501464.
[7]葛哲學(xué),沙威.小波分析理論與MATLAB R2007實(shí)現(xiàn)[M]. 北京:電子工業(yè)出版社,2007:15
[8]HOWLAND P, PARK H.Generalizing discriminant analysis using the generalized singular value decomposition[J].IEEE PAMI,2004,26(8):9951006.