龔 劬,馬家軍
(重慶大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶401331)
基于改進(jìn)二維保局投影算法的人臉識(shí)別
龔 劬,馬家軍
(重慶大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶401331)
傳統(tǒng)的二維保局投影(2DLPP)算法未考慮樣本鄰域間局部信息,并且所提取的特征矩陣分量間存在相關(guān)性。針對該問題,提出基于大間距準(zhǔn)則的最小相關(guān)性監(jiān)督2DLPP算法。引入類間局部散度矩陣和類內(nèi)局部散度矩陣,最大化帶權(quán)的散度矩陣跡差,以增大樣本類間散度,減小樣本類內(nèi)散度,從而更好地刻畫數(shù)據(jù)的流形結(jié)構(gòu)。計(jì)算所提取特征矩陣各分量間的協(xié)方差矩陣,通過最小相關(guān)性分析,減少特征信息的冗余。在Yale和ORL人臉庫上進(jìn)行仿真實(shí)驗(yàn),結(jié)果顯示,當(dāng)訓(xùn)練樣本數(shù)為5時(shí),該算法的最高識(shí)別率分別為92.5%和96.2%,與傳統(tǒng)2DLPP算法、二維主成分分析法、二維線性判別分析法和二維大間距準(zhǔn)則法相比,識(shí)別率均有所提高。同時(shí)對不同訓(xùn)練樣本數(shù)下識(shí)別率均值和方差進(jìn)行分析,驗(yàn)證了算法的穩(wěn)定性。
流形學(xué)習(xí);最大間距準(zhǔn)則;散度矩陣;二維保局投影;最小相關(guān)性;人臉識(shí)別
近十多年來,人臉識(shí)別已成為模式識(shí)別和計(jì)算機(jī)視覺領(lǐng)域最具吸引力和挑戰(zhàn)性的研究課題之一[1]。人臉圖像維數(shù)通常較高,不利于分類,計(jì)算也很復(fù)雜,因此,人們往往將人臉圖像投影到低維的子空間進(jìn)行識(shí)別[2]。
有關(guān)研究表明[3-4],人臉圖像位于高維圖像空間的低維流形之上。二維局部保持投影法[5]只考慮了鄰域內(nèi)局部信息,而沒有考慮鄰域間局部信息。這就使得同一鄰域目標(biāo)在降維后盡可能接近,而不能使不同鄰域的目標(biāo)在降維后盡可能隔得更遠(yuǎn)。為了使算法具有更好的判別性,本文引入類別信息,定義類間局部散度矩陣和類內(nèi)局部散度矩陣,在最大間距準(zhǔn)則[6]基礎(chǔ)上,使類內(nèi)局部散度矩陣最小,同時(shí)使類間局部散度矩陣最大,實(shí)現(xiàn)特征提取后同類更近不同類更遠(yuǎn)的目的。基于大間距準(zhǔn)則提取的特征集消除或降低了光照、表情姿態(tài)等變化對識(shí)別結(jié)果的影響[7],但通過分析發(fā)現(xiàn),在大間距準(zhǔn)則Maximum Margin Criterion(MMC)下提取的判別特征集各分量之間存在統(tǒng)計(jì)相關(guān)性。文獻(xiàn)[8]指出統(tǒng)計(jì)不相關(guān)的判別特征集分類性能優(yōu)于正交特征分類。
本文對大間距準(zhǔn)則下提取的判別特征集各分量進(jìn)行最小相關(guān)性分析,提出一種基于大間距準(zhǔn)則的最小相關(guān)性監(jiān)督二維保局投影(Two-dimensional Loca-lity Preserving Projection,2DLPP)算法,利用推導(dǎo)出的公式提取出最小相關(guān)性特征矩陣用于分類識(shí)別。
假設(shè)x1,x2,…xN是m×n維歐式空間Rm×n中的N個(gè)訓(xùn)練樣本,共有C個(gè)類別,每個(gè)類對應(yīng)的樣本數(shù)量為n1,n2,…,nC。一般的二維線性特征提取方法是,找到一個(gè)線性映射f:xi→yi=xiP,其中P∈Rn×d是按照某種優(yōu)化準(zhǔn)則得到的投影矩陣,yi∈Rm×d(d<n)代表xi的特征矩陣。2DLPP算法是為了找到一個(gè)能夠保持?jǐn)?shù)據(jù)局部結(jié)構(gòu)的子空間,其目標(biāo)函數(shù)[9]如下:


3.1 基于MMC的2DLPP特征提取
從式(1)可以看出,2DLPP較好地保持了鄰域內(nèi)的局部信息,但是卻忽略了鄰域間的局部信息。由于2DLPP算法不考慮類標(biāo)識(shí)信息,因此2DLPP為非監(jiān)督方法。本文考慮類的標(biāo)識(shí)信息,在文獻(xiàn)[6]的基礎(chǔ)上結(jié)合2DLPP定義類間局部散度矩陣Gb和類內(nèi)局部散度矩陣Gw如下:


式(3)中只有當(dāng)xi和xj屬于不同類時(shí),不為0,因此,表示了不同類樣本間的幾何結(jié)構(gòu),衡量了不同類樣本間的相離程度,為投影后的特征矩陣相離程度提供衡量標(biāo)準(zhǔn);式(4)中只有當(dāng)xi和xj屬于相同類時(shí),Sij不為0,體現(xiàn)了相同類樣本間的幾何結(jié)構(gòu),衡量了相同類樣本間的相近程度,為投影后的特征矩陣的相近程度提供衡量標(biāo)準(zhǔn)。接下來建立基于大間距準(zhǔn)則(2DMMC)的目標(biāo)函數(shù):

其中,yi=xiP;yj=xjP。a為一個(gè)平衡因子,a∈[0,1],當(dāng)a>1/2時(shí),反映出類間局部信息對分類更重要,當(dāng)a<1/2時(shí),反映出類內(nèi)局部信息對分類更重要,通過調(diào)整a的值,便能更好地反映出高維空間中的流形結(jié)構(gòu)。這樣式(5)可轉(zhuǎn)化為:

其中:

至此,目標(biāo)函數(shù)簡化為:

在特征空間中,式(7)越大,則表示來自不同類的樣本在投影后就會(huì)間隔越遠(yuǎn),而相同類的樣本在投影后就會(huì)間隔的越近。這樣可以充分利用類別信息,更好地保持?jǐn)?shù)據(jù)的流形結(jié)構(gòu),從而提高樣本的線性可分性。
在式(7)基礎(chǔ)上增加一個(gè)正交約束條件PTP= I,與文獻(xiàn)[10]的求解方法類似,于是可以得到目標(biāo)函數(shù)式(7)在正交約束條件下的最大值為:


3.2 最小相關(guān)性分析
定義 如果2個(gè)隨機(jī)變量ζ與η的協(xié)方差滿足:

則稱ζ與η是統(tǒng)計(jì)不相關(guān)的。
定理 在正交約束條件下的基于大間距準(zhǔn)則的二維保局投影法所得到的特征矩陣各分量間存在統(tǒng)計(jì)相關(guān)性。
證明:假設(shè)由式(7)所得的特征矩陣各分量間是統(tǒng)計(jì)不相關(guān)的。設(shè)基于大間距準(zhǔn)則的二維保局投影抽取的一個(gè)特征矩陣為:


文獻(xiàn)[11]指出,圖像的第k行和第l行是統(tǒng)計(jì)相關(guān)的,C≠0。正交約束條件為:PTP=I,C= PPTCPPT。由假設(shè)得到:PTCP=0,即C=0。這與圖像的第k行和第l行是統(tǒng)計(jì)相關(guān)的矛盾。
通過以上的分析,得到求解式(7)得到的特征矩陣的分量之間統(tǒng)計(jì)相關(guān),這就意味著得到的特征矩陣存在信息冗余,給分類帶來干擾。令:

x1,x2,…,xN為N個(gè)訓(xùn)練樣本,每個(gè)樣本均為m×n大小的圖像矩陣,則構(gòu)造n×n的C:

式(11)最小,即所提取的特征矩陣各分量之間統(tǒng)計(jì)相關(guān)性最小。
3.3 本文算法
本文算法是在大間距準(zhǔn)則的基礎(chǔ)上提出來的,要求最大化帶權(quán)特征矩陣的散度矩陣跡差,同時(shí)最小化特征矩陣分量之間的相關(guān)性,即:

式(12)是個(gè)雙指標(biāo)優(yōu)化問題,為了避免類似Fisher鑒別準(zhǔn)則中的小樣本問題,本文沒有采用商的形式,而是改用差分的形式[12],將式(11)中的兩部分內(nèi)容轉(zhuǎn)換成單指標(biāo)優(yōu)化問題,即可得到改進(jìn)后的目標(biāo)函數(shù):

此時(shí),只需求解特征值問題即可:

3.4 分類識(shí)別
求出式(14)的前d個(gè)最大的特征值所對應(yīng)的特征向量組成最佳投影矩陣P=[p1,p2,…,pd],則原圖像矩陣在投影矩陣下化為:

同樣的,一幅測試圖像x(test)的特征矩陣 y (test)為:

用歐氏距離和最近鄰分類器[13]來實(shí)現(xiàn)測試樣本的分類。歐氏距離的具體公式表示:

如果:

則認(rèn)為x(test)與x*屬于同一類。
本文算法的具體步驟如下:
步驟2 計(jì)算鄰接矩陣,由式(8)計(jì)算得到矩陣G。進(jìn)行最小相關(guān)性分析,由式(11)得到C。
步驟3 提取投影矩陣P。由式(14)求出投影矩陣P,根據(jù)式(15)和式(16)對訓(xùn)練樣本和測試樣本進(jìn)行投影。
步驟4 分類識(shí)別。利用式(17)計(jì)算歐氏距離,根據(jù)式(18)進(jìn)行分類,實(shí)現(xiàn)測試圖像的分類。
本文算法是對2DLPP改進(jìn)的一種算法,兼有2DLPP算法在保持鄰域幾何結(jié)構(gòu)上的優(yōu)勢,同時(shí)也有明晰的映射矩陣,可直接輸入本圖像矩陣進(jìn)行處理。本文算法的改進(jìn)包括2個(gè)方面:(1)融合了2DLPP和MMC的算法思想,將MMC中的類間和類內(nèi)局部散度矩陣引入到2DLPP算法中,且在計(jì)算類間、類內(nèi)局部散度矩陣時(shí),算法成了有監(jiān)督方法,使算法更適應(yīng)分類問題;(2)在2種算法的基礎(chǔ)上,對所提取的特征矩陣各分量進(jìn)行最小相關(guān)性分析,降低了提取的特征矩陣各分量間的相關(guān)性,減少計(jì)算時(shí)所需特征向量個(gè)數(shù)的同時(shí),也減少了冗余信息的干擾,對降低后續(xù)算法的計(jì)算量和提高分類識(shí)別性能都有重要的促進(jìn)作用[14]。
為驗(yàn)證本文算法的有效性,分別在Yale人臉庫和ORL人臉庫上進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)前,所有的人臉圖像都經(jīng)過手動(dòng)眼睛定位、校準(zhǔn),最終歸一化為64×64的圖像。為進(jìn)行對比,同時(shí)測試了2DLPP、2DPCA[15]、2DLDA[16]3種二維算法的性能。為進(jìn)一步測試最小相關(guān)性分析這一改進(jìn)的效果,本文將MMC推廣到二維空間(2DMMC),并在以上2個(gè)數(shù)據(jù)庫進(jìn)行仿真實(shí)驗(yàn)與本文算法進(jìn)行對比。在本文算法、2DLPP中,t=8 000 000。本文算法中a=0.4。
5.1 Yale人臉庫實(shí)驗(yàn)
Yale人臉庫共有15個(gè)人,每人11幅圖像,包含3種不同的光照情況,6種不同的表情,并且圖像有戴眼鏡和不戴眼鏡的區(qū)別。二維算法提取的是特征矩陣,為了研究特征值數(shù)目和識(shí)別率之間的關(guān)系,每人訓(xùn)練樣本為5時(shí),5種二維算法的識(shí)別率和特征值數(shù)目之間的關(guān)系如圖1所示。可以看出,隨著特征值數(shù)目的增加,識(shí)別率也相應(yīng)增加。當(dāng)特征值數(shù)目很小時(shí),識(shí)別率的增加很明顯,當(dāng)數(shù)目增加到10左右,識(shí)別率就趨于平穩(wěn)。

圖1 Yale人臉庫中識(shí)別率與特征值個(gè)數(shù)的關(guān)系
為測試訓(xùn)練樣本的個(gè)數(shù)對本文算法性能的影響,隨機(jī)選取每個(gè)人的n(n=2,3,4,5)幅圖像作為訓(xùn)練集,余下的作為測試集。對每個(gè)n值,做10次隨機(jī)劃分實(shí)驗(yàn)。表1為Yale人臉庫上5種算法最高識(shí)別率的均值和標(biāo)準(zhǔn)差比較。可以看出,隨著訓(xùn)練樣本數(shù)的增多,各種算法的識(shí)別率都有所增加;在相同訓(xùn)練樣本的情況下,本文算法的識(shí)別率最高。

表1 Yale人臉庫最高識(shí)別率的均值及標(biāo)準(zhǔn)差比較 %
5.2 ORL人臉庫實(shí)驗(yàn)
ORL人臉庫包含來自40個(gè)不同人的400幅圖像,每人有10幅大小、姿態(tài)、表情各異的圖像。ORL人臉庫主要用來測試本文算法在人臉圖像大小、表情和姿態(tài)都變化時(shí)的識(shí)別性能。實(shí)驗(yàn)中,探討了特征值數(shù)目變化時(shí),本文算法、2DLPP、2DPCA、2DLDA和2DMMC在ORL人臉數(shù)據(jù)庫上正確識(shí)別率的變化情況,如圖2所示。由圖2可知,當(dāng)d=3時(shí),也即當(dāng)選擇3個(gè)較大的特征值對應(yīng)的特征向量作為投影軸時(shí),本文算法得到的最高正確識(shí)別率為96.2%。
下面驗(yàn)證測試訓(xùn)練樣本數(shù)目改變時(shí)本文算法的識(shí)別性能。每人選擇n(n=2,3,4,5)幅圖像作為訓(xùn)練集,余下的作為測試集。對每個(gè)n值做10次隨機(jī)劃分試驗(yàn)。表2為不同訓(xùn)練樣本數(shù)目下5種二維算法的平均最高識(shí)別率和標(biāo)準(zhǔn)差,可以看出,當(dāng)訓(xùn)練樣本數(shù)增加時(shí)識(shí)別率都有所提高,在相同樣本數(shù)目下本文算法的識(shí)別率最高。

圖2 ORL人臉庫中識(shí)別率與特征值個(gè)數(shù)的關(guān)系

表2 ORL人臉庫最高識(shí)別率的均值及標(biāo)準(zhǔn)差比較 %
本文提出了一種新的二維流形學(xué)習(xí)算法:基于大間距準(zhǔn)則的最小相關(guān)性監(jiān)督二維保局投影算法。該算法保持了數(shù)據(jù)的幾何結(jié)構(gòu),又考慮了類間距離,并且通過引入最小相關(guān)性約束,避免了信息冗余,有利于提高識(shí)別效果,降低分類時(shí)計(jì)算復(fù)雜度。在Yale和ORL人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果表明,該算法相對其他線性算法更具優(yōu)勢,且在低維空間維數(shù)較低時(shí)仍有很好的效果。由于本文算法為線性算法,下一步的研究方向是利用核方法[17]將其推廣為非線性特征提取的算法,以更好地實(shí)現(xiàn)非線性分類。算法中的參數(shù)較難設(shè)置,使參數(shù)能夠自適應(yīng)也是需要解決的關(guān)鍵問題。
[1] Wang Yong,Wu Yi.Face Recognition Using Intrisicfaces[J].Pattern Recognition,2010,43(10):3580-3590.
[2] 龔 劬,華桃桃.基于改進(jìn)的局部保持投影算法的人臉識(shí)別[J].計(jì)算機(jī)應(yīng)用,2012,32(2):528-530,534.
[3] Tenenbaum J B,de Silva V,Langford J C.A Global Geometric Framework forNonlinearDimensionality Reduction[J].Science,2000,290(5500):2319-2323.
[4] Roweis S T,SaulL K.Nonlinear Dimensionality Reduction by Locally Linear Embedding[J].Science, 2000,290(5500):2323-2326.
[5] Chen Sibao,Zhao Haifeng,Kong Min,et al.A Twodimensional Extension of Locality Preserving Projections [J].Neurocomputing,2007,70(4-6):912-921.
[6] Li Haifeng,Jiang Tao,Zhang Keshu.Efficientand RobustFeature Extraction by Maximum Margin Criterion[J].IEEE Transactions on Neural Networks, 2006,17(1):157-165.
[7] 張志偉.可變光照條件下的人臉識(shí)別技術(shù)研究[D].天津:河北工業(yè)大學(xué),2007.
[8] Yang Jian,Yang Jingyu,David Z.What's Wrong with Fisher Criterion?[J].Pattern Recognition,2002,35 (11):2665-2668.
[9] 張志偉,楊 帆,夏克文,等.一種應(yīng)用于小樣本人臉識(shí)別的2DLPP算法[J].光電子·激光,2008,19(7): 972-975.
[10] 張大明,符茂勝,羅 斌.基于二維近鄰保持嵌入的圖像識(shí)別[J].模式識(shí)別與人工智能,2011,24(6): 810-815.
[11] Wang Liwei,Wang Xiao,Zhang Xuerong,etal. Generalized 2D Principal Component Analysis for Face Representation and Recognition[J].Neural Networks, 2005,18(5/6):585-594.
[12] 嚴(yán) 慧,金 忠,楊靖宇.最小相關(guān)性的二維主成分分析[J].模式識(shí)別與人工智能,2010,23(1):7-10.
[13] Perlibakas V.Distance Measures for PCA-based Face Recognition[J].Pattern Recognition Letters,2004,25 (6):711-724.
[14] 羅 磊,李躍華.基于非相關(guān)判別鄰域保持投影的毫米波雷達(dá)目標(biāo)識(shí)別[J].電子與信息學(xué)報(bào),2010,32 (11):2751-2754.
[15] 何國輝,甘俊英.二維主元分析在人臉識(shí)別中的應(yīng)用研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(24): 4667-4673.
[16] Ye Jieping,Janardan R,Li Qi.Two-Dimensional Linear Discriminate Analysis[J].Neural Information Processing Systems,2005,17(2):1569-1576.
[17] 肖健華,吳今培,沈道義.基于核的特征提取技術(shù)及應(yīng)用研究[J].計(jì)算機(jī)工程,2002,28(10):36-38.
編輯 金胡考
Face Recognition Based on Improved Two-dimensional Locality Preserving Projection Algorithm
GONG Qu,MA Jia-jun
(College of Mathematics and Statistics,Chongqing University,Chongqing 401331,China)
Two-dimensional Locality Preserving Projection(2DLPP)ignores the face sample local information between neighborhood and the correlation between the extracted feature matrix component problems.Aiming at this problem,the minimum correlated supervision 2DLPP algorithm based on Maximum Margin Criterion(MMC)is proposed.Between class local scatter matrix and within class local scatter matrix are brought in,which maximize the trace difference of scatter matrix to increase the sample's between-class scatter and decrease within-class scatter,then manifold structure of data can be characterized better.It calculates the covariance matrix of extracted feature matrix,reduces the feature redundant.Experiments on Yale and ORL face database are done,when the train sample number is 5,the result shows that the highest recognition rates are 92.5%and 96.2%,the recognition rate is higher than traditional 2DLPP algorithm,Twodimension Principal Component Analysis(2DPCA)algorithm,Two-dimension Linear Discriminate Analysis(2DLDA) algorithm and Two-dimension Maximum Margin Criterion(2DMCC)algorithm.It also analyses the mean and variance of recognition rate to prove the stability of the improved algorithm.
manifold learning;Maximum Margin Criterion(MMC);divergence matrix;Two-dimensional Locality Preserving Projection(2DLPP);minimum correlation;face recognition
1000-3428(2014)09-0252-05
A
TP18
10.3969/j.issn.1000-3428.2014.09.051
重慶大學(xué)“211”工程三期創(chuàng)新人才培養(yǎng)計(jì)劃建設(shè)基金資助項(xiàng)目(s-09110)。
龔 劬(1963-),女,教授、博士,主研方向:人工智能,圖像處理;馬家軍(通訊作者),碩士研究生。
2013-06-18
2013-09-06E-mail:majiajun311@163.com