歐陽文,王 燕
(蘭州理工大學(xué) 計(jì)算機(jī)與通信學(xué)院,甘肅 蘭州 730050)
人臉識別由于其在公共安全、視頻監(jiān)控、身份鑒別、智能人機(jī)交互等方面的廣闊應(yīng)用前景以及對模式識別理論的發(fā)展具有重要的學(xué)術(shù)意義而備受關(guān)注,是模式識別的熱門研究領(lǐng)域之一。在過去的幾十年里,人臉識別技術(shù)取得了較大的發(fā)展,涌現(xiàn)出許多人臉識別方法,子空間方法成為當(dāng)前人臉識別的主流方法之一,子空間方法中最為主要和流行的方法是主成分分析(Principal Component Analysis,PCA)[1-2]和線性判別分析(Linear Discriminant Analysis,LDA)[3]。
特征提取是人臉識別技術(shù)中一個基本而又十分重要的環(huán)節(jié),在整個人臉識別過程中,特征提取扮演著尤為重要的角色,如何提取出穩(wěn)定、有效的特征,并用最少的特征來表示盡可能多的人臉信息是人臉識別成敗的關(guān)鍵。
Gabor展開是一種同時用時間和頻率表示一個時間函數(shù)的方法,而求解Gabor展開系數(shù)的公式被稱為Gabor變換。傳統(tǒng)的Gabor變換的缺點(diǎn)是窗口尺寸一經(jīng)確定就無法更改,因此不具有變焦特性,無法對信號進(jìn)行多分辨率分析。為解決這一問題人們將Gabor理論同小波理論相結(jié)合,提出了Gabor小波[4]。Gabor小波具有小波變換的多分辨率特性,同時具有Gabor函數(shù)本身所具有的局域性和方向性。目前Gabor變換和Gabor展開已被公認(rèn)是信號與圖像表示的最好的方法之一。Gabor變換中要解決的最基本問題是:在給定綜合窗下如何求解分析窗及Gabor變換系數(shù)。
Turk[1-2]于1991年提出了著名的特征臉方法(Eigenface),將主成分分析(PCA)應(yīng)用于人臉識別,通過提取人臉圖像的主成分進(jìn)行識別。Eigenface是基于重建準(zhǔn)則的,即重建誤差最小,它無法揭示數(shù)據(jù)的局部結(jié)構(gòu)。當(dāng)人臉的光照、表情產(chǎn)生比較大的變化時,其識別率一般不是十分理想。Fisherface[5]屬于有監(jiān)督識別方法,利用線性判別分析(LDA)尋找使類間距和類內(nèi)距比值最大化的投影方向,獲得了較好的識別效果。然而,當(dāng)樣本數(shù)目小于樣本維數(shù)時,F(xiàn)isherface會出現(xiàn)小樣本問題。所以一般先采用PCA方法進(jìn)行降維,然后再用LDA提取特征進(jìn)行識別,這樣既解決了小樣本問題,又可以得到更具判別性的特征。
因此,文中充分利用Gabor小波變換具有良好的提取和區(qū)分能力的空間特性,首先進(jìn)行人臉特征的提取,然后在此基礎(chǔ)上利用PCA進(jìn)行初次降維,最后利用LDA所具有的判別性優(yōu)勢來得到最終的人臉特征。
Gabor小波變換是利用小波核函數(shù)能夠模擬大腦皮層反射區(qū)的特性,使良好的空間特性對各類特種具有良好的提取和區(qū)分能力,在許多領(lǐng)域尤其是圖像分析及識別領(lǐng)域的應(yīng)用非常廣泛。
二維Gabor小波的函數(shù)表示為:

其中δ為高斯窗口的尺度因子,用來調(diào)節(jié)該濾波器的尺度與帶寬;方向與頻率由φu與ωv控制。只要設(shè)置好δ、φu和ωv,就可以利用 Gabor濾波器組對圖像 I(x,y)進(jìn)行進(jìn)一步處理,這個過程也是一個卷積的過程:

該式通過對人臉圖像的Gabor小波分解,從而得到所需要的特征。
圖1表示了在頻域半平面上,6個相隔30度的方向上不同頻率的Gabor小波濾波器:

圖1 不同方向及頻率的Gabor小波族Fig.1 Gabor wavelet family of different directions and frequencies
LDA(Linear Discriminant Analysis)算法其最主要的功能就是提取出高維特征空間中最具分辨能力的低維特征向量,使得屬于同類的樣本盡量靠近,而不同類的樣本盡量分散,使得類間散度與類內(nèi)散度的比值最大化。
設(shè)人臉圖像訓(xùn)練樣本集為X,首先將訓(xùn)練集中二維圖像轉(zhuǎn)換為一維向量,轉(zhuǎn)換后記為D×1維,將屬于一類的人臉圖像進(jìn)行相應(yīng)的圖像歸類記為Xi,樣本總數(shù)為n,總共分為l類,其中每類樣本數(shù)為 ni,i=1,2,3,…,l。
專利權(quán)利要求中的錯誤初探:錯誤的形式、改正的途徑........................................................................孟 睿 徐棣楓 11.66
定義類間散度矩陣為:

類內(nèi)散度矩陣為:


wi(i=1,2…d)為特征方程 SbWi=λSwWi最大的 d 個特征值 λi(λ1≥λ2≥…≥λd)相對應(yīng)的特征向量。 則 Wopt=[w1,w2,…,wd]正是所求的最佳投影矩陣。通過將特征向量進(jìn)行該空間的投影降維,即可得到該算法下的分類特征,即:

在文中通過設(shè)定 4 個不同尺度 v(0,1,2,3)、8 個不同方向u(1,2,3,4,5,6,7)組成 32 個 Gabor特征組進(jìn)行進(jìn)一步的處理。通過Gabor濾波,一幅人臉圖片的維數(shù)為原來圖片維數(shù)的32倍,復(fù)雜性相對較高。同時考慮到復(fù)雜度,將預(yù)處理后的圖像尺寸設(shè)為112×92,若用4個尺度,8個方向的Gabor濾波器組G(4,8)進(jìn)行全局特征提取,則特征矢量維數(shù)高達(dá)112×92×32=329 728,這個計(jì)算量是相當(dāng)大的。在此,算法首先進(jìn)行全局均勻采樣,間隔為8,然后將得到的5 152維特征矢量作為進(jìn)一步處理的基礎(chǔ)矢量。
整體算法描述如下:
1)Gabor小波變換進(jìn)行特征提取:采用Gabor小波變換來對經(jīng)過預(yù)處理的人臉圖像進(jìn)行處理,提取出人臉特征,然后進(jìn)行全局均勻采樣,得到5 152維的特征矢量。
2)PCA處理:對訓(xùn)練樣本集進(jìn)行(1)中處理,得到矩陣A,并對A進(jìn)行PCA降維得到PCA的投影子空間Wpca。
3)計(jì)算類間散度矩陣和類內(nèi)散度矩陣分別為:
Sb=為投影到Wpca后的樣本,mi為投影到Wpca后的樣本均值,m為投影到Wpca后的總樣本均值。
4)依據(jù)LDA算法求解過程,以及(3)中得到的類間散度矩陣和類內(nèi)散度矩陣,來求解最佳的LDA分類子空間得WLDA。
文中主要在ORL人臉庫和YALE人臉庫上進(jìn)行實(shí)驗(yàn)驗(yàn)證,并將本文提出的Gabor+PCA+LDA算法與PCA和LDA算法用于人臉識別時的識別結(jié)果進(jìn)行比較。同時,為了實(shí)現(xiàn)橫向比較,最后的分類器統(tǒng)一采用最近鄰分類器來實(shí)現(xiàn)分類。
實(shí)驗(yàn)一:ORL人臉庫實(shí)驗(yàn)。ORL人臉庫是由英國劍橋大學(xué)建立,包括40個人,每個人10張112×92的在不同時間采集的正面人臉圖像組成。其中包括不同視角、不同表情(高興、微笑、生氣、吃驚、閉眼、睜眼等)和不同面部細(xì)節(jié)(戴或不戴眼鏡、有或無胡須、不同發(fā)型),人臉姿態(tài)有變化和旋轉(zhuǎn)不超過20°。圖2所示的是來自O(shè)RL人臉庫的某一人的10張圖像。

圖2 ORL人臉庫圖像示例Fig.2 The sample images of ORL face database
對于ORL人臉庫的實(shí)驗(yàn)驗(yàn)證,隨機(jī)地從每個人的圖片中選擇 l(l=3,4,…,7)張圖片作為訓(xùn)練樣本,余下的 10-l張圖片來作測試樣本。具體的實(shí)驗(yàn)結(jié)果如表1所示。

表1 ORL人臉庫上的識別結(jié)果比較Tab.1 Recognition results on ORL face database
實(shí)驗(yàn)二:YALE人臉庫實(shí)驗(yàn)。YALE人臉庫由15個人,每個人有11張共165張圖像組成。這些圖像在光照條件變化比較大,而且面部表情(正常、驚訝、傷心、開心和眨眼等)和細(xì)節(jié) (戴或不戴眼鏡、有或無胡須)也有比較明顯的變化。YALE人臉庫中的某一個人的11張圖像如圖3所示。

圖3 YALE人臉庫圖像示例Fig.3 The sample images of YALE face database
在YALE人臉庫庫實(shí)驗(yàn)中,也是隨機(jī)地從每個人的圖像中選取 l(l=3,4,…,7)張圖片作為訓(xùn)練樣本 ,而 余下11-l張作測試樣本。表2為具體的在YALE人臉庫上的實(shí)驗(yàn)結(jié)果。

表2 YALE人臉庫上的識別結(jié)果比較Tab.2 Recognition results on YALE face database
從表1和表2中的實(shí)驗(yàn)數(shù)據(jù)中可以看出,本文提出的基于Gabor+PCA+LDA的算法在ORL人臉庫和YALE人臉庫上均取得了最高識別率,且識別效果均要比傳統(tǒng)的PCA算法和LDA算法要好;當(dāng)樣本數(shù)取7時,PCA、LDA以及本文算法的識別率都達(dá)到最高。同時,由于YALE人臉庫中的圖像在光照條件變化比較大,且表情和細(xì)節(jié)變化也比較大,所以,在YALE人臉庫上的識別率要整體的低于ORL人臉庫中的識別率。
本文主要針對人臉識別中的特征提取問題,提出了一種新的基于Gabor小波變換的算法,并通過實(shí)驗(yàn)驗(yàn)證了本文算法的有效性。雖然本文算法比傳統(tǒng)的PCA和LDA算法具有較大的優(yōu)勢,但離人臉識別在實(shí)際中的應(yīng)用要求還比較遠(yuǎn)。在接下來的工作中,將主要通過對分類器的優(yōu)化選擇及改進(jìn)來進(jìn)一步的提高識別率[6-7]。
[1]Turk M,Pentland A.Eigenfaces forrecognition[J].Journal of Cognitive Neuroscience,1991:71-86.
[2]TURK M,PENTLAND A.Face recognition using eigenfaces[C]//Proceeding of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Washington D C:IEEE Computer Society Press,1991:586-59l.
[3]Belhumeur P,Hespanha J,Kriegman D.Eigenfaces VS.Fisherfaces:Recognition using classspecific linear projection[C]//IEEE Transactions onPattern Analysis and Machine Intelligence,1997,19(7):711-720.
[4]葉敬福,詹永照.基于Gabor小波變換的人臉表情特征提取[J].計(jì)算機(jī)工程,2005,31(15):172-174.YE Jin-fu,ZHAN Yong-zhao.The face expression feature extraction based gabor wavelet transform [J].Computer Engineering,2005,31(15):172-174.
[5]盧桂馥,林忠,金忠.基于最大差值的二維邊界Fisher的人臉識別[J].計(jì)算機(jī)科學(xué),2010,37(5):775-779.LU Gui-fu,LIN Zhong,JIN Zhong.The face recognition algorithmbased ontwodimensionalboundaryfisherofmaximum difference[J].Computer Science,2010,37(5):775-779.
[6]YANG Han-xuan,SHAO Ling,ZHENG Feng,et al.Recent advances and trends in visual tracking:A review[J].Neurocomputing,2011,74(18):3823-3831.
[7]Scherer S,Kane J,Gobl C,et al.Investigating fuzzy-input fuzzy-output support vector machines for robust voice quality classification[J].Computer Speech&Language,2012.