王利龍,吳 斌
(西南科技大學信息工程學院,四川 綿陽 621010)
作為模式識別與人工智能領域中的熱門研究課題,人臉識別[1]的研究工作取得了突破性進展。但圖像特征提取過程會受到不同干擾因素限制[2],如光照強度和遮擋變化、人臉姿態(tài)和表情變化等外在、內在因素,會使人臉識別算法的性能面臨較大的挑戰(zhàn)[2-11]。
為保證少樣本條件下特征提取的完備性,進一步增強人臉特征的表示和提取,提出了Gaborface多通道優(yōu)化與二維線性降維的特征提取算法。①多通道Gaborface表征模型對樣本集進行預處理,提取不同通道下的人臉Gabor幅值特征,并選取較優(yōu)的通道特征融合方式組合成新人臉特征表示。②引入類內、類間鑒別信息改進二維局部保持投影(two dimentional locality preserving projection,2DLPP)提取行方向特征,同時在列方向上采用二維主成分分析算法(two dimentional principal component analysis,2DPCA)對新人臉進行特征提取與降維。③通過最近鄰分類器得到分類結果,用于描述人臉識別性能。
人臉圖像本質上為高維流形,非線性降維[4]能夠很好地保留圖像結構,但計算量大。因而,HE[5]提出了局部保持投影(locality preserving projections,LPP)共享非線性降維算法特性,較主成分分析(principal component analysis,PCA)得到更優(yōu)的人臉表示。進一步直接獲取二維圖像矩陣的最優(yōu)特征,可更好地保證算法有效性,如2DPCA[12]、2DLPP[13]等。二維雙向降維算法能增強人臉識別算法的魯棒性,QI提出了一種結合2DLPP與2DPCA的人臉識別方法[14-15]。該算法對圖像行和列方向上最優(yōu)特征求解,但缺乏對圖像樣本間鑒別信息的考量,對于人臉姿態(tài)、光照變化仍較為敏感。
Gabor濾波算法[6-11]能夠很好地表示空間局部性和方向選擇性。多通道Gaborface表征(multi channel gabor face representation,MGFR)可以提供多通道間的信息補償。HUO[15]提出了多通道Gabor小波與2DFLD相融合的算法。該算法能夠提取人臉特征的空間局部和方向信息,并對人臉的光照變化不敏感,具有很好的魯棒性。
為有效保留圖像的全局和局部特征,在多通道Gaborface組合表征的行、列方向上,分別采用引入類別權重的二維局部保持投影和二維主成分分析算法。改進算法流程如圖1所示。

圖1 改進算法流程圖Fig.1 Processing of improved algorithm
二維Gabor人臉特征的提取過程為:采用不同屬性的Gabor濾波器對人臉圖像進行核卷積處理,獲得的特征矢量與Gabor濾波器的方向、尺度相對應。經(jīng)給定參數(shù)的核卷積運算后,不同通道Gabor人臉特征Gμ,v(x,y)為:
(1)
式中:Ψμ,v為Gabor濾波器;kμ,v為波向量,μ∈{0,1,…,7}和v∈{0,1,…,4}分別為其方向和尺度參數(shù);z=(x,y);σ=2π;I(x,y)為單張人臉;‖·‖為歐式范數(shù)算子。
文獻[6]引入串接方式來組合多通道Gabor特征矢量,且不同尺度和方向上的組合表征在分類性能上表現(xiàn)出了較強的差異性。受特征表示不同鑒別屬性的啟發(fā),選取四種通道組合形成Gabor特征人臉表示。
①求和全部通道。
(2)
②方向通道相加后串接。

(3)
③尺度通道相加后串接。

(4)
④串接全部通道。
(5)
式中:C為串接符[6];∑為求和符。
對于任意單張圖像,經(jīng)過Gabor濾波器卷積并組合通道操作后,新特征矩陣維數(shù)隨不同通道組合形式的變化而不同。多通道組合處理結果如圖2所示。
圖2表示選取四種通道組合下的人臉表征。其中,圖2(d)可直觀表現(xiàn)出全部通道下人臉圖像的局部和方向描述,且四種矢量組合效果存在較為明顯的差異。雖然該特征提取過程能獲取單張圖像更為豐富的特征表示,但其高維屬性影響算法的實效性。針對該算法不足,提出改進雙向二維線性降維方法進行優(yōu)化。
圖像降維過程往往會丟失數(shù)據(jù)原有結構信息,且一維向量較二維矩陣對數(shù)據(jù)破壞性更大。而行、列方向上分別獲取最優(yōu)投影,可得到樣本圖像最小維數(shù)的特征表示。

圖2 多通道組合處理結果Fig.2 Processing results of multi-channel combination
2.2.1 列方向2DPCA特征提取

(1)求取樣本均值:
(6)
(2)求取協(xié)方差矩陣:
Ψ=E[g-Eg]T[g-Eg]=
(7)
(3)求取投影后總散度矩陣:
J(Z)=tr{E[u-Eu]T[u-Eu]}=
tr{E[gZ-EgZ]T[gZ-EgZ]}
(8)
則將式(6)、式(7)代入式(8),可以得到:
J(Z)=ZTΨZ
(9)
最后求解式(9)并保留前p個最大的廣義特征值,取其對應的特征向量組成樣本列方向上的投影矩陣Zopt=[z1,z2,...,zp]。
2.2.2 行方向2DLPP特征提取
通過列方向2DPCA特征提取得到圖像全局結構,現(xiàn)采用改進權重的2DLPP保留圖像行方向上的局部信息[10]。算法實現(xiàn)如下。
①構建有向鄰接圖。
利用包含M個樣本的數(shù)據(jù)集構建有向鄰接圖,且圖中包含M個結點,結點間的近鄰關系通過K近鄰準則確定。
②權重選擇及優(yōu)化。
在全局鄰域的基礎上引入類間、類內信息,通過增大樣本類間差異,縮小類內差異來更好描述數(shù)據(jù)間的近鄰關系。其優(yōu)化后的權重為:
(10)

③求取投影矩陣。
首先取標準列正交矩陣A∈Rm×q,n≥q將矩陣gi行方向映射到A上,有變換后矩陣yi=ATgi,yi∈Rq×n,i=1,2,...,M。經(jīng)權重改進后,2DLPP的目標函數(shù)為:

且需同時滿足:
AgT(D?In)gAT=1
(11)
式中:D為對角陣;L為拉普拉斯矩陣;?為克羅內克積;In為單位陣。聯(lián)立公式,進一步得到:
gT(L?In)gAT=λgT(D?In)gAT
(12)
最終,求解式(12)并保留前q個最大的廣義特征值,取其對應的特征向量組成樣本行方向上的投影矩陣Aopt。
基于行、列方向上的最優(yōu)投影矩陣Aopt和Zopt,對于任意單張人臉圖像,均可得維數(shù)為q×p的矩陣Fopt:
(13)

(14)
為比較訓練樣本和測試樣本間的相似性,采用最近鄰分類,通過計算特征矩陣間的歐式距離d,可快速驗證算法的有效性。
(15)
試驗選取AR人臉數(shù)據(jù)集,驗證不同Gabor通道組合的有效性,選取YALE和ORL兩人臉數(shù)據(jù)庫,分別驗證不同算法與改進算法的性能對比。試驗平臺為WIN7系統(tǒng);Pentinum(R) Dual-Core CPU 2.80 GHz;算法編程環(huán)境為Matlab R2017a。
AR人臉數(shù)據(jù)庫是由美國俄亥俄州立大學提供的公開數(shù)據(jù)庫,包含了超過4 000張彩色人臉照片,包括不同角度、不同表情、不同光照和遮擋條件,所有圖像均為165×120。
YALE庫中包含15個人的165張照片,每個人11張照片,圖像像素大小為100×100。
ORL人臉數(shù)據(jù)集是由劍橋大學試驗室提供的公開數(shù)據(jù)集。其包含40個人的人臉圖像,每類人臉圖像均有10張,不但包含了一些人臉俯仰達20°的傾斜和旋轉圖像,而且包含了達10%的尺度變化。所有圖像均為灰度圖,像素大小為112×92。
由上文可知,Gabor濾波的方向和尺度屬性對人臉表示影響較大。因此,選擇四種表征能力較強的通道組合方式,再對其融合改進雙向線性降維來對比算法性能差異,且試驗在AR人臉集上驗證。 優(yōu)化Gaborface通道組合的算法性能曲線如圖3所示。

圖3 優(yōu)化Gaborface通道組合的算法性能曲線Fig.3 Algorithmic performance curves of optimizing Gaborface channel combination
每類樣本訓練數(shù)為3和4,且維數(shù)取d=1,2,…,30時的算法性能對比。其中,全部通道求和、方向通道相加后串接、尺度通道相加后串接、全部通道串接分別用組合方式表示。結果表明,方向通道相加后串接總體表現(xiàn)較佳。
選取方向通道相加后串接方式生成人臉特征表示。此時,需驗證不同數(shù)據(jù)集上不同維數(shù)對改進算法性能的影響。不同特征維數(shù)下識別率曲線如圖4所示。

圖4 不同特征維數(shù)下識別率曲線Fig.4 Recognition rate curves under different feature dimensions
值得注意的是,2DPCA和2DLPP得到的特征矩陣維數(shù)為m×d,而雙向降維算法得到的則為d×d。圖4表明,在AR、ORL、YALE數(shù)據(jù)集上,五種算法的性能都在特征維數(shù)增大的情況下得到提高,且初始位數(shù)較低的情形下,雙向降維算法的識別率較低;當維數(shù)d≥5時,其性能表現(xiàn)更優(yōu)。同時,改進算法表現(xiàn)出了更高的識別率,其算法有效性得到了驗證。
針對小樣本集問題,試驗在ORL和YALE兩數(shù)據(jù)集上選取每類樣本的不同訓練個數(shù)來比較不同算法的識別性能。ORL、YALE上不同訓練樣本數(shù)下算法性能對比如表1、表2所示。

表1 ORL上不同訓練樣本數(shù)下算法性能對比Tab.1 Comparisons of algorithm performance under different training samples on ORL

表2 YALE上不同訓練樣本數(shù)下算法性能對比Tab.2 Comparisons of algorithm performance under different training samples on YALE
試驗選取ORL和YALE兩樣本數(shù)較少的數(shù)據(jù)集。通過表1和表2可以看出,改進算法總體性能表現(xiàn)較好。由于較低維數(shù)下算法識別性能較差,故通過求取均值獲取到的識別率偏差較大。
前述算法對比過程僅在改進工作中引入了優(yōu)化后的多通道Gabor組合特征表示。為考量通道組合后特征對其他算法的性能影響,試驗在數(shù)據(jù)集AR、ORL和YALE的每類樣本上分別選取訓練個數(shù)為7、5、5。
AR、ORL、YALE數(shù)據(jù)集上識別性能對比如表3~表5所示。

表3 AR數(shù)據(jù)集上識別性能對比Tab.3 Comparisons of recognition performance on AR dataset

表4 ORL數(shù)據(jù)集上識別性能對比Tab.4 Comparisons of recognition performance on ORL dataset

表5 YALE數(shù)據(jù)集上識別性能對比Tab.5 Comparisons of recognition performance on YALE dataset
對比結果表明: ①多通道Gaborface的組合表征對每種算法均有識別率上的提升,但同時增加了訓練耗時和分類耗時;②總體上,改進算法的訓練時間較久[16-17],且分類性能表現(xiàn)較優(yōu)。
針對人臉姿態(tài)變化、光照變化等因素對人臉識別性能的影響,通過選取多通道Gaborface優(yōu)化組合和引入樣本類別信息提升線性降維鑒別性能的方式,提出了一種Gaborface多通道優(yōu)化與二維線性降維的特征提取算法,用于描述人臉識別性能。
試驗結果表明,在選取的人臉數(shù)據(jù)庫上,提出的改進算法能夠增強人臉特征的表示和提取。采用多通道Gaborface表征組合更好地保留了人臉特征的局部性和方向性,并進一步提升了雙向降維算法的識別性能,驗證了改進算法在人臉識別性能上的有效性。