王 娜,王匯源
WANG Na,WANG Huiyuan
山東大學 信息科學與工程學院,濟南250100
School of Information Science and Engineering,Shandong University,Jinan 250100,China
Gabor小波以其優良特性被廣泛應用于圖像處理與分析及人臉識別領域。Gabor 小波不但具有空間局部性和空間頻率性等許多優點,也是對高級脊椎動物視覺皮層中的神經元的良好逼近,因此用Gabor 小波變換系數作為人臉識別的特征具有良好的生物學背景和視覺特性[1]。
文獻[2-4]中采用Gabor 變換(GaborTransform,GT)特征進行人臉識別,實驗結果表明GT特征提高了算法對于光照、姿態和表情等變化的魯棒性。隨后基于Gabor特征的人臉識別研究成為了該領域的研究熱點。文獻[5]中的GT+LBP(Local Binary Pattern)算法,采用LBP算子對GT 后的特征進行編碼,然后對編碼后的圖像提取分塊直方圖進行降維和識別。文獻[6]中的GT+ICA(Independent Component Analysis)算法,采用ICA 方法對GT 后的特征進行降維,并用最近鄰分類器進行分類。文獻[7]中采用的方法則是將Gabor 特征分塊構成子模式,用最小分類器對子模式分類,最后在決策級進行融合得出分類結果。盡管這些方法都取得了不錯的識別效果,但都存在如下不足之處:傳統的Gabor 小波變換從5 個尺度和8 個方向提取圖像局部信息,將一個像素映射為40 個變換系數,一幅圖像也就映射為40 幅圖像,數據極度冗余,計算量大,由于方向選取是離散的,因而不具有旋轉不變性,當圖像在平面內發生旋轉時,識別率就會降低。為了解決GT 這兩方面的問題,本文采用環形對稱Gabor 變換(Circularly Symmetrical Gabor Transform,CSGT)[8]。CSGT 是GT 的一種形變,對各方向具有相同的濾波作用,只需在尺度上進行變換就能描繪出豐富的人臉特征,將一個像素映射為對應于5 個尺度的5 個變換系數。CSGT 與GT 相比,具有旋轉不變性,所需要的參數和計算量少,數據冗余度低。CSGT 最初僅被應用于紋理分割中,在人臉識別中的應用還不廣泛,文獻[9]首次將CSGT 引入人臉識別領域,文獻[10-11]對CSGT 在人臉識別中的應用作了進一步的論述。
現在主流的特征提取方法有PCA(Principal Component Analysis)[12]、LDA(Linear Discriminant Analysis)和2DPCA(Two-Dimensional Principal Component Analysis)[13]。采用PCA 和LDA 降維時要事先將二維矩陣轉換成一維向量,由于該向量維數一般較高,通常高達上萬維,因此使得后續的計算變得復雜。2DPCA 相當于一種直接的投影技術,直接用二維圖像對應的數據矩陣構建協方差矩陣,不需要預先將二維的數據矩陣轉化成高維的一維向量,相比與PCA,2DPCA 具有以下三個優點[13]:(1)協方差矩陣的計算直接簡單,維數低;(2)易于求取協方差矩陣的特征向量,計算耗時比較少。(3)2DPCA 方法取得了更好的識別效果。鑒于2DPCA算法性能的優越性,2DPCA被廣泛應用于人臉識別中[14-16],正因為如此,本文利用2DPCA來進行變換域特征的提取。
在本文算法中,先對每一幅人臉圖像進行CSGT,并按照本文提出的兩種融合方案進行多尺度特征融合,構造該圖像的特征圖像,最后用2DPCA 進行特征提取和分類。
傳統Gabor濾波器的定義為:

修改式中與方向有關的參數k,就可得到環形對稱Gabor 濾波器的表達式,式中最后一項用來抵消函數中的直流成份,去不去掉這一項函數都是環形對稱的,表達式如公式(2)(3)所示:

式中,r=(x,y) 為空間域坐標向量,,i =0,1,…;,k為頻率即尺度參數,σ/k決定高斯窗口寬度的大小,σ決定窗口寬度與波長的比例關系,Δω為濾波器的倍頻程帶寬。
隨著i的增大,頻率不斷減小,尺度逐漸變大。本文算法中采用表達式(3)。圖1 顯示了環形對稱Gabor基函數在5 個尺度上的實部、虛部和幅度信息。

圖1 5 個尺度上的CSGT 基函數的實部、虛部和幅度
CSGT 與GT 相比,具有以下兩條重要性質[9]:
(1)降低了數據冗余量。傳統的GT 采用8 個方向和5 個尺度上的變換,將1 個像素映射為40 個變換系數,而CSGT 由于去除了方向信息,變換系數只有5 個,降低了數據量。
(2)嚴格的旋轉不變性。傳統的Gabor 變換具有方向選擇性而且是離散的,每個尺度下都選取8 個方向,得到的特征刻畫的是這8 個方向下的濾波效果,不具有旋轉不變性。CSGT 在同一尺度下的濾波方向為360°,人臉圖像經過CSGT 之后,仍能保持人臉在各個方向下的特征,具有旋轉不變性。
圖2 顯示了一幅來自ORL 人臉數據庫的圖像與5個尺度上的CSGT 濾波器卷積后所得的實部、虛部和幅度圖像。

圖2 一幅圖像經CSGT 后所得的實部、虛部和幅度圖像
從圖2 可以看出,經過CSGT 后,人臉圖像的局部特征包括嘴巴、眼睛、鼻子等得到了突出表現,并且對尺度和表情變化具有一定的魯棒性。
因為經CSGT 后的幅度圖像包含了實部和虛部的信息,所以本文采用幅度圖像作為人臉識別的特征圖像。在對5 個尺度上的特征進行融合時本文提出2 種融合方法。
(1)融合方案1
將對應于5 個尺度的五幅圖像按尺度順序上下連接為一幅圖像,作為該人臉圖像的特征圖像,圖3 顯示了按方案1 融合得到的1 幅人臉圖像的特征圖像。

圖3 按方案1 融合后得到的特征圖像
(2)融合方案2
文獻[17]中用到了多尺度圖像疊加的思想,受此啟發,本文提出了方案2,即:在進行CSGT 時,一個像素被映射為對應于5 個尺度的5 個變換系數,將5 個變換系數取平均值,作為該像素點對應的變換系數。其本質就是對CSGT 后得到的對應5 個尺度的五幅圖像求平均圖像。按此規則融合后得到的特征圖像與原圖像大小一致,數據量減為傳統GT 的四十分之一。圖4 顯示了按方案2 融合得到的1 幅人臉圖像的特征圖像。

圖4 按方案2 融合后得到的特征圖像
2004 年,yang 等人在文獻[13]中提出了二維主成分分析(2DPCA)方法。與傳統PCA 方法相比,2DPCA 方法有更好的性能。在傳統PCA 方法中,需將二維圖像轉化成一維圖像向量,這樣不但會丟失一些圖像信息,而且得到的一維圖像向量維數一般較高,從而使協方差矩陣的特征向量的計算變得復雜。2DPCA 方法不需要將二維圖像矩陣轉化成一維圖像向量,直接用二維圖像構造協方差矩陣,使得協方差矩陣的計算更加直觀簡單,計算出協方差矩陣的特征向量的時間也比較少。
假設有M個大小為m×n的訓練樣本Αj(j=1,2,…,M),投影矩陣為X,X∈Rn×d,將圖像矩陣Αj向X做投影,得到投影后的矩陣Yj,大小為m×d。在2DPCA 中用投影后的矩陣Yj(j=1,2,…,M)的總離散度J(X)作為準則函數來衡量投影矩陣X的優劣:

式中SX為矩陣Y的協方差矩陣,tr(SX)是矩陣SX的跡,G為圖像協方差矩陣,它的計算公式為:

M表示M個m×n的訓練樣本,Αj(j=1,2,…,M)表示第j個訓練樣本的數據矩陣,為M個數據矩陣的均值。
由此可知使得J(X)最大的X中的每列向量是圖像協方差矩陣G的前d個最大特征值對應的特征向量,即:
{X1,X2,…,Xd}=arg maxJ(X)
下面對基于CSGT 和2DPCA 的人臉識別算法的算法流程進行描述。
步驟1將人臉庫中的所有人臉進行CSGT,并按本文提出的方案1 或方案2 進行多尺度特征融合,構造特征圖像。
步驟2將特征圖像分為訓練樣本和測試樣本兩部分。
步驟3把訓練樣本集合記為,i表示第i個人,j表示第i個人的第j幅圖像,N表示人的個數,K表示每個人包含K幅圖像。M表示訓練樣本總數。計算所有訓練樣本的平均圖像和協方差矩陣G:

對樣本協方差進行特征值分解:GXi=λi Xi,選擇前的d個最大特征值對應的特征向量X1,X2,…,Xd,令投影矩陣X=[X1,X2,…,Xd]。
步驟4將訓練樣本向投影矩陣做投影得:為訓練樣本的特征矩陣。

步驟5將測試樣本集中的樣本C向投影矩陣X做投影,得到測試樣本C的特征矩陣,D=[D(1),D(2),…,D(d)]。
步驟6采用最近鄰分類器進行分類。計算測試樣本投影特征矩陣與所有訓練樣本投影特征矩陣之間的歐式距離:

為了驗證本文提出的基于CSGT多尺度特征融合和2DPCA的人臉識別算法的有效性,本文用ORL人臉數據庫中的人臉對該算法進行測試。使用MATLABR2010a,在Pentium?Dual-Core CPU,主頻2.00 GHz,內存1.00 GHz的電腦上運行。為了易于標記,將融合方案1 和融合方案2 對應的算法分別記為 CSGT1+2DPCA、CSGT2+2DPCA。
ORL 人臉數據庫包含400 幅圖像,對應40 個人,每人10 幅圖像,圖像大小為112×92。10 幅圖像各有不同,包括細節部分不同(如戴眼鏡與不戴眼鏡),面部表情的不同,人臉姿態的不同,發型的不同等。
首先將本文所提出的算法與PCA、2DPCA、GT+2DPCA算法在識別率上進行比較。在GT+2DPCA 方法中,每幅人臉圖像經GT 后得到40 幅該人臉的幅度圖像,將40幅圖像都轉化為一維列向量,然后組成該人臉的大小為10 304×40 的特征矩陣,最后用2DPCA 方法進行降維和分類。實驗分為兩組,第一組對每個人的前5 幅圖像訓練,對后5 幅圖像進行測試。第二組實驗,對每個人的后5 幅圖像進行訓練,對前5 幅圖像進行測試。這樣訓練樣本與測試樣本數都為200,實驗中特征個數都取30。
由表1 可知本文提出的兩種CSGT+2DPCA 方法相比于PCA、2DPCA、GT+2DPCA 算法取得了更好的識別效果。與GT+2DPCA 相比識別率提高,說明了本文提出的兩種數據冗余度小、具有旋轉不變性的基于CSGT多尺度特征融合后的特征比傳統GT 特征能更好的表征人臉。特別是按融合方案二融合后的特征與原圖像有一致的大小,識別時與2DPCA 有相同的計算量,卻取得了明顯優于2DPCA 的識別率。

表1 5 種方法識別率對比結果 %
下面將本文所提出的算法與PCA、2DPCA、GT+2DPCA 算法在算法執行時間上進行比較。這里算法執行時間是指對已構造好的特征圖像或原圖像進行訓練和識別所用時間。表2 給出對200 幅圖像進行訓練,剩余200 幅圖像進行測試,特征數都取30 時,5 種方法的對比結果。由于計算機性能不同和處理圖像的不同,允許算法執行時間有小范圍的波動。

表2 算法耗時對比結果
由表2 可知本文提出的兩種CSGT+2DPCA 算法與GT+2DPCA 算法相比顯著地降低了訓練和識別所用時間。耗時降低的原因是將GT 后對應的5 個尺度、8 個方向上的幅度圖像融合后,特征矩陣大小為10 304×40,而CSGT 只采用5 個尺度上的變換,按方案1 融合后的特征圖像大小為560×92,數據量為GT 的八分之一。按方案2 融合后的特征圖像大小與原圖像一致,為112×92,數據量為GT 的四十分之一。與2DPCA 算法相比,本文算法2 在算法耗時相同的情況下,提高了識別率。
表3給出了傳統GT+2DPCA、CSGT1+2DPCA、CSGT2+2DPCA 三種方法取不同訓練樣本數時對應的識別率。由前面的實驗結果可知PCA、2DPCA 算法識別率明顯低于本文提出的算法,因此這里不再與這兩種算法作對比。實驗中選擇的訓練樣本數為2 到9 個,共8 組實驗,每次都對所選樣本進行訓練,對剩余樣本進行測試。每組實驗進行30 次,每次都隨機選取訓練樣本,對結果求平均值作為本組實驗的實驗結果。由實驗結果可知,在降低了計算復雜度、提高了識別速度的基礎上本文所提出的算法仍取得了優于GT+2DPCA 算法的識別效果。當訓練樣本數為9 時,本文提出的兩種算法識別率可以分別達到98.82%和98.88%。

表3 不同訓練樣本數對應的識別結果 %
表4 給出了本文算法與文獻[9-11]中提出的不同算法的最高識別率對比結果,數據直接引用自各相關文獻。由表4 可知,本文提出的兩種算法都取得了優于其他5 種算法的識別效果,進一步證明了本文算法的有效性。

表4 不同方法最高識別率對比結果
由以上實驗結果可知,本文算法有以下兩個優點:
(1)提高了識別率。識別率提高是因為CSGT 能從不同尺度上提取圖像的局部信息,并且在同一尺度上對各方向都有相同的濾波作用,具有旋轉不變性,對人臉在平面內發生的旋轉更具魯棒性。
(2)降低了算法執行時間。訓練和識別速度都有所提高,是因為CSGT 只在5 個尺度上進行變換,按方案1和方案2 融合后的特征圖像的數據量分別降低為GT 的八分之一和四十分之一,大幅降低了計算量。
本文提出了一種基于CSGT 與2DPCA 的人臉識別新算法,先對圖像進行CSGT,然后按照本文提出的兩種多尺度特征融合方案在變換域構造特征圖像,再用計算復雜度小的2DPCA 提取分類特征。本文提出的多尺度融合特征克服了傳統GT 數據冗余度大的缺點,與GT+2DPCA 算法相比,本文算法不但取得了更好的識別效果,而且大幅降低了計算量,提高了識別速度。將該算法與傳統的PCA、2DPCA 算法也做了對比,實驗結果也證明了該方法的可行性。
[1] Lee T S.Image representation using 2D gabor wavelet[J].IEEE Trans on PAMI,1996,18(10):959-971.
[2] Lades M,Vorbruggen J C,Buhmann J,et al.Distortion invariant object recognition in the dynamic link architecture[J].IEEE Trans on Computers,1993,42(3):300-311.
[3] Wiskott L,Fellous J M,Kuiger N,et al.Face recognition by elastic bunch graph matching[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1997,19(7):775-779.
[4] Zhang Z,Lyons M,Schuster M,et al.Comparison between geometry-based and Gabor-wavelets-based facial expression recognition using multi-layer perceptron[C]//Third IEEE International Conference Face and Gesture Recognition,1998:454-459.
[5] 孫海鵬,畢篤彥.基于局部二元模式Gabor小波變換的人臉識別[J].計算機應用與軟件,2011,28(5):247-249.
[6] 吳延海,梁文莉.基于Gabor 小波變換的ICA 人臉識別算法研究[J].微電子學與計算機,2013,30(7):141-144.
[7] 王科俊,鄒國鋒.基于子模式的Gabor特征融合的單樣本人臉識別[J].模式識別與人工智能,2013,26(1):50-54.
[8] Zhu Zhenfeng,Tang Ming,Lu Hanqing.A new robust circular Gabor based object matching by using weighted Hausdorff distance[J].Pattern Recognition Letters,2004,25(4):515-523.
[9] 王匯源.基于線性子空間及環形對稱GABOR 變換的人臉識別算法研究[D].濟南:山東大學信息科學與工程學院,2007.
[10] 王進軍,王匯源,吳小娟.基于環形對稱Gabor變換和PCA加權的人臉識別算法[J].模式識別與人工智能,2009,22(4):635-638.
[11] 王文,王匯源,張沛.基于環形對稱Gabor變換和AdaBoost算法的人臉識別[J].計算機應用與軟件,2012,29(7):6-9.
[12] 王志良,陳鋒軍,薛為民.人臉表情識別方法綜述[J].計算機應用與軟件,2003,20(12):63-66.
[13] Yang J,Zhang D,Frangi A F,et al.Two-dimensional PCA:A new approach to appearance based face representation and recognition[J].IEEE Trans on Patten Analysis and Machine Intelligence,2004,26(1):131-137.
[14] 馬曉燕,楊國勝,范秋鳳,等.基于Gabor小波和二維主元分析的人臉識別[J].計算機工程與應用,2006,42(7):55-57.
[15] 陳伏兵,陳秀宏,張生亮,等.基于模塊2DPCA 的人臉識別方法[J].中國圖像圖形學報,2006,11(4):580-585.
[16] 趙冬娟,梁久幀.融合2DPCA和模糊2DLDA的人臉識別[J].計算機應用,2011,31(2):420-422.
[17] 盧建云.基于Gabor 小波與CS-LBP 的人臉特征提取算法研究[D].重慶:重慶大學計算機學院,2010.