(西北工業大學 電子信息學院 陜西省信息獲取與處理重點實驗室, 西安 710072)
摘要:針對人臉識別是當前人工智能和模式識別的研究熱點,提出了一種組合局部Gabor濾波器組和ICA技術(簡稱LMGICA)的人臉描述方法,首先對歸一化的人臉圖像進行采樣分塊,然后對局部子塊進行多方向、多分辨率Gabor小波濾波,并提取其對應不同方向、不同尺度的多個Gabor 幅值域圖譜(local Gabor magnitude map,LGMM),接著由濾波圖像直接構建高維特征矢量;再將這些高維特征矢量通過主成分分析進行降維;最后采用ICA技術分析和提取降維后的特征矢量中的獨立成分用于識別分類。通過與經典Gabor濾波器、PCA、ICA等方法的對比實驗,驗證和評價了本方法的性能。
關鍵詞:Gabor 濾波器;主成分分析;獨立分量分析;小波變換;徑向基網絡
中圖分類號:TP39141文獻標志碼:A
文章編號:1001-3695(2008)11-3517-04
Method for face description and recognition bylocal multi-channel Gabor filters and ICA
GAO Tao,HE Ming-yi,BAI Lin
(Shaanxi Province Key Laboratory of Information Acquisition Processing, School ofElectronic Information, Northwestern Polytechnical University, Xi’an 710072, China)
Abstract:Face recognition is an active research area in the artificial intelligence.This paper proposed a new face recognition algorithm using the RBF network based on local multi-channel Gabor filters and fixed point ICA(LMGICA). The normalized face image was firstly sampled and blocked,and then the blocked face image was filtered by multi-orientation Gabor filters with multi-scale to extract their corresponding local Gabor magnitude map (LGMM), which were constructed to higher dimensional feature vectors. Next,reduced the dimensionality of these vectors by means of principal component analysis (PCA). Finally,analyzed and extracted the independent components in the resulting vectors with dimensionality were reduced by using ICA recognition classification. The experiment results demonstrate and evaluate performance of the method compared by the classic Gabor filters and PCA, ICA.
Key words:Gabor filters; PCA; ICA; wavelet transform; RBF network
0引言
人臉識別是當前人工智能和模式識別的研究熱點,廣泛應用于身份識別、護照識別、信用卡識別、攝像監視系統等領域。美國“9·11”事件后,人臉識別技術已經成為反恐的一種重要技術手段。在識別過程中,光照、表情、姿態等的變化均會影響識別效果,研究具有高穩定性和不變性的人臉特征提取方法是識別成功的關鍵。
Gabor濾波器理論最早源于Gabor D的論著[1]。J.G. Daugman將其擴展成二維形式[2],并構造了2D Gabor濾波器。它可同時獲取時頻域的最小不確定性,并與哺乳動物視網膜神經細胞的接收場模型相吻合;能夠同時兼顧空間域和頻域中對信號分析的分辨率要求,給出信號特性在兩個域中的最佳測量。Gabor變換屬于加窗傅里葉變換,Gabor函數可以在頻域不同尺度、不同方向上提取相關的特征,可以有效檢測和提取出反映人臉局部區域的頻率及方向信息的Gabor特征[3,4],是人臉圖像分析和描述中的一個有效工具。
在提取有效特征量和降維方面,目前方法基本上是采用主成分分析(principal component analysis,PCA) 技術來去除量間的冗余信息,降低維數,獲得互不相關的特征向量。但是PCA只考慮到了高維特征向量的二階統計量,無法去除高階相關性。獨立成分分析(independent component analysis ,ICA) 是一種新的基于高階統計量的數據處理方法,不僅考慮了信號的二階統計特性還考慮了高階統計特性,它能從一組觀測數據中找出隨機高階獨立分量,其性能明顯優于PCA,文獻[5,6]將其用于特征描述和分類。這些文獻中的方法基本上均是直接將二維圖像數據通過排列行或列展開的形成高維矢量再進行獨立成分分析來提取特征。這樣的特征提取不能對局部細節特征進行詳盡的描述。
基于上述對Gabor濾波器和ICA的分析,在尋找局部細節特征的描述和高維向量分析方面,本文提出了一種結合局部Gabor濾波器組和ICA技術的人臉描述方法(圖1)。RBF神經網絡是一種性能良好的前向神經網絡模型。它具有全局逼近的性質,不存在局部最小問題,且有良好的推廣能力。所以在分類中采用RBF神經網絡。
本文提出的方法有以下特點:a)對圖像的模塊化處理,便于后面的Gabor濾波器組提取局部特征,優于直接對整個圖像直接提取Gabor特征;b)利用多通道的Gabor濾波器組獲得豐富、規范的紋理測量;c)避免了對每組Gabor的幅度和相位進行分類,而是轉換為特征降維分類;d)組合PCA和ICA對高維信號進行降維,去除了多通道Gabor濾波器的類間冗余,便于后面分類。
1局部多通道Gabor濾波器特征分析
11多通道Gabor濾波器
二維Gabor 函數是經高斯函數調制的正弦柵格,在頻域上表現為一種帶通濾波器,且主頻和方向可調。Marcelja 等人[7]首先使用Gabor 濾波器來模擬視覺細胞的接收場,指出了其對信號空間頻率的局部分析能力。Daugman[2]則進一步分析了信號在空間、空間頻率和方向上的不確定聯系,得出Gabor濾波器是惟一達到時頻測不準關系下界的函數。用多通道Gabor濾波進行紋理分析有其生理學等方面的基礎。假設每一通道的數學模型為
φ(x,y)=φ2e(x,y)+φ2o(x,φy)
φ2e(x,y)=e(x,y) f(x,y)
φ2o(x,y)=o(x,y) f(x,y)(1)
其中:f(x,y)為輸入圖像;e(x,y)和o(x,y)分別為偶對稱和奇對稱的Gabor濾波器。為了簡化模型,使用各向同性的Gabor濾波器:
e(x,y,f,θ,σ)=g(x,y,σ)×cos[(2πf(x cos θ+y sin θ)]
o(x,y,f,θ,σ)=g(x,y,σ)×sin[(2πf(x cos θ+y sin θ)](2)
其中g(x,y,σ)是高斯函數:
g(x,y,σ)=(1/2πσ2) exp[-(x2+y2)/2σ2](3)
其中:f為空間頻率;θ為空間相位,σ為空間常數,它們分別是Gabor濾波器中的重要參數。奇、偶Gabor濾波器的頻率形式為
Φe(u,v,f,θ,σ)=[Φ1(u,v,f,θ,σ)+
Φ2(u,v,f,θ,σ)]/2Φo(u,v,f,θ,σ)=[Φ1(u,v,f,θ,σ)-
Φ2(u,v,f,θ,σ)]/2j(4)
其中:Φe為e的Fourier變換;j=-1,且
Φ1(u,v,f,θ,σ)=exp{-2π2σ2[(u-f cos θ)2+(v-f sin θ)2]}Φ2(u,v,f,θ,σ)=exp{-2π2σ2[(u+f cos θ)2+(v+f sin θ)2]}(5)
可以通過快速Fourier變換來求卷積
φe(x,y)=e(x,y) f(x,y)=FFT-1[F(u,v)×Φe(u,v, f,θ,σ)](6)
φo(x,y)=o(x,y) f(x,y)=FFT-1[F(u,v)×Φo(u,v, f,θ,σ)](7)
其中:F(u,v)為f(x,y)的Fourier變換。
每一個通道的Gabor濾波器對應于一個特定的空間頻率和方向。特征提取同時抽取頻率信息和方向信息;對于圖像的紋理識別,沒有必要選擇覆蓋整個頻域的濾波器參數空間[8]。 濾波器的中心頻率越小,提取的紋理特征的尺度越大。通常,中心頻率選擇為2的冪次方。在該識別算法中,選擇中心頻率為2、4、8、16、32、64。對于每個中心頻率,選擇4個相位角為0、45°、90°和135°。這樣,一共有24個Gabor濾波通道。對每個通道的濾波結果,提取其幅值作為代表該通道的特征。因此,對于每一幅輸入圖像,多通道Gabor濾波共抽取48個特征。
12多通道Gabor濾波器特征描述
取濾波器組eF(i),θ(j)(x,y)和oF(i),θ(j)(x,y)。其中:i=1,2,3,4,5,6;j=1,2,3,4。對f(x,y)進行系統濾波,最終可以一組濾波圖像的幅值AeF(i),θ(j)(x,y)和AoF(i),θ(j)(x,y)輸出,作用結果如下所示:
AeF(i),θ(j)(x,y)=abs[f(x,y) eF(i),θ(j)(x,y)](8)
AoF(i),θ(j)(x,y)=abs[f(x,y) oF(i),θ(j)(x,y)](9)
為了更方便地提取特征,將每一組濾波后的幅值圖像按行展開,形成一個行向量Ao(x,y)和Ae(i, j),最終就可得到該圖像的紋理特征A。
A=[Ae(1,1),Ae(1,2),…,Ae(6,4),Ao(1,1),Ao(1,2),…,Ao(6,4)](10)
其中:Ae(i, j)為AeF(i),θ(j)(x,y)對應的行向量;Ao(i, j)為AoF(i),θ(j)(x,y)對應的行向量。A中包含了描述f(x,y)紋理的重要信息(包含6個方向,4個尺度)。
2局部Gabor特征的獨立成分分析
21ICA技術
獨立分量法(ICA)技術正是為了解決盲源分離問題而不斷發展起來的,并成為陣列信號處理和數據分析中的有力工具。將ICA應用在盲源分離中,能夠從混合信號中重現不可觀測的源信號成分,所利用的僅僅是假設源信號統計獨立這樣一個容易滿足的先驗條件。與傳統的二階方法(如PCA)相比,ICA不僅可以去除各分量之間的一、二階相關性,同時還具有發掘并去除數據間的高階相關信息的能力,使得輸出分量相互獨立。
ICA的實質是尋求一種線性變換,將一組隨機變量表示成一組統計意義上互相獨立的變量的線性組合。它不僅考慮了信號的二階統計特性還考慮了高階統計特性。而在人臉識別問題中,許多重要信息包含在圖像信號的高階統計量中。
Manduchi等人[9]將ICA用于金字塔濾波器的輸出結果,給出了一種基于邊緣統計的紋理描述方法,并同PCA 進行比較用于紋理分類和合成實驗。Lee等人[10]發展了一種ICA 混合模型。其中模型參數是采用最大似然準則來確定的。他們使用一組由ICA 混合模型得到的基函數的線性疊加來表征特定的紋理種類,并將這種方法用于圖像的無監督分類、分割和去噪。圖2是ICA的結構圖。
22局部多通道Gabor小波特征中的獨立分量
如果對一幅圖像直接應用多通道Gabor濾波器濾波,這樣只能描述該圖像的整體的輪廓特征,不能很好地表征圖像的局部紋理特征,尤其是在人臉圖像的眼睛、嘴、鼻子等部位。所以本文提出首先將圖像分塊,找出局部Gabor小波特征。設一幅圖像為X,維數為m×n,分為p×q模塊的圖像矩陣,即
X=X11X12…X1q
X21X22…X2q
Xp1Xp2…Xpq(11)
其中:每個子圖像矩陣Xi, j是m1×n1矩陣;pm1=m,qn1=n。
將初始的人臉庫矩陣X=(x1,x2,x3,…,xL)T進行分塊,得到p×q個圖像序列,X(i, j)K=(x(i, j)1,x(i, j)2,x(i, j)3,…,x(i, j)L)T,(i=1,2,…,p;j=1,2,…,q;K=1,2,…,L)。其中X(i, j)K表示第L幅人臉圖像的子圖像,對每一個子圖像X(i, j)K進行多通道Gabor濾波器濾波,可以得到子圖像的Gabor特征A(i, j)K(i=1,2,…,p;j=1,2,…,q;K=1,2,…,L)。將每幅樣本同一位置子圖像Gabor特征A(i, j)=(A(i, j)1,A(i, j)2,A(i, j)3,…,A(i, j)L)T)看成L個隨機的觀測矢量,設每一個分量均可以由P(P≤L)個未知的獨立成分以不同的系數線性組合。
A(i, j)=AS(12)
其中:S=(s1,s2,…,sp)T;si是均值為零,方差為1的非高斯分布的獨立成分。A(i, j)是一個未知的L×P的滿秩矩陣,也稱為混合矩陣。如果以某種方法估計出混合矩陣A(i, j)時,則可有S=A-1A(i, j)=WA(i, j)。其中W=A-1,一般稱為分離矩陣。ICA的目的就在于僅根據觀測矢量A(i, j),估計出混合矩陣A和獨立成分si。設每個子圖像Gabor小波特征中的獨立分量特征系數為T(i, j),最終一幅人臉圖像表示為T=(T(1,1),T(1,2),…,T(1,q),…,T(p,q))。ICA的具體計算步驟如下:
根據信息理論,在等方差的隨機變量中,具有高斯分布的隨機變量的信息熵最大;非高斯性越強,信息熵越小。因此信息熵可作為判別非高斯性的依據。對于概率密度函數為f(y)的隨機向量y,其信息熵h(y)定義如下:
H(y)=-∫f(y)log f(y)dy(13)
負熵為
Ng(y)=H(ygauss)-H(y)(14)
其中:ygauss為與y同方差的高斯隨機變量。當隨機向量y為高斯分布時,負熵為零。
熵的計算需要知道概率密度分布函數,但后者的估計往往很困難。一種近似公式可進行非高斯性度量:
Ng(y)
[E{G(y)}-E{G(v)}]2(15)
其中G(·)可取以下非二次型函數:
G1(u)=(1/a1)log cos(a1u),a1∈[1,2](16)
G2(u)=-exp(-u2/2)(17)
G3(u)=u3(18)
令y=W TA(i, j)則有
JG(W)=[E{G(W TA(i, j))}-E{G(v)}]2(19)
其中:隨機變量v滿足標準正態分布。
根據負熵最大原理,要使JG(W)最大,由Kuhn-Tucker方法和Newton迭代法可以得到:
W*=E{A(i, j)g(W TA(i, j))}-E{g′(W TA(i, j))}W(20)
其中:g(·)為G(·)的一階導數;g′(·)為G(·)的二階導數。
3分類器設計
RBF神經網絡是一種性能良好的前向神經網絡模型,已證明其具有全局逼近的性質,且不存在局部最小問題。RBF網絡不僅具有良好的推廣能力,而且計算量少,學習速度也比其他一般算法快得多。徑向基函數網絡包括三層,即輸入層、隱層和線性輸出層。圖3為徑向基函數網絡的結構圖。
4實驗
為了驗證算法的有效性,本文采用ORL庫和YALE庫進行測試。ORL人臉庫包括40個人,每人10幅共400幅人臉圖像,具備不同的光照、表情、發型和有無眼鏡等,并且人臉有一定的側轉角度,每幅圖像均為92×112灰度圖像。YALE庫給出15個人,每人11幅共165幅人臉圖像,具備了睜眼閉眼、張口閉口,以及非常豐富的面部表情的變化,每幅圖像均為100×100灰度圖像。圖4給出了部分圖像。實驗中,取ORL庫中100幅圖像作為訓練樣本,其他的圖像作為測試樣本;YALE庫中取45幅圖像作為訓練樣本,其他圖像作為測試樣本。
最后實驗中討論了模塊化窗口大小對識別率以及速度的影響,結果如圖5所示。通過實驗結果圖5(a)所示,可以觀察得知,當窗口過大和過小識別率均會降低;當窗口為3×3和4×4時,識別率比較高,這是由于窗口越小,就陷入了局部,體現不出來整體的特征,如果窗口過大,就沒有辦法體現出局部的細節信息。圖5(b)所示,當窗口為2×2速度明顯變慢,其他窗口大小速度變化不是很明顯,這是由于在進行運算時,窗口越大,則進行Gabor濾波次數越少,矩陣計算次數減少;但是每次運算的矩陣維數越高,運算速度就會降低。總之,兩者之間相互約束,不可能單向增長或減少。在本實驗中,最終結合識別率,取窗口大小為3×3。
為了評價本文提出的方法的有效性,本文選擇了PCA、ICA、Gabor、Gabor+ICA等算法作為基準比對算法,實驗結果如表1所示。從實驗結果中可以看出,傳統的識別方案主成分分析只考慮了信號的二維統計特征,而獨立成分分析不僅考慮了信號的二階統計特性還考慮了高階統計特性,所以識別結果上獨立成分分析優于主成分分析。對原圖像進行Gabor濾波后,直接根據濾波的系數進行分類的效果明顯比對濾波后的系數進行獨立成分分析差,這是由于直接濾波系數維數較高,給后面的分類器的分類帶來了問題。本文的方法由于對圖像的模塊化處理,利用多通道的Gabor 濾波器組獲得豐富、規范的紋理測量,比直接求取Gabor特征更能體現圖像的局部特征,效果優于直接對整個圖像直接提取Gabor特征,并避免了對每組Gabor的幅度和相位進行分類,而是轉換為特征降維分類,所以識別的效果要優于其他方法。
表1不同識別策略的識別率
識別方法YEL識別率平均識別率ORL識別率
PCA0.7950.7390.767
ICA0.9070.8730.890
Gabor0.9370.8970.917
Gabor+ICA0.9650.9330.949
本文算法0.9870.9690.978
5結束語
基于對Gabor濾波器和ICA的分析,在尋找局部細節特征的描述和高維向量分析方面,本文提出了一種結合局部Gabor濾波器組和ICA技術的人臉描述方法。一方面對圖像進行模塊化處理,利用多通道的Gabor 濾波器組獲得豐富、規范的紋理測量,比直接求取Gabor特征更能體現圖像的局部特征,效果優于直接對整個圖像直接提取Gabor特征;另一方面避免了對每組Gabor的幅度和相位進行分類,而是轉換為特征降維分類。組合PCA和ICA對高維信號進行降維,去除了多通道Gabor濾波器的類間冗余,便于后面分類。通過實驗,與 PCA、ICA、Gabor特征識別、基于Gabor特征的PCA識別等算法作了比較,驗證了本文的方法在提取有效特征量和降維方面的有效性。但是在實驗中發現局部Gabor特征的幅度矢量維數較高,給計算帶了不便,在今后的工作中可以嘗試對Gabor變換后的圖像再進行特征提取處理,然后進行ICA處理。本文的圖像特征提取是基于二維圖像的一些二維的處理和變換,今后的工作中可以考慮用多方位的二維圖像獲取三維特征,以提高對個體臉表情、光照的魯棒性。今后,筆者會在更大的庫中進行實驗,以提高系統的推廣性。
參考文獻:
[1]
GABOR D.Theory of communication [J].Journal of Institute for Electrical Engineering,1946,93(3):429-457.
[2]DAUGMAN J G.Uncertainty relation for resolution in space,spatial frequency and orientation optimized by two-2 dimensional visual cortical filters[J].Journal of the Optical Society of America,1985,2(7):1160-1169.
[3]張文超,山世光,張洪明,等.基于局部Gabor變化直方圖序列的人臉描述與識別[J].軟件學報,2006,17(12):2508-2517.
[4]陳洋,王潤生.結合Gabor濾波器和ICA 技術的紋理分類方法[J].電子學報,2006,35(2):299-303.
[5]YUEN P C,LAI J H.Face representation using independent component analysis[J].Pattern Recognition,2002,35(6):1247-1257.
[6]JENSSEN R,ELTOFT T.ICA filter bank for segmentation of textured images [C]//Proc of the 4th International Symposium on Indepen-dent Component Analysis and Blind Signal Separation.Nara:[s.n.],2003.
[7]MARCELJA S.Mathematical description of the response of simple cortical cells[J].Journal of the Optical Society of America,1980,70(11):1297-1300.
[8]TAN T N.Texture edge detection by modeling visual cortical channels[J].Pattern Recognition,1995,28(9):1283-1298.
[9]MANDUCHI R,PORTILLA J.Independent component analysis of textures[C]//Proc of International Conference on Computer Vision.KerKyrs:IEEE Press,1999:1054-1060.
[10]LEE T W,LEWICKI M S.Unsupervised image classification, segmentation, and enhancement using ICA mixture models [J].IEEE Trans on Image Processing,2002,11(3):270-279.