董九玲,賴惠成,楊 敏,許 偉
(新疆大學 信息科學與工程學院,新疆 烏魯木齊 830046)
基于圖像去模糊的改進Gabor與LSSVM的人臉識別
董九玲,賴惠成,楊 敏,許 偉
(新疆大學 信息科學與工程學院,新疆 烏魯木齊 830046)
為有效解決人臉識別中二維Gabor的維數災難,線性鑒別分析算法(LDA)的小樣本問題和因拍攝不慎造成的圖像模糊的問題,提出一種圖像去模糊的改進Gabor和最小二乘支持向量機(LSSVM)相結合的新算法。首先用約束最小二乘方(CLS)對模糊的人臉圖像去模糊,然后將DLDA和二維Gabor相融合進行降維處理,最后利用訓練速度快,泛化能力強的LSSVM進行分類識別。并通過ORL和Yale人臉庫來做對比驗證,證明了此方法的高效性。
Gabor特征;DLDA;LSSVM; CLS;人臉識別
隨著信息智能化的發展人臉的自動化識別(face recognition)技術也得到了完善和提高[1-3]。該技術應用在身份認證、視頻監控、公共安全等領域。而且由于人臉的唯一性使得它比指紋、虹膜等其他生物特征作為個人身份的鑒別更具有直接、方便的特性。但是由于人臉的復雜性、多姿態、多表情和拍攝時造成的模糊性等因素,使得人臉識別的效率還很難達到零誤差的識別。所以研究如何進一步提高人臉識別的準確率、速率和穩定性具有較好的現實意義和使用價值。
針對拍攝時造成人臉圖像的模糊和噪聲的干擾問題,本文利用約束最小二乘方濾波法[4-5]使原圖像復原,從而保證了特征提取的高效性。Gabor濾波器可以從多方向、多尺度來獲得人臉圖像的局部特征和對光照變化、人臉姿態的不敏感。但是得到的人臉Gabor特征向量的維數很高,使得數據的處理變得很復雜,為了解決此問題本文把Gabor和直接線性鑒別分析(DLDA)相融合,使得Gabor處理后的向量的維數大大降低,而且DLDA還彌補了線性鑒別分析算法[6-7](LDA)小樣本問題的缺陷。因此,此算法大大提高了人臉的識別率。
人臉自動識別的另一關鍵問題是分類標準,常用的主要有BP網、K階近鄰、SVM、歐氏距離等。K階近鄰和歐氏距離雖然計算方便但其誤差較大;BP網在訓練時達到最小值的時間長,易掉進局部的極小值,而且還存在過學習和欠學習等缺陷[8-10];SVM雖然在泛化方面的能力強,也不需先驗知識但訓練的速度慢。所以本文選擇了SVM的改進的方法LSSVM[11],它有效地避免了BP網的過擬合現象和SVM的訓練速度慢等弱點,從而提高了人臉識別的效率和速率。
1.1 二維 Gabor變換算法
Gabor變換被Daugman等人首次運用在二維空間,它在時域和頻域上都具有良好的分辨能力而且在頻域中可以從不同方向和尺度上提取圖像的紋理特征。由于2DGabor濾波器[12-15]是由類似高斯函數形狀的波組成的,所以它對圖像的形狀變化、光照強度、角度等因素具有不敏感性,使得它在紋理識別方面具有良好的識別效果。它的核函數定義式是

(1)

將Gabor內核和它的變換做卷積


Gabor的相位信息易出現周期性的變化,所以不穩定,一般不予以采用,而它的幅值信息一般穩定平滑,所以可利用。本文將按照圖像的輸入順序依次和每個濾波器做卷積,并將得到的圖像幅值信息當作輸出。即
(2)


圖1 一幅圖像處理后的幅值信息
由圖1知,當位置改變時,與灰度人臉圖像相比較,可知圖像幅度信息沒有較大的改變。說明Gabor特征能在方向上很好地選取和空間中的部分性,而且對不同的光照、不同的姿態具有較好的穩定性,對對齊誤差和器官的定位也具有更大的容忍性。
1.2 DLDA算法原理
線性判別分析(Linear Discriminant Analysis, LDA)是一種基于Fisher準則的特征提取的監督型模式分類方法。它利用投影方法使難分類的高維樣本投射到低維空間,使得投影后的點同類之間距離較小,不同種類間的距離較大。其實質是尋找一個最好的投射向量,使之容易找到全局最好的解。但它有自身的局限性:1)在對數據處理時,通常假設數據服從高斯分布,可實際數據并非都服從高斯分布,那么此時的分類效果就會較差;2)其決定因數是樣本中心而不是樣本的方差,且存在小樣本問題。由于LDA的上述缺點本文選擇既能使類內矩陣單位化又能使類間矩陣對角化的算法DLDA用來實現數據的降維處理。其算法步驟如下:
假設所用的樣本訓練集為式(3)表示,樣本不同種類的個數為c,第j類中的樣本數為Nj,各類模式的樣本平均值為μi,樣本總均值為μ0第i類中的第j個樣本是Vj,類Vi中的樣本個數是Ni,Sw為同種類內散布矩陣,Sb為不同種類之間散布矩陣,φ為最佳投影矩陣。
Q=(q1,q2,…,qk) ,Q?Rn×m
(3)
第一步:計算訓練樣本的均值
(4)
第二步:平均臉和每張訓練人臉圖的差值
(5)
第三步:創建重要的協方差矩陣,然后求出此矩陣中最重要的信息即它的特征向量和特征值
(6)
因為Sb的零空間沒有有用的分類信息,所以去掉對角陣中等于零或接近零的特征值。即VTSbV=∧VTV=I。∧為降序排列的對角化矩陣。Y是V前的m列向量(n×m),即YTSbY=Db,Db是∧的m×m的子矩陣。


2.1 約束最小二乘方原理
在實際的圖像去模糊中通常原始圖像和噪聲的功率譜是未知的,而且它們的信噪比一般沒有合適的解,在上述情況下維納濾波和逆濾波的效果不佳,為了解決上述的不穩定性,本文選擇最小二乘方濾波法進行圖像的去模糊和濾噪,在最小二乘約束去模糊中,欲使函數最小化,關鍵是得到一個最好的f估計值。在此前提下,可把不清楚的圖像問題轉化為對f的估計求式(5)目標泛函數最小值的問題。
(7)
式中:L一般選擇拉普拉斯算子,是對原圖的估計進行某些線性操作的矩陣。λ是拉格朗日乘子,欲使式(7)最小則對式(7)求導并等0,即可求出最小二乘解f的估計值。
(8)
為了易求出式(8)的解則對其實行FFT運算之后再求,變換后的公式為
(9)
通過調整r=1/λ的值,可使得約束最小二乘濾波器達到較好的去模糊效果。其中H(u,v)的共軛是H*(u,v),g(x,y)和h(x,y)經過二維傅里葉變換后分別為G(u,v)與H(u,v)。噪聲和信號的功率譜密度分別為Sn(u,v)和Sf(u,v),該算法可以自動抑制噪聲的放大,但是它卻使低頻段中偏高的頻率成分增強了,通常情況下在信號的高頻譜區,信噪比較小,噪聲項一般包含在高頻范圍中,因此噪聲被濾波器所抑制,但與此同時,它也使得一些有用的高頻細節丟失,在低頻譜區信噪比很高時,濾波器接近于反向濾波器的效果使小細節被增強。通常r在0~1之間取值,但實驗證明其在信噪比較高時r一般在0.1~0.4之間取值效果最佳。此方法去圖像模糊的效果圖如圖2所示。

a模糊圖像 b去模糊后的圖圖2 模糊圖像處理前后對比
SVM分類器由于在工作時無需先驗證知識,泛化能力強等優點所以被廣泛應用于各個領域,尤其是在模式識別中,對于解決具有維數高的非線性的和樣本少的問題效果更為明顯。但它在訓練樣本時所需時間長,針對此缺陷本文采用LSSVM法,其計算過程如下:
第一步:建立一個分類的函數設一訓練集為(xi,yi),i=1, 2,…,l,x∈Rd,y∈R,偏置量為b,權值向量為w,則LSSVM在維數高的樣本中的線性函數是
f(x)=wT·φ(x)+b
(10)
第二步:根據結構風險最小化原理建立目標函數設分類誤差為ξ正則化參變量為r。
(11)
限制條件為
yi=φ(xi)ω+b+ξi,i=1,2,…,l
(12)
式中:‖ω‖2用來控制模型的復雜度;c為正則化的參數;ξi表示松弛因子。
第三步:LSSVM優化對應的拉格朗日函數為:

(13)
式中:ai(i=1,2,…,l)是拉格朗日乘子。對上面的式子求偏導,并且將結果設置為0,高維計算的問題可以轉化為求解線性方程組的問題。
(14)
式中:e=[1,1,…,1];Y=[y1,y2,…,yi] ;Ωij=K(xi,yj),最后得出非線性的回歸模型
(15)
第四步:選擇最佳的核函數,若使用徑向基函數作為核函數則LSSVM的分類決策函數為
(16)
徑向基核函數的寬度參數為σ,LSSVM的懲罰參數和核函數的值選擇什么可以直接影響到預測結果的準確度,然而,需要解決的難題是怎樣能找到合適的懲罰參數和核函數的值。
1)圖像預處理:在采集人臉圖像時可能會由于光學系統的配置、相機對焦不準、人手的抖動、光線的強弱等因素造成的人臉圖像的模糊不清或噪聲的污染,從而會導致人臉識別率的降低,為了盡可能的避免這種原因造成的干擾,在進行人臉識別之前先對其進行約束最小二乘法去模糊處理。
2)Gabor特征提取:將人臉的圖像分別與40個Gabor濾波器進行卷積運算,即可得到人臉圖像的Gabor幅值特征,但所得到的Gabor特征矢量維數可高達40×圖像的分辨率維,在Gabor特征相鄰信息中有相當多的冗余信息。
3)DLDA降維處理:把上步得到的高維人臉Gabor特征矢量進行DLDA數據降維處理,消除冗余特征,大大節約了存儲空間提高了人臉識別速率。DLDA算法相比LDA算法不僅克服了小樣本的缺點而且它還使同類之間的離散度矩陣的零空間保存下來同時刪掉了不同類之間的離散矩陣。
4)LSSVM訓練分類:數據經過DLDA運算后得到的最佳投影矩陣作為LSSVM的輸入,選擇合適的核函數和參數并計算出每個支持向量機的最優決策函數值,最后把待測人臉圖像經過相同變換后輸入到LSSVM中得到40個決策值,把每個決策值做統計,最后票數最多的類就是樣本的類別。本文算法Gabor+DLDA+LSSVM具體過程如圖3所示。

圖3 Gabor+DLDA+LSSVM的流程
5.1 實驗數據庫簡介
為了驗證本文算法的高效性和廣泛性,本文分別選擇了兩種不同的人臉數據庫進行實驗驗證。一種是被英國劍橋大學所收集的并且在國際上通用的標準ORL人臉庫,此圖像庫中包含400幅人臉圖像,其中有40個不同類型的人,每類人有10種不同的表情。它們的面部表情各不相同,有哭或不哭,是否佩戴眼鏡,人臉的朝向不同,每幅圖像的分辨率是112×92;灰度等級為256,它的部分人臉如圖4所示。另一種是YALE標準人臉庫,此庫中共有165張圖像,其中有15個不同類型的人如男、女等,每個人又有11張不同的表情動作圖,其不同體現在光照、表情、姿態等的變化上,每幅圖像的分辨率為100×100,灰度等級為256。 YALE人臉數據庫的優點是充分考慮了現實場景下,不同光照、面部缺失和表情各異等狀態,其部分人臉圖如圖5所示。

圖4 ORL庫中的一些樣本圖

圖5 YALE庫中的部分樣本圖
5.2 實驗結果及分析
實驗條件為分別在ORL庫和YALE庫中隨機獲得每人5幅圖像當作訓練的樣本,剩余的作為測試樣本,所有仿真軟件為Matlab2012和Windows XP系統,為更充分地證明本文算法的高效性,首先仿真出PCA+SVM算法的識別率,其程序的可視化界面為圖6所示。

圖6 PCA+SVM算法的GUI(截圖)
為了比較各個算法在不同訓練樣本數目下的影響,在ORL庫中隨機抽取每一個人的1,2,…,8幅人臉圖作為訓練樣本,各算法的特征維數保持一致。圖7中PCA、Gabor+PCA方法的實驗參考結果數據來源于文獻[16]。LDA算法結果來源于文獻[7],而SVM+PCA、Gabor+ DLDA+LSSVM的數據結果是由軟件編程仿真得到的,五種方法結果對比如圖7所示。

圖7 ORL庫中每種算法在不同訓練樣本下的識別率
由圖7結果可以得出,在50次求平均的相同實驗條件下,首先在ORL庫中,本文方法對人臉的正確認知率上明顯高于其他四種算法。還可以明顯看出Gabor+PCA算法的識別率高于SVM+PCA算法。當每種訓練的圖像個數增加時,測試的圖像上識別率就隨著增加,即分類器的分類能力會隨著訓練圖像個數的增加而增強。但是當訓練的樣本數目達到一定數量時識別率趨于一種穩定狀態。
在為了驗證本算法的廣泛性,排除偶然性,在用50次求平均相同實驗條件下,使用YALE人臉庫進行實驗,得出的實驗結果如表1所示。
表1 YALE庫中每種算法在不同訓練樣本下的識別率

每類訓練樣本個數各算法的識別率/%PCALDAGabor+PCASVM+PCA本文算法130.253.161.349.364.3242.669.273.358.868.7359.481.682.263.484.8477.284.386.879.689.1580.485.990.580.390.8682.887.491.382.593.4783.990.992.883.794.9884.892.393.287.995.9
通過對上表分析可得出如下結論,可以明顯看出本方法在YALE人臉庫中對人臉的正確認識率也明顯高于其他四種算法,當訓練樣本的數目曾多時可以看出識別的正確率也會相應的提高。通過兩個人臉庫的驗證結果可以說明本文方法具有穩定性和廣泛性。對比在表1和圖7中的同一種方法的不同識別率可知,在ORL人臉庫中的識別率普遍高于YALE中的。這是因為在YALE庫中的人臉受光照、表情的影響比ORL中的稍高。
本文首先針對人臉圖像在拍攝、傳輸、存儲的過程中導致的人臉圖像的模糊問題,提出了利用約束最小二乘法對被退化的圖像進行去噪和去模糊處理,從而有助于Gabor算法對人臉主要特征的獲得。其次針對Gabor算法在對人臉特征進行提取后,存在的維度災難問題和LDA算法存在的小樣本問題,本算法采用對多姿態、不同強度的光照具有一定的穩定性和良好的方向選擇性和空間局部性,能很好地描述圖像的紋理信息的Gabor與DLDA相融合,正好彌補了上述兩種算法的缺陷,從而很好地提高了人臉識別率。最后針對神經網絡存在的過學習和欠學習現狀、SVM的收斂速度緩慢等缺點,本算法利用LSSVM作為分類器。實驗結果證明本文提出的研究方法比其他四種方法具有較高的識別率。
[1] GUPTA S, SAHOO O P, GOEL A, et al. A new optimized approach to face recognition using eigenfaces[J]. Global Journal of Computer Science and Technology,2010,10(1):15-17.
[2] YAN Y,ZHANG Y J.1D correlation filter based class-dependence feature analysis for face recognition[J].Pattern Recognition,2008,41(12):3834-3841.
[3] LIAO S, SHEN D, CHUNG A C S. A markov random field groupwise registration framework for face recognition[J]. IEEE Trans. Pattern Analysis & Machine Intelligence,2014,36(4):657-669.
[4] 肖宿,韓國強. 基于變量分離和加權最小二乘法的圖像復原[J].計算機應用研究,2012,29(4):1584-1587.
[5] VASKELAINEN L I. Constrained least-squares optimization in conformal array antenna synthesis[J]. IEEE Trans. Antennas & Propagation, 2007,55(3):859 - 867.
[6] OUYANG A,LI K,ZHOU X,et al. Improved LDA and LVQ for face recognition[J]. Applied Mathematics & Information Science,2014,8(1L): 301-309.
[7] 周維芳,趙玉剛,王世亮,等. 基于Gabor小波和LDA的人臉識別算法研究[J]. 電視技術, 2011,35(23):118-120.
[8] HO H T, CHELLAPPA R. Pose-invariant face recognition using Markov random fields[J]. IEEE Trans. Image Processing,2013,22(4): 1573-1584.
[9] YANG S S,SIU S,HO C L. Analysis of the initial values in split-complex backpropagation algorithm[J]. Neural Networks,2008,19(9):1564-1573.
[10] ZAIED M,SAID S,JEMAI O,et al. A novel approach for face recognition based on fast learning algorithm and wavelet network theory[J]. International Journal of Wavelets, Multiresolution and Information Processing, 2011, 9(6): 923-945.
[11] 薛濤,劉瀟瀟,張海兵. 基于Gabor特征融合和LSSVM的人臉識別算法[J]. 計算機應用與軟件, 2014,31(7):191-194.
[12] WANG F,DU M. A new Gabor feature extraction method for face recognition [J]. Journal of South China University of Technology :Natural Science Edition,2004,32(8): 5-8.
[13] LIN K Z, XU Y, ZHONG Y, et al. Using Kernel Discriminant Analysis and 2D Gabor Local Features Fusion for Face Recognition.[J]. International Journal of Digital Content Technology & Its Applications,2010,4(8):232-241.
[14] 朱偉濤,劉士榮. 基于二維Gabor小波和支持向量機的人臉識別[J]. 杭州電子科技大學學報,2009, 29(6):53-56.
[15] ZHUANG D W,ZHOU D L,WANG X B,et al. Face recognition from single sample per class based on Gabor filtering[J]. Application Research of Computers,2009,26(6):2379-2382.
[16] 田玉敏,云艷娥,馬天駿.判別近鄰保持嵌入人臉別[J].西安電子科技大學學報:自然科學版,2011,38(3):24-29.
董九玲(1986— ),女,碩士生,主研圖像處理、人臉識別;
賴惠成(1963— ),教授,主研模式識別、圖像處理;
楊 敏(1990— ),碩士生,主研圖像處理、人臉檢測;
許 偉(1987— ),碩士,主研圖像處理。
責任編輯:哈宏疆
Face Recognition Method with Improved Gabor and Lssvm Based on Image Blur
DONG Jiuling, LAI Huicheng, YANG Min, XU Wei
(SchoolofInformationScienceandEngineering,XinjiangUniversity,Urumqi830046,China)
In order to effectively solve the problems of curse dimensionality of 2D Gabor, the small sample size of LDA and image blurring due to accidentally shooting in the face recognition, a new algorithm is proposed based on improved Gabor and LSSVM . The improved Gabor solved the problem of deblurring image. First the blurred facial image is dealed with constrained least squares, then reducing the dimensionality of the feature space is done by fusion of DLDA and 2D Gabor.Because the LSSVM has the advantage of fast training speed and strong generalization ability. Finally, we use the LSSVM for classification and recognition. The efficiency of the proposed method is demonstrated by comparative verification of the Yale and ORL face database
Gabor wavelets; DLDA; LSSVM; constrained least squares methods; face recognition
新疆維吾爾自治區科學基金項目(2015211C257)
TP391
A
10.16280/j.videoe.2015.24.026
2015-06-16
【本文獻信息】董九玲,賴惠成,楊敏,等.基于圖像去模糊的改進Gabor與LSSVM的人臉識別[J].電視技術,2015,39(24).