陳海霞,崔 茜
(1.通化師范學院物理學院,吉林 通化 134002;2.國家知識產權局專利局專利審查協作天津中心,天津 300304)
基于Gabor小波和PCA的人臉識別
陳海霞1,崔 茜2
(1.通化師范學院物理學院,吉林 通化 134002;2.國家知識產權局專利局專利審查協作天津中心,天津 300304)
針對人臉識別中采集到的圖像由于受光照、表情變化、臉部部分遮擋等因素影響而導致識別率低的問題,將Gabor小波多尺度、多方向的濾波特性和主成分分析(PCA)的降維特性相結合,提出一種對臉部整體特征進行提取的GPCA算法.通過將該算法應用于ORL人臉庫、Yale人臉庫和AR人臉庫中的人臉識別,證明了該方法的有效性.
人臉識別;Gabor小波;PCA;GPCA
人臉識別作為生物特征識別技術(指紋識別、掌紋識別、語音識別、虹膜識別等)之一,以其可采集性高、易于接受等特點被廣泛應用于國家安防、身份鑒定和人機交互等系統中[1-2].
20世紀90年代以來,人臉識別技術迅速發展,涌現了一批人臉識別代表算法和可供評測的標準人臉庫.這些識別算法大致可分為兩類[1,3]:
(1) 基于幾何特征的識別方法.其基本思想是提取人臉面部的關鍵部位如眉毛、眼睛、鼻子、嘴巴等形狀和幾何關系作為特征進行識別[4].
(2) 基于代數特征的識別方法.將人臉看成一個整體,即一幅灰度圖像可以視為二維模式,通過數學上的統計方法找到最佳匹配.
其中比較典型的算法有基于特征臉的PCA方法、基于Fisher臉的線性判別分析(LDA)方法以及獨立元分析(ICA)方法等.
PCA方法是人臉識別中最基本也是最常見的方法,目前很多的人臉識別算法都是對這種方法的改進或與其他方法的綜合.在人臉識別過程中,這種方法考慮的是樣本整體特征,通過抽取人臉的主要成分,構建特征臉空間,對比人臉圖像進行識別.由于其降維和特征提取方面的有效性,在人臉識別領域得到廣泛應用.
受采集人臉圖像時環境光照等因素影響,傳統的代數方法很難達到較高識別率[4-5].Gabor小波變換呈現為頻率和方向的多尺度變換,并且與人類視覺感受野剖面非常相似[2,6],因此Gabor濾波器被用于提取圖像局部紋理特征或對整體圖像進行卷積得到Gabor濾波后的圖像[7-10].將Gabor統計紋理特征用于人臉識別,可以很好地消除外界環境對識別正確率的影響,具有更強的魯棒性[4].本文將Gabor小波和PCA方法結合起來,對人臉圖像進行一組Gabor小波卷積,然后通過PCA降維,完成人臉識別過程.
1946年,Gabor提出了一維的Gabor函數,此后為了進一步描述哺乳動物視覺神經元感受野,Dogmas于20世紀80年代提出了一組具有不同參數的2D Gabor 濾波器[10],這組濾波器從頻率和方向更接近人類視覺感受野[1].Gabor小波能夠很好地解決由于光照強度和人臉表情等變化引起的圖像問題,因此在人臉識別領域獲得了廣泛的應用.
2D Gabor小波定義為
(1)
其中:μ和ν分別表示Gabor濾波器的方向和尺度;z=(x,y)為圖像某一像素點坐標;‖·‖表示范數[14];σ為高斯包絡;kμ,ν控制高斯窗的寬度、震蕩部分波長以及方向,定義為
kμ,ν=kνeiφμ.
(2)
其中:kν=kmax/fυ為濾波器采樣頻率,kmax為最大頻率,fυ為限制頻域中核函數距離的間隔因子.


在圖像處理中,圖像的Gabor小波表達方法為某一圖像與公式(1)定義的Gabor核的卷積,表示為
Iμ,ν(z)=I(z)×Ψμ,ν(z).
(3)
其中:Iμ,ν(z)表示卷積后的結果;I(z)表示原圖像;Ψμ,ν(z)表示Gabor核幅值特性.為了使Gabor變換包含不同頻率、方向的信息,定義Iγ為特征矢量,那么原圖像與Gabor核卷積后的矢量可以表示為
Iγ=((I0,0)T(I0,1)T…(I4,7)T)T.
(4)
對5個不同尺度和8個方向Gabor核幅值變化與圖像分別卷積,得到40個不同參數的Gabor小波圖像,將這40個矢量通過公式(4)組合成新的矢量,然后進行PCA降維[8].圖像與Gabor小波幅值特性卷積結果見圖2.

圖1 Gabor核幅值部分

圖2 原圖像與Gabor小波幅值卷積結果
PCA方法是統計學中一個重要的分析理論,也是被廣泛使用的人臉識別方法之一[9].其方法主要是通過對協方差矩陣進行特征分解[12],以得到數據的主成分(即特征向量)與它們的權值(即特征值).將高維人臉圖像經過PCA變換投影到特征子空間,使得數據在一個低維的特征空間里被處理,減少數據冗余的同時保留原始數據的絕大部分信息,解決了數據空間維數過高所產生的計算復雜度等問題[13].
將原始二維圖像表示為一維矩陣的形式,即M個N階矩陣(N為原圖像的行乘以列),具體可以表示為:
xi=[p1…pN]T,i=1,…,M.
(5)
其中:M表示圖像個數,xi表示一維矩陣,pj表示某一像素點的值.運用PCA進行人臉識別可以分為訓練和識別過程,訓練過程流程圖如圖3所示.圖3中:Ωi=wTdi(i=1,2,…,r),w=(u1,u2,…,ur),r為特征值個數(降維后維數);A=(d1,d2,……,dM).
測試過程中,按照訓練步驟將待識別圖像投影到特征臉空間,并按照歐氏距離判別特征空間中待識別樣本與訓練樣本的相似度.
GPCA人臉識別算法是將每幅人臉圖像分別進行5個尺度、8個方向的Gabor小波變換,即假設人臉圖像可以表示為m×n維矩陣,那么對于一幅圖像與40個Gabor幅值卷積的結果可以表示為一個m×n行40列的二維矩陣,將得到的矩陣當作PCA的輸入,并按照PCA訓練識別過程進行識別.本文選用ORL,Yale和AR 3個人臉庫樣本進行算法測試.GPCA算法流程圖如圖4所示.

圖3 PCA訓練流程

圖4 GPCA算法流程圖
本文基于OpenCV視覺庫采用C++編程,對ORL人臉庫(光照不變,姿態表情變化)、Yale人臉庫(光照、姿態、表情都變化)和AR人臉庫(表情、光照、姿態變化以及有遮擋、有老化)分別進行了PCA和GPCA算法的人臉識別.ORL庫選用200個訓練樣本和200個測試樣本,Yale庫選用90個訓練樣本和75個測試樣本,AR庫選用280個訓練樣本和280個測試樣本分別進行識別.識別結果如圖5所示.

圖5 3種方法識別結果
從實驗結果可以看出,GPCA在特征維數為1的時候識別率低于PCA,但是隨著特征維數增大GPCA的識別率已經明顯好于PCA算法.可見,人臉識別中GPCA比PCA更有優勢.
[1] 崔茜. 基于Gabor小波和主成分分析的人臉識別算法研究 [D]. 長春:東北師范大學,2014.
[2] SHEN LINLIN,BAI LI. Gabor feature based face recognition using kernel methods [C]//Proceedings of the Sixth IEEE International Conference on Automatic Face and Gesture Recognition,Seoul Korea:Browse Conference Publications,2004:170-176.
[3] JIAN HUANG LAI,YUEN P C,GUO CAN FENG. Face recognition using holistic fourier invariant features [J]. Pattern Recognition,2001,34:95-109.
[4] 余磊. Gabor小波變換在人臉識別中的應用研究[D]. 重慶:重慶大學,2009.
[5] 曾岳. 人臉識別方法的研究[D].西安:西安電子科技大學,2011.
[6] LEE T S. Image representation using 2D gabor wavelets [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(10):959-971.
[7] LADES MARTIN,VORBRUGGEN J C,JOACHIM M BUHMANN,et al. Distortion invariant object recognition in the dynamic link architecture [J]. IEEE Transactions on Computers,1993,42:300-311.
[8] WU HAIYUAN,YOSHIDA YUKIO,SHIOYAMA TADAYOSHI. Optimal gabor filters for high speed face identification [J]. Proc of Int Conf on Pattern Recognition,2002(1):107-110.
[9] NEEHARIKA GUDUR,VIJAYAN ASARI. Gabor wavelet based modular PCA approach for expression and illumination invariant face recognition [C]//35thApplied Imagery and Pattern Recognition Workshop IEEE,USA:Washington DC Publications,2006:11-13.
[10] LIU CHENGJUN,WECHSLER HARRY. Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition [J]. IEEE Trans. Image Processing,2002,11(4):467-476.
[11] DAUGMAN J G. Two-dimensional spectral analysis of cortical receptive field profile [J]. Vision Research,1980,20:847-856.
[12] ABDI H,WILLIAMS L J. Principal component analysis [J]. Wiley Interdisciplinary Reviews:Computational Statistics,2010,2(4):433-459.
[13] 李文革. 基于主成分分析的人臉識別[D]. 濟南:山東大學,2008.
[14] 任芳國,高瑩. 隨機矩陣的范數[J]. 東北師大學報:自然科學版,2012,44(1):28-29.
(責任編輯:石紹慶)
Face recognition of the Gabor wavelets and PCA
CHEN Hai-xia1,CUI Qian2
(1.College of Physics,Tonghua Normal University,Tonghua 134000,China;2.Patent Examination Cooperation Tianjin Center of the Patent Office,SIPO,Tianjin 300304,China)
Aiming at the problems that face recognition rate gets low because of the influence of light conditions,facial expression and partial occlusion during face images acquisition,a method (GPCA) combining the multi-scale and multi-direction characteristic of the Gabor wavelet filters with the dimension reduction characteristic of the Principal Component Analysis (PCA) is proposed to extract the global facial features for recognition. The effectiveness of the method is proven by being applied to recognize faces from ORL,Yale and OR databases.
face recognition;Gabor wavelets;PCA;GPCA
1000-1832(2014)04-0077-04
10.11672/dbsdzk2014-04-014
2014-06-18
吉林省科技發展重點支持項目(20100458).
陳海霞(1974—),女,副教授,主要從事模式識別與信號檢測領域的理論與應用研究.
TP 391.1 [學科代碼] 520·6040
A