王甜甜,郭太良,姚劍敏,周龍沙
(1.福州大學物理與信息工程學院,福建 福州 350000;2.TCL工業研究院,廣東 深圳 518000)
責任編輯:任健男
近年來,人臉識別受到多方面的廣泛關注。它在國民經濟和人民生活等領域具有十分廣闊的應用前景。人臉識別的一個關鍵問題是人臉表征,即采取某種表示方法來表示檢測出的人臉和數據庫中的已知人臉。常用的表征方法有幾何特征、主分量分析、線性判別分析、獨立分量分析、Gabor小波變換等。Gabor小波變換最早由D.Gabor在1946 年提出的[1],后來 Daugman[2]發現二維 Gabor函數在空域和空頻域都具有解析性。
Buhmann和Lades等人[3]把Gabor特征應用在人臉識別中,將圖像上一點處的局部特征利用相應的小波系數表示,在一定程度上解決了人臉識別。傳統的Gabor小波變換從多尺度多方向提取圖像局部信息,方向選取是離散的,且計算量大。本文采取環形對稱Gabor變換,得到5幅人臉圖像,相對比40幅人臉圖像,計算量小,對人臉圖像各方向具有相同的作用和效果,也能提取人臉主要特征。
圖像經過環形Gabor變換后,維數過高,因此需要將數據維數降低,提取出主要紋理信息。本文中采用PCA降維。特征值較大的特征向量反映人臉最大差異性[4]。對濾波后的圖像進行整體降維得到整副圖像主要紋理信息,會丟失一些重要的局部信息,這些局部信息對于人臉識別有著重要的作用。為了解決上述問題,本文利用多尺度多方向獲取合適的Gabor核函數來提取出紋理特征,采用改進的分塊PCA方法,提取出人臉在每塊中的主要特征,這樣能對實際人臉的各分塊進行很好的特征描述。
環形對稱Gabor變換(Circular Symmetrical Gabor Transformation,CSGT)[5]主要用在特征分割和分類方面。CSGT有兩方面優于傳統Gabor變換(Gabor Transformation,GT[6])。首先,降低了算法復雜度。GT 每個像素映射40個變換系數,而CSGT是5尺度變化,因此只有5個變換系數;其次,CSGT在單個參數條件下濾波的方向是360°,它能夠刻畫圖像在不同方向下的特性,在人臉圖像進行濾波之后,能夠保持圖像不同方向特征而不會發生圖像紋理丟失,即旋轉不變性,傳統的GT變換需要多個參數才能描繪多個方向下的濾波效果。CSGT變換需尺度上的變換就能刻畫出人臉的特征,比GT變換更豐富,所需要的參數和計算量更少,這也是本文選擇CSGT變換的原因。Gabor小波核函數可描述為

將其中與方向有關的參數加以修改,并忽略式(1)中的最后一項,則得到的環形對稱Gabor小波核函數,可描述為


原圖像I(x,y)與式(2)進行卷積的公式為

式中:* 表示卷積運算;Gu,v(z)為不同的參數u,v下對應的CSGT核函數;Ou,v(z)為CSGT得到的特征。通過CSGT核函數可以得到5幅CSGT實部和5幅CSGT虛部矩陣。圖像經過5個頻率上的CSGT核函數后,獲取信息量過多,這些信息在人臉識別過程中造成冗余,降低人臉區分度,不利于識別,因此本文采用一種新方法(Gabor核能量)來獲取合適的濾波窗口大小,得到紋理信息描述更好的圖像特征,該方法步驟為:
1)設置步長t為1到(圖像長度/2+圖像寬度/2)/2變化;
2)將第k(k=1~5)個實部矩陣的所有像素值大小相加,得到r1;
3)提取第k個實部矩陣,并以該矩陣中心為中心,把(中心點x-圖像長度/2+t≤矩陣x坐標≤中心點x+圖像長度/2+t,中心點y-圖像寬度/2+t≤矩陣y坐標≤中心點y+圖像長度/2+t)所覆蓋的矩陣區域的像素值相加,得到r2;
4)獲取第k個虛部矩陣,重復步驟2)得到i1,重復步驟3)得到i2;
5)能量為(r1/r2)+(i1/i2)值累加5次;
6)通過設定一定閾值,判斷步驟5)得到的能量值是否達到所設定的要求,若達到則該t為適合的窗口大小的參數,利用該參數對圖像進行CSGT濾波。
將上述方法所提取的CSGT基函數的實部、虛部與原圖像進行卷積,把卷積之后的幅值作為人臉識別特征。如圖1所示為圖像采用上述方法和未采用上述方法進行CSGT濾波后實部和虛部的效果圖。

圖1 CSGT濾波后實部和虛部的效果圖
從圖1可看出,采用新方法得到合適環形對稱Gabor核窗口比用原來的濾波窗口進行濾波后的圖像在紋理上分布更清晰,特征更明顯,更能體現出人臉自身的特征,因為用新方法得到的Gabor核窗口能集中體現圖像本身主要特征。
圖像經CSGT變換提取的紋理信息是高維向量,為了利于人臉識別,需將高維空間向量轉為低維空間向量。常用的維數降低方法有主成分分析PCA(Principal Component Analysis)、線性判別式分析LDA(Linear Discriminant Analysis)[7]等。
PCA方法是由Turk和Pentlad提出的,它的基礎是Karhunen-Loeve變換(K-L 變換[8])。PCA 是通過高維圖像空間經K-L變換得到一組新的正交基,對該正交基提取主要部分生成低維空間,即人臉特征臉空間。LDA的作用是減小樣本的類內區分度,增大樣本的類間區分度。通過一定方式處理后,得到N×N樣本矩陣(N為樣本數量),該方法只通過不斷增加樣本數量來增加LDA樣本間區分度。從工程角度出發,本文只采用1張人臉圖片,樣本不多,相對于LDA而言存在小樣本問題。而PCA處理圖像過程中不存在該問題,能提取出主要特征。所以在本文中利用PCA對圖像進行降維。
通過PCA整體降維能獲取整幅圖像最顯著紋理特征,但忽略了圖像一些細節紋理,這些特征對于區分不同人臉是很重要的。本文利用分塊PCA進行人臉識別,保證人臉主要紋理信息提取。圖2所示對一幅圖像進行分塊PCA降維過程。
首先圖像平均分塊,再將每一小塊拉直成1×N矩陣,如總共分成M小塊,則拉直成為M×N矩陣,其中N表示一個小塊總的像素數,再利用PCA方法對M×N矩陣進行降維,形成M×K(K<N)矩陣,其中K表示M×N矩陣通過PCA降維后變成M×K矩陣。

圖2 分塊PCA降維過程
本文中,首先將CSGT濾波之后的樣本子圖像分成不同組,再將分組后的圖像分成大小相同的多個子塊圖像,提取圖像每一塊紋理信息。與單獨對圖像整體采用PCA獲取主要信息相比,更能抽取出圖像局部紋理特征(詳細參看第3節)。在人臉識別時,測試圖像對樣本圖像每一塊紋理信息進行對比,不會忽略圖像細節信息,對于人臉識別有著顯著作用。通過判斷測試圖像是否與樣本圖像的每一塊紋理信息匹配來進行人臉識別。這樣能較精確地識別出每一塊紋理,實現人臉識別。
人臉圖像CSGT變換是5個尺度上的變換,對于小范圍的圖像偏轉能較好地識別出圖像。在進行識別時,較遠或較近的人臉圖像會被拉伸或縮小。在適當距離內進行圖像拉伸和縮小對人臉的特征影響不是很大,因此,在實驗中,當人臉在1.5~2.5 m距離內時采用樣本圖像為2.5 m的人臉,當在3~4 m時采用樣本圖像為3 m的圖像。這樣可提高識別率,提高人臉特征紋理識別魯棒性。算法流程圖如圖3所示。

圖3 算法總流程圖
對應算法步驟為:
1)一幅樣本圖像經CSGT變換生成5幅環形Gabor濾波子圖像,相應的序號分別為1,2,3,4,5,N 幅樣本圖像生成5×N幅環形Gabor濾波子圖像,每幅排列序號也為1,2,3,4,5。如圖4 所示濾波子圖像,S1和 S2分別表示 2幅樣本圖像濾波后的子圖像。

圖4 濾波子圖像
2)將N幅樣本圖像生成的相同序號的樣本子圖像分為一組,如圖5所示,分別將S1的第一幅圖和S2的第一幅圖取出。這樣5×N幅環形Gabor濾波子圖像分為5組,每組個數為N。

圖5 提取第1幅圖
3)將每組環形Gabor濾波子圖像的每一幅圖像進行平均分塊,分塊后的圖像如圖6所示,再將分塊后的每組圖像進行PCA變換獲得對應的樣本特征臉空間Sv2,Sv3,Sv4,Sv5。

圖6 子圖像分塊
4)一幅測試圖像經過CSGT變換生成5幅環形Gabor濾波子圖像。
5)分別將5幅測試環形Gabor濾波子圖像進行分塊獲得對應測試子圖像矩陣,分別將樣本第1組圖像和測試第1幅子圖像投影到Sv1,生成樣本人臉特征空間矩陣A1和測試人臉特征空間矩陣T1,重復進行則生成樣本人臉特征空間矩陣A2,A3,A4,A5以及測試人臉特征空間矩陣T2,T3,T4,T5。
6)分別計算測試人臉特征空間與N個樣本人臉特征空間的歐幾里得距離,哪個距離最短,則判斷相似于對應樣本人臉特征空間。
CSGT變換后圖像進行分塊PCA變換,在本實驗中采用樣本圖像大小為54×54,對每幅圖像進行平均分塊,每塊大小為9×9,分成6×6塊。
實驗配置:Quad CPU,Q8200,2.33 GHz,內存2 Gbyte,Ghost XP操作系統等。
實驗結果:實驗采用FERET人臉庫中的人臉圖像進行驗證,同時采用1 280×480的攝像機采集不同距離的人臉圖像進行不同距離的識別,共采集10張樣本人臉。如圖7所示為攝像機采集的10個樣本。

圖7 樣本示例
實驗中采用的測試圖像為測試人在每段距離時拍攝的圖像,共采集 100 張測試距離為 1.5 m,2.0 m,2.5 m,3.0 m以及大于3.0 m的人臉圖像。
如圖8所示,編號A1、編號A2分別為A在1.5 m,2.0 m處不同光照下的測試圖像,但光照變化不大,編號B1為B在3.0 m時的測試圖像,該圖像嘴巴張開,有表情變化。通過對測試圖像進行灰度變換、直方圖均衡化和中值濾波等方法預處理,很好地消除光照影響。表1中的A是測試圖像在1.5 m和2.0 m下識別結果,可以看出,當光照條件變化在一定范圍內仍能識別。圖8中B1為3.0 m的圖像,并有一張人臉表情變化的圖像,由結果可知,當表情變化不大時依然能識別。圖8中的編號C1為大于3.0 m的測試圖像,由表1中C在大于3.0 m的識別率可以看出依然能夠較好的識別。圖8中的編號D1不是樣本庫中的人臉圖像,在實驗中,通過把檢測到D的面部特征與庫中對應人臉的面部特征進行比對,從而判斷出D不為人臉庫中的人臉,因此識別結果為0。

圖8 測試圖像在不同距離、不同光照、不同表情和非樣本人臉的圖片

表1 圖8的測試圖像實驗識別率
如圖9中的識別率的結果看出,GT與PCA進行人臉識別的效果最低。當測試圖像在1.5 m到2.5 m時,CSGT與PCA和CSGT與分塊PCA識別出人臉效果相當。當測試圖像在3 m以及大于3 m時,CSGT與分塊PCA結合識別的效果較好。說明將CSGT生成的環形Gabor濾波子圖像進行分塊再進行降維處理,可提取出圖像更細節的紋理,達到更好的識別率。在實驗中利用GT算法計算5尺度、8方向、40個變換系數的時間為0.025 425 s,CSGT計算5尺度方向的變換系數時間為0.009 331 s。兩者在提取特征算法上,CSGT相對而言算法復雜度更低,算法時間運行時間更短。

圖9 3種識別方法整體識別率的比較
傳統GT提取的是多方向多尺度人臉特征的冗余,傳統PCA降維方法只考慮圖像整體的特性,忽略圖像細節方面特征。因此,采用一種新方法獲取合適的CSGT核函數窗口對人臉特征進行提取,減少提取特征的冗余度,對經CSGT變換后的高維圖像先分組再用分塊PCA算法進行降維,這樣可保存空間特征點信息,有利于提取圖像一些細節信息,對識別具有不可忽略的作用。結果表明,用本文提出基于CSGT和分塊PCA的人臉識別算法,對光照、表情、姿態等變化具有一定魯棒性,識別效果有了很大提高。
[1]GABOR D.Theory of communication[J].Journal of the Institution of E-lectrical Engineers- Part III:Radio and Communication Engineering,1946,93(26):429-459.
[2]DAUGMAN J G.Two-dimensional spectral analysis of cortical receptive field of profile[J].Vision Research,1980,20(10):847-856.
[3]BUHMANN J,LANG J,MALSBURG C.Distortion invariant object recognition by matching hierar-chically labeled graphs[EB/OL].[2012-10-20].http://www.researchgate.net/publication/224740138_Distortion_invariant_object_recognition_by_matching_hierarchically_labeled_graphs?ev=prf_cit.
[4]王巖紅,李登輝,孫希延.視頻監控系統中基PCA算法的人臉識別[J].電視技術,2012,36(1):111-113.
[5]LIU Chengjun,WECHSLER H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition[J].IEEE Transactions on Image Processing,2002,11(4):467-472.
[6]ZHANG Jianguo,TAN Tieniu,MA Li.Invariant texture segmentation via circular Gabor filters[EB/OL].[2012-10-20].http://ieeexplore.ieee.org/xpl/articleDetails.jsp?tp= &arnumber=1048450&queryText%3DInvariant+texture+segmentation+via+circular+Gabor+filters.
[7]YU Hua,YANG Jie.2D direct LDA algorithm for high-dimensional data with application to face recognition[C]//Proc.Fourth IEEE International Conference on Software Engineering Research,Management and Applications.Seattle,WA,USA:IEEE Press,2006:245-248.
[8]TURK M,PENTLAND A.Eigenfaces for recognition[J].Cognitive Neuro science,1991,3(1):71-86.