張力+梅偉健



摘 要:協同表示算法是人臉識別中非常典型的基于線性表示的算法,該算法因其操作簡單,計算復雜度低等優點已經引起了廣泛關注。但是由于協同表示算法直接利用已有的圖像二維矩陣進行算法操作,沒有考慮圖像中像素之間的差異,浪費了一部分圖像中的有用特征。在協同表示的基礎上,提出了加入融合梯度信息的思想,同時利用水平方向上和垂直方向上的輪廓特征,達到提高算法識別率的結果。實驗表明,提出的融合梯度的協同表示算法有效優化了原始的協同表示算法的結果。
關鍵詞:人臉識別;協同表示分類;人臉輪廓特征;
中圖分類號:TP391 文獻標志碼:A
Improved Collaborative Representation Classification Algorithm Based Fusion Gradient
ZHANG Li,MEI Wei-jian
(School of Computer Science,Shaanxi Normal University,Xian,Shaanxi 710119,China)
Abstract:The collaborative representation based classification method is a typical and powerful tool applied in face recognition system.The algorithm has attracted wide attention because of its simple operation and low computational complexity.However,because the collaborative representation algorithm directly uses the existing two-dimensional image matrix,and does not take into account the differences between the pixels in the image,it wastes some of the useful features in the image.On the basis of collaborative representation,this paper puts forward the idea of adding fusion gradient information,and uses the facial contour features in horizontal direction and vertical direction to improve the recognition rate of this algorithm.Experiments show that the proposed algorithm of fusion gradient proposed in this paper can effectively optimize the result of the original collaborative representation algorithm.
Key words:face recognition;collaborative representation based classification method;facial contour features
1 引 言
目前,生物特征識別技術已經日漸改變著人類的現實生活,比如最早發展起來的指紋識別,以及目前被廣泛應用的虹膜識別。這些都是利用人類固有的生物特征來判斷該對象的身份。人臉識別也是一種典型的生物特征識別,目前人臉識別的應用已經給人類的現實生活帶來很大的便利,比如住宅區門禁系統以及企業考勤系統。但是由于人臉的采集具有不穩定性,比如采集過程中由于采集環境光照的變化,以及采集過程中人臉表情的變化,甚至采集中出現的面部遮擋(眼鏡,口罩等)等等都會給人臉識別的精確度帶來嚴重的負面影響。因此如何達到穩定的人臉識別正確率依然是目前所有研究人員關注的重點。
人臉識別研究發展至今,學者們已經提出了許多經典的人臉識別算法。其中基于稀疏表示的人臉識別算法因其顯著的魯棒性已經引起了廣泛關注[1]。稀疏算法在1范數最小化的約束下保證用最少數量的訓練樣本最好的表示測試樣本。但是由于1范數算法約束的復雜性,實際運算量極大,消耗時間過長,而現實中使用的人臉識別系統對實時性有很高的要求,所以稀疏表示算法難以滿足該要求。后來學者們在線性表示的啟發下提出了線性回歸分類算法[2],該算法利用同類樣本之間的線性表示進行分類。但是由于人臉識別系統中包含的訓練樣本有限,線性回歸算法在對訓練樣本進行線性表示時使用的基總是不完備的,這一點在很大程度上會導致識別精度不高。為了解決這個問題Zhang等人提出了協同表示算法[3],該算法使用2范數約束條件,能夠在不降低識別精度的情況下提高算法的識別效率。該算法一經提出就因其簡單易操作引起了學者們的廣泛關注,至今為止研究人員已經提出了很多基于協同表示的改進算法。比如Zhu提出了基于多尺度分塊的協同表示算法[4],該算法能夠解決訓練樣本數量不足的情況下識別正確率驟然下降的問題。Yang考慮到不同的特征在線性表示和分類時所作的貢獻是不一樣的,同時利用特征的相似性和差異對特征的線性表示進行靈活編碼,即松懈的協同表示算法[5]。另外Xu利用表示過程中樣本的貢獻差異提出了兩步分類的協同算法[6,7],該方法先從粗糙表示中挑選貢獻較大的訓練樣本再經過第二步的精細表示判斷出貢獻最大的那一類訓練樣本。
本文提出了一種融合梯度的協同表示算法。為了更好的闡述一個人臉的輪廓信息,我們同時提取人臉的水平梯度信息endprint
和垂直梯度信息,通過將這兩類信息融合到協同表示中以達到提高人臉識別正確率的結果。實驗證明,梯度信息的協同表示能夠幫助更精確的判斷測試樣本的類標。
2 協同表示算法
在人臉識別系統中,我們把已知類標的樣本叫做訓練樣本,把未知的待定類標的樣本叫做測試樣本。協同表示算法的基本思想是用人臉識別系統中已知類標的樣本的線性組合來等價表示待定類標的樣本,根據表示過程中每一類所做的貢獻大小來判斷測試樣本的類標。協同表示算法認為貢獻最大的那一類訓練樣本與測試樣本最相似。下面簡單介紹一下該算法的基本思想。
假定人臉識別系統中共有c個已注冊的對象,每一個對象有n個已采集到的人臉圖像樣本,即每一個對象包含n個訓練樣本,我們用X=[X1,X2,...,Xc]表示一個包含所有訓練樣本的矩陣,矩陣中的分塊矩陣Xi(i=1,...,c)表示第i類訓練樣本集,Xi=[xi1,xi,2,...,xin],其中xij(j=1,...,n) 是將二維圖像矩陣按照列優先的順序排列得到的列向量。我們用y表示將測試樣本的二維圖像矩陣用同種方法得到的列向量。協同表示算法構建一個線性方程,
y=XA (1)
其中,A=[a1,a2,...,ac],ai=[ai1ai2...ain]是第i類訓練樣本的表示系數。將式子(1)展開,
y=a11x11+...+a1nx1n+...ai1xi1+...+ai1xin+...+ac1xc1+...+acnxcn (2)
方程(1)的解可以由下式得出,
a=(XTX+μI)-1XTy(3)
其中μ是一個很小的正參數,I為單位矩陣,我們用式(4)表示第i類訓練樣本的總貢獻,
gi=ai1xi1+ai2xi2+...+ainxin(4)
那么,定義第i類訓練樣本的表示殘差ri=||y-gi||22。顯然某一類訓練樣本的貢獻越大,表示殘差就越小。如果rq=mini{ri},那么就判斷測試樣本y的類別標簽為q。
3 融合梯度的協同表示算法
3.1 水平梯度和垂直梯度
在這部分我們詳細介紹一下本文提出的融合梯度的協同表示算法,首先簡要介紹一下如何從原始人臉圖像中獲取梯度信息。假定二維人臉圖像矩陣為P∈Rs×t。
為了獲取人臉圖像的水平方向的梯度信息,我們依次用二維圖像矩陣的后一列減去前一列,即
V~i=Pi+1-Pi(i=1,...,t-1) ,
其中Vi表示水平梯度圖像的第i列,Pi+1 和Pi 分別表示原始圖像矩陣的第i+1 列和第i 列。下圖1是一個簡單的4×4 矩陣的水平梯度構建方式。
3.2 融合兩類梯度的協同表示算法
這部分我們簡要概述一下本文提出的融合兩類梯度的協同表示算發的基本步驟。
第一步:用原始人臉圖像獲取每一類訓練樣本在線性表示測試樣本時的表示殘差ri=||y-gi||22。詳細方法參考第2部分。
第二步:根據3.1部分的內容,獲取每一個樣本(包括所有訓練樣本和測試樣本)的水平梯度V~ 和垂直梯度V^ ,并分別將兩類梯度矩陣按照列優先的順序轉換成列向量v~和v^形式。
第三步: 用所有樣本的水平梯度列向量v~代替第2部分協同表示中的樣本x線性表示測試樣本的水平梯度列向量,同樣的計算每一類的表示殘差r~i。用所有訓練樣本的垂直梯度列向量v^代替第2部分協同表示算法中的樣本x線性表示測試樣本的垂直梯度列向量,并計算每一類的表示殘差,用r^i表示。
第四步:融合三種表示殘差,di=λ1ri+λ2r~i+λ3r^i ,其中λ1,λ2,λ3 分別是融合系數,且λ1+λ2+λ3=1,λ1>λ2, λ1>λ3。
第五步:根據最終的表示殘差分類,如果dq=min{di}(i=1,...,c),那么就判定測試樣本屬于第q類。
4 融合梯度信息的協同表示算法的實驗
為了驗證融合梯度信息的協同表示算法對于人臉識別的有效性,我們在三個常用的人臉數據庫上進行識別正確率的比較。人臉識別實驗在一個數據庫上的基本設置是在每一類人臉圖像中挑選一定數量的樣本作為訓練樣本,其余的用作測試樣本。然后用人臉識別算法判斷每一個測試樣本的類標。最后跟人臉庫中這些測試樣本的真實類標比較,得出識別正確率。為了驗證本文提出的算法的有效性,我們在每一個人臉數據庫上都進行三種人臉識別算法的實驗,分別是線性回歸分類算法、原始的協同表示分類算法和本文提出的融合梯度的協同表示算法。
4.1 融合梯度信息的協同表示算法在FERET數據庫上的實驗
FERET數據庫是由美國FERET項目創建的人臉數據庫,也是常用人臉庫中最大的人臉數據庫之一,實驗中我們選用該庫的一個子集,子集中包含來自200個志愿者的1400張人臉圖像,每一個對象提供7張圖片。在實驗前我們先將人臉圖像裁剪成40×40 大小。圖3是該人臉數據庫子集中若干對象的全部人臉圖像。實驗中分別在每一類樣本中隨機選擇3,4,5個作為訓練樣本,其余的當做測試樣本進行實驗。實驗的識別正確率結果如表1所示,我們可以看出融合梯度信息以后可以得到優于線性回歸分類和協同表示算法的正確識別率。比如,當訓練樣本個數為3時,線性回歸分類和線性表示的正確識別率分別為66.12%和52.43%,而融合梯度信息以后識別率提高到71.35%。
4.2 融合梯度信息的協同表示算法在CMU PIE數據庫上的實驗
CMU PIE數據庫也是目前常用來驗證人臉識別算法的人臉數據庫之一,它包含68個個體的41368張人臉圖像,該實驗中我們選用其中的一個子集,該子集包含由68個人提供的1632張人臉圖像,每人提供24張。在實驗前我們先將圖像裁剪為32×32大小。圖4是該數據庫中某個對象的全部人臉圖像。實驗中分別在每一類樣本中隨機選擇8,9,10個做為訓練樣本,其他的作為測試樣本來驗證算法的有效性。實驗結果如表2所示。融合了梯度的協同表示算法的正確識別率要優于其他兩種常用的基于表示的人臉識別算法。endprint
4.3 融合梯度信息的協同表示算法在ExtendedYaleB上的實驗結果
ExtendedYaleB人臉數據庫是由耶魯大學創建,38個對象提供的共2432張人臉圖像,每一個志愿者提供64張人臉圖像。這些圖像在光照上有明顯的差異。圖5是該數據庫中某一個對象的部分人臉圖像。在實驗中我們分別隨機在每一類中選擇3,4,5個人臉圖像作為訓練樣本,其他的圖像做為測試樣本進行算法的驗證。實驗結果如表3所示。
從三個數據庫上的實驗可以看出,梯度信息的協同表示對于提高人臉識別的分類正確率是有效的。一方面融合梯度的協同表示避免了線性回歸算法的不完備基帶來的一定負面影,實驗結果優于線性回歸分類算法。另一方面,根據梯度信息獲取的方法可知,文中的兩類梯度信息都包含了人臉的輪廓特征,這些特征的加入增加了人臉的可分性。所以融合梯度信息以后的協同表示算法能夠獲得比原始協同表示算法高的識別正確率。
5 結束語
在協同表示的基礎上,提出了一種融合梯度信息的算法,利用梯度信息包含的輪廓特征提高了協同表示人臉識別的正確率。實驗表明融合梯度信息以后可以得到優于線性回歸分類和協同表示算法的識別率。
參考文獻
[1] WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Trans.Pattern Anal.Mach.Int.,2009,31:210-227.
[2] NASEEM I,TOGNERI R,BENNAMOUN M.Linear regression for face recognition[J].IEEE Trans.Pattern Anal.Mach.Int,2010,32:2106-2112.
[3] ZHANG D,YANG M,FENG X.Sparse representation or collaborative representation: Which helps face recognition?[C].IEEE International Conference on Computer Vision,2011:471-478
[4] ZHU P,ZHANG L,HU Q,et al.Multi-scale patch based collaborative representation for face recognition with margin distribution optimization[M].Computer Vision.Springer Berlin Heidelberg,2012:822-835.
[5] YANG M,ZHANG D,ZHANG D,et al.Relaxed collaborative representation for pattern classification[C]// IEEE Conference on Computer Vision and Pattern Recognition.IEEE Computer Society,2012:2224-2231.
[6] XU Y,ZHANG D,YANG J,et al.A Two-Phase Test Sample Sparse Representation Method for Use With Face Recognition[J].IEEE Transactions on Circuits & Systems for Video Technology,2011,21(9):1255-1262.
[7] XU Y,ZHU X,LI Z,et al.Using the original and ‘symmetrical face training samples to perform representation based two-step face recognition[J].Pattern Recognition,2013,46(4):1151-1158.endprint