雷明軍,彭進業,馮曉毅
(西北工業大學 電子信息學院,陜西 西安 710129)
改進SRC算法在人臉識別中的應用
雷明軍,彭進業,馮曉毅
(西北工業大學 電子信息學院,陜西 西安 710129)
稀疏表示分類算法(Sparse Representation-based Classification,SRC)在人臉數據庫上有很高的識別性能。然而,對于姿態變化,SRC的識別效果并不理想。針對SRC算法不能解決測試樣本與訓練樣本存在偏移誤差的問題,本文提出了基于SRC的改進算法。該算法將每一類的訓練樣本單獨作為訓練字典,利用迭代校正和基于金字塔分層機構的運動偏移估計方法得到最終的偏移量,最后對校正后的測試樣本使用SRC算法實現分類。實驗結果表明該方法對于有偏移誤差的人臉圖像具有較好的魯棒性及識別率。
SRC;人臉識別;迭代校正;運動偏移估計
基于圖像的人臉識別技術是近年來計算機視覺領域研究熱點之一,人臉識別技術利用從人臉圖像中提取出有效特征信息,與數據庫中的已知人臉信息進行匹配,計算出待測試人臉的特征與數據庫中哪一類人臉最相近,從而鑒別個人身份。現有多數人臉識別算法主要基于統計學習理論,利用大量訓練樣本來學習人臉分類器,根據得到的分類器模型進行人臉識別。
稀疏表示人臉識別算法(簡稱“SRC方法”)是近年來新出現的一個比較有效的人臉識別算法[1]。它假設任一張人臉圖像都可以用同一個人訓練樣本的線性組合來表示,通過尋找測試樣本相對于整個訓練集的稀疏表示系數來發現測試圖像所屬的用戶身份。借助于先進的高維凸優化技術(如L1范數最小化[2]),稀疏表示系數可以被精確穩定地恢復出來,解的精度和魯棒性都有理論上的保證。與現有多數方法相比,SRC方法直接利用了高維數據分布的基本特性(即“稀疏性”)進行統計推斷,可以有效地應對維數災難問題。同時,SRC方法直接利用原始像素進行人臉識別,可以有效地避免各種預處理過程。通過選擇合適的訓練圖像(不同光照和表情)并利用稀疏信號對損毀像素建模,SRC方法可以有效地應對光照變化、表情變化、局部遮擋等問題,具有良好的魯棒性。但是,現有SRC方法要求測試圖像和訓練圖像嚴格對齊,姿態變化會引起人臉圖像產生對齊誤差,降低SRC方法的識別性能。姿態問題已經成為SRC方法走向實用必須解決的一個主要問題。
第 i類訓練樣本按列排列表示成矩陣 Ai,Ai=[vi,1,vi,2,…,vi,ni]∈Rm×ni。 其中 vi,j表示第 i類目標的第 j個樣本,對于一幅w×h 的灰度圖像 vi,j∈Rm(m=wh)。 根據線性子空間原理,如果第i類樣本足夠多,那么第i類測試樣本y可以寫成:

A表示k類目標的所有訓練樣本所組成的矩陣。將測試樣本y擴展到用所有訓練樣本進行線性表示,則表示式如下:

其中,x0=[0,…,0,αi,1,αi,2,…,αi,ni,0,…,0]T是系數向量,x0中只有和y同一類的訓練樣本所對應的系數是非零值,而其他系數均為零值。當訓練集的樣本總數遠大于第i類訓練樣本的個數,則是稀疏的。由于y=Ax通常是欠定系統,因此,方程y=Ax的解是不唯一的,由于要求所求的x是稀疏的,由壓縮感知原理可知,問題可以轉換為求解lo范數最小化問題,模型如下:

其中,‖·‖0表示lo范數,表示向量中非零元素的個數。然而此模型屬于非凸優化模型,求解是一個NP問題,近年來在稀疏表示和壓縮感知領域的研究表明,如果x足夠稀疏,那么lo范數最優化問題等效于下面的l1范數最小化問題:

如果測試樣本包含輕微污損(含噪聲或局部遮擋),可以通過求解x和e的最小范數問題,實現正確的分類,該算法的模型為下式:

在測試圖像與訓練圖像沒有對齊的情況下,測試樣本不能用訓練樣本稀疏表示。但是,可以對測試樣本先校正,再對校正后的測試樣本求解稀疏表示。算法模型如式(1):

其中,y是原始圖像,τ是仿射變換參數,T(·)是仿射變換算子。T(y,τ)表示測試樣本y經過仿射變換與訓練樣本對齊后的圖像。當τ未知時,要同時最優化x、e和τ是一個非凸的最優化問題。如果用戶自己設定的初始值τ求解問題(1),測試圖像y可能會與非同類的訓練樣本形成校正的趨勢,從而陷入局部最小值,最終得到的x和e不是全局最優的。為了避免陷入局部最小值,本算法將每一類用戶的訓練圖像單獨用作訓練字典,算法模型變為式(2):

其中k表示訓練圖像中的種類。在模型(2)中,由于只使用一類用戶的圖像作為訓練樣本,所以只需使e最稀疏化,而不必使x稀疏化。
假設測試樣本與訓練樣本只存在微小的平移偏差,則可以通過一階泰勒展開式來近似校正后的測試圖像:

其中,Yx是圖像y水平方向的一階導數,Yy表示圖像y豎直方向的一階導數。所以對于只有較小偏移的測試樣本可以將模型(3)改寫成(4)。偏移量較大時,可以不斷迭代將上述過程,同時更新校正后的測試樣本,每次迭代都能得到相對偏移量Δτ,直到Δτ收斂停止迭代。再將每次得到的相對偏移量累加,最終得到原始的測試樣本相對于同類訓練樣本偏移量。

將模型(4)寫成如下形式:

其中,

因此問題(5)轉成經典的范數最小化問題:

由于圖像的維度很大,計算復雜度很高。因此,對式(6)等號左右兩邊同時乘以隨機投影矩陣R,以降低維度。因此問題(6)轉換為:



求出測試樣本相對于不同的訓練樣本的仿射變換參數τi后,利用式(9)求解原始測試樣本相對于校正后的不同類型的訓練樣本的誤差e。當訓練樣本矩陣Ai與測試樣本同類時,測試樣本y可以用同類校正后的訓練樣本線性表示,則e主要是噪聲所引起的誤差,所以e的模值最小。但是,當訓練樣本矩陣Ai與測試樣本不同類時,測試樣本不會與非同類的經仿射變換后的訓練樣本對齊,測試樣本不能用這樣的訓練樣本線性表示,e不僅包含噪聲,還包含由于未對齊所導致的誤差,所以e的模值較大。因此可以通過比較不同類的訓練樣本矩陣Ai所對應的e的模值的大小來對測試樣本進行分類,如式(10)。

總結文中改進算法步驟如表1所示。
實驗選擇目前常用的Extended Yale B人臉數據庫作為實驗數據集。然后將本文提出的改進方法與SRC方法,文獻[3]的算法在該數據庫下進行比較。本實驗是在MATLAB R2007b平臺下完成,PC機配置為2.0 GHz,1 G內存。
本實驗隨機選取了10個人的人臉圖像作為實驗數據,并且對每類人臉隨機選取30幅圖像作為訓練樣本,再在剩余的圖像中隨機選取15幅圖像作為測試樣本,并采用雙線性插值法將所選的樣本圖像都歸一化至9684(單位:像素)的尺寸。因此,本實驗中一共有300幅訓練圖像和150幅測試圖像。
為了公平比較,將本文的算法、SRC算法和文獻[3]的算法都采用隨機臉特征,用隨機矩陣將人臉圖像投影至150維(d=150)的低維特征空間。對于特征臉識別方法也將人臉圖

表1 改進的SRC算法步驟Tab.1 Improved SRC algorithm steps
像降維到150維的特征臉空間。
實驗結果如表2所示,為了使比較更加直觀,采用折線圖2展現出來。

表2 識別結果比較Tab.2 Comparison of recognition results

圖1 識別結果圖Fig.1 Recognition results map
從圖1實驗結果可以看出,在測試樣本和訓練樣本對齊的情況下(偏移值等于零),SRC的識別率最高,但是隨著偏移誤量的增大,識別率急劇下降。說明了SRC對圖像平移十分敏感,魯棒性差。本文方法與文獻[3]的方法,明顯優于SRC方法,識別率和魯棒性得到明顯的改善。但是,本文提出的方法的識別率比起文獻[3]的方法又略高一籌。
針對SRC算法的不能解決測試樣本與訓練樣本存在偏移誤差的問題,提出了基于SRC的改進算法。該算法利用迭代校正的方法得到每一次校正的偏移量,直到迭代停止,將每次的偏移結果累加就是最終的偏移量。估計當前測試樣本與校正樣本的偏移量的過程中,使用了基于金字塔分層機構的運動偏移估計方法。為了避免求出的稀疏解偏向于非同類的訓練樣本,而收斂到局部最小值的情況,這里只將每一類的訓練樣本單獨作為訓練字典。最后對校正后的測試樣本使用SRC算法實現分類。實驗結果表明該方法對于有偏移誤差的圖像具有較好的魯棒性,識別性能良好。
[1]周激流,張曄.人臉識別理論研究進展[J].計算機輔助設計與圖形學學報,1999,11(2):180-184.
ZHOU Ji-liu,ZHANG Ye.Face recognition theory research progress[J].Computer Aided Design and Computer Graphics,1999,11(2):180-184.
[2]Hong Z Q.Algebraic feature extraction of image for recognition[J].Pattern Recognition,1991,24(3):211-219.
[3]HuangJ,HuangX,MetaxasD.Simultaneousimagetransformation and sparse represen-tation recovery[J].In CVPR,2008.
[4]Lades M,Vorbuggen J,Buhumann J C,et al.Distortion invariant object recognition in the dynamic link architecture[J].IEEE Transactions on Computers,1993,42(3):300-311.
[5]Samaria F.Face recognition using hidden markov models[M].Ph.Dthesis, University of Cambridge,1994.
[6]Yuile A L.Deformable templates for face recognition[J].Journal of Cognitive Neuroscience,1991,3(1):59-70.
[7]Liu C J,Wechsler H.Comparative assessment of independent component analysis(ICA) for face recognition[C]//Int.Conf.on Audio and Video Based Biometric Person Authentication,1999.
[8]Moghaddam B.Principal manifolds and Bayesian subspaces for visual recognition[C]//Tech Report 99~35,A Mistsubish Electric Research Lab,1999.
[9]Wright,Yang A,Ganesh A,et al.Robust face recognition via sparse representation [C]//IEEE Transactions on Pattern Analysis and Machine Intelligence,2007.
[10]Wagner A,Wright J,Ganesh A,et al.Towards a practical face recognition system:Robust registration and illumination via sparse representation [C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Miami, USA:IEEE Computer Society,2009:597-604.
[11]Bergen J,Anandan P,Hanna K,et al. Hingorani.Hierarchical model-based motion estimation[J].In Proceedings of ECCV,1992:237-252.
Application of a kind of improved SRC algorithm in face recognition
LEI Ming-jun, PENG Jin-ye, FENG Xiao-yi
(Dept.of Electronics and Information, Northwestern Polytechnical University, Xi’an 710129, China)
Sparse representation of classification algorithm has high identification performance on the face database.However,because of the attitude changes,SRC recognition effect is not ideal.Because the SRC algorithm can not solve the offset error problem between test samples and the training samples,this paper puts forward the improved algorithm based on SRC.The algorithm regards each type of training samples as training dictionary individually and get the final offset using the iterative correction and based on the Pyramid layered motion offset estimation method,finally using SRC algorithm classified the corrected test samples.The experimental results show that this method for face images with offset error performs better robustness and the identification rate.
SRC;face recognition;iterative correction;motion estimation
TP312
A
1674-6236(2013)04-0137-03
2012-10-07稿件編號201210015
國家自然科學基金資助(61075014)
雷明軍(1986—),男,湖南常德人,碩士。研究方向:圖像信息處理。