林智鵬 簡彩仁 周書偉



摘 要:人臉識別技術得到了廣泛研究與開發應用,人臉識別問題已成為模式識別和圖像處理中最熱門的研究主題之一。文中提出正則跡范數人臉識別法:利用正則跡范數改進基于表示理論的分類法。該方法通過正則跡范數平衡L1范數的稀疏性質和L2范數的聚集性。在4個公開人臉識別數據集上的實驗表明,該方法可以較好地提高人臉識別準確率。
關鍵詞:人臉識別;跡范數;分類;稀疏;聚集;圖像處理
中圖分類號:TP311;TP371文獻標識碼:A文章編號:2095-1302(2019)07-00-03
0 引 言
由于人臉的自然特性,人臉識別(Face Recognition)已經成為身份認證的重要生物特征技術,在軍事、國防、公安和日常生活等領域得到了廣泛應用。隨著大數據及計算機技術的迅速發展,人臉自動識別技術得到了廣泛研究與開發,人臉識別成為近30年模式識別和圖像處理中最熱門的研究主題之一。人臉識別的目的是從人臉圖像中抽取人的個性化特征,并以此來識別人的身份,在20世紀90年代初,人臉識別的研究隨著特征臉方法的引入而流行起來[1],人臉識別研究已經引起了科研人員的濃厚興趣,提出了諸多識別方法,并取得了較大成功[2-4],但由于人臉采樣環境的復雜性,如圖像質量不清晰、人臉表情、面部遮擋等,使得研究具有魯棒性能的人臉識別方法仍然具有重要的意義。
許多基于經典的分類方法在研究人臉識別問題上存在局限性,比如k最近鄰分類法基于歐式距離的大小分類難以克服人臉圖像數據集高維數和非線性等困難;支持向量機是一種經典的分類方法,但由于需要訓練分類器,容易造成過擬合問題。伴隨著模式識別技術的不斷發展,許多基于流形學習和稀疏表示的分類方法被提出,并且被廣泛應用于人臉識別研究中。以稀疏表示分類法為代表的基于表示理論的分類方法[5-7],利用訓練樣本表示測試樣本,充分考慮了所有樣本對分類的影響,可以在一定程度上克服人臉圖像數據的高維數和非線性等困難,不僅如此,基于表示理論的分類方法無需訓練分類器,可以避免傳統分類方法的過擬合問題,因此基于表示理論的分類方法在人臉識別、腫瘤識別等方面的研究中得到了廣泛應用。稀疏表示分類法(SRC)[5]、最小二乘回歸分類法(LSRC)[6]以及非負最小二乘回歸分類法(NNLS)[7]等都是基于表示理論的分類法,它們的區別在于正則懲罰項或約束條件的不同:稀疏表示分類法(SRC)利用L1范數的稀疏性質構建分類器,最小二乘回歸分類法(LSRC)利用L2范數的聚集性構建分類器,非負最小二乘回歸分類法(NNLS)利用表示系數的非負限制構建分類器。
本文研究了基于表示理論的人臉識別方法,借鑒文獻[8-9],跡范數可以同時保持L1范數的稀疏性質和L2范數的聚集性優點?;谯E范數的人臉識別方法通過正則跡范數保持表示系數的稀疏性和聚集性。
1 相關研究
基于稀疏表示、最小二乘回歸和最近鄰子空間準則提出了基于正則跡范數的分類法。
1.1 最小二乘回歸
假設y是未知類別標簽的人臉圖像樣本,X是已知類別標簽的人臉圖像樣本訓練集,有n個訓練樣本,m個圖像屬性,其中mn,用已知類別標簽的訓練集表示未知類別標簽的樣本。
式中xi為第i個訓練樣本,由于mn,是一個超定方程,因此求解該公式的精確解無意義,考慮如下最小二乘回歸
模型:
得到該模型的解析解:
1.2 稀疏表示
稀疏表示通常表示為如下求解稀疏系數w的問題:
式中||w||0是向量w的L0范數,表示向量w非零元素的數量。求解該問題較難,因此可將問題轉化為求解L1的問題:
式中||w||1是向量w的L1范數,即向量w非零元素絕對值的和,可以擴展為允許有噪聲的模型:
式中λ>0,是正則參數,Kim等人給出了一種快速計算稀疏表示模型的方法[10]。
1.3 最近鄰子空間準則
最近鄰子空間準則[1]通過分類重構測試樣本的方法對測試樣本進行分類。假設人臉圖像數據集有K個類別{l1,l2,…,lK},對一個人臉圖像數據樣本y求解系數向量w,對每一個類計算如下的度量余量:
式中δk(w):Rn→Rn,計算得到類lk的系數,其第j個元素定義為:
樣本y所屬的類:
2 基于正則跡范數的識別方法
稀疏表示分類法利用L1范數保持表示系數的稀疏性,最小二乘回歸分類法利用L2范數保持表示系數的聚集性,本文利用跡范數保持表示系數的稀疏性和聚集性。
2.1 正則跡范數模型
為了平衡L1范數和L2范數,文獻[8]提出了跡范數Ω(w)=||XDiag(w)||*,不同于其他范數,跡范數包含數據集X,可以自適應保持數據集的相關性,從而更好地保持數據的相關信息。XDiag(w)可以分解為:
文獻[8]指出,||w||2≤||XDiag(w)||*≤||w||1,因此,跡范數能同時保持表示系數的稀疏性和聚集性,將Ω(w)=||XDiag(w)||*作為正則項,建立基于跡范數的識別方法:
2.2 模型求解
求解模型正則跡范數模型有許多方法[8-9],本文利用交替乘子方向法(Alternating Direction Method of Multipliers,ADMM)[11]求解正則跡范數問題。
2.3 正則跡范數分類法
利用訓練集X對每個測試樣本y求解表示系數w,然后用最近鄰子空間準則對測試樣本y進行分類,將這一過程歸納為基于正則跡范數的分類法(Trace Norm Regulation Classification Method,TNRC)。
算法二:正則跡范數分類法
輸入:訓練集X,測試樣本y,訓練樣本類別ltrain,正則參數λ,γ
輸出:測試樣本類別ltest
第一步:利用迭代方法求解表示系數w;
第二步:利用最近鄰子空間準則測試樣本y分類,得到測試樣本類別ltest。
3 實驗分析
本節通過實驗驗證了正則跡范數分類法(TNRC)可以提高人臉識別的準確率,選用的對比方法包括經典的稀疏表示分類法(SRC)和最小二乘回歸分類法(LSRC)、非負最小二乘回歸分類法(NNLSC)以及最近鄰分類法(KNN),主要對比方法的參數設置:稀疏表示分類法的正則參數和正則跡范數分類法的正則參數λ都設置為0.000 1。
實驗數據集為四個常用的人臉圖像數據集,分別為FERET,ORL,PIE和Yale,它們的主要信息見表1所列。
3.1 主要實驗結果對比
本節對比不同分類方法在不同交叉驗證折數下的識別準確率。表2所列為不同方法在不同交叉驗證折數下的平均準確率,并且通過圖1直觀給出了所有方法在不同交叉折數下的對比結果。
從表2的平均識別準確率可以發現,正則跡范數分類法的平均準確率最高,因此本文提出的方法適合人臉圖像的識別。不僅如此,從圖1的實驗結果不難發現,正則跡范數分類法(TNRC)取得了較好的聚類準確率,說明Ω(w)=||XDiag(w)||*很好地保持了稀疏表示分類法的稀疏性和最小二乘回歸分類法的聚集性。不難發現,最近鄰分類法(KNN)的識別準確率明顯低于其他方法,反映了傳統分類方法不適合人臉圖像數據高維數非線性的特點。
3.2 參數討論
本節研究正則跡范數分類法(TNRC)的正則參數λ對人臉識別準確率的影響。
從圖2的實驗結果不難發現,較小的正則參數可以得到更準確的識別準確率。當λ=1時,識別準確率明顯下降,因此,在用正則跡范數分類法進行人臉識別時,可以設置較小的正則參數,以提高識別準確率與正則跡范數分類法的實用性。
4 結 語
本文利用跡范數理論提出了正則跡范數分類法,并用該方法研究了人臉識別問題。正則跡范數分類法通過正則跡范數達到保持表示系數的稀疏性和聚集性,提高表示系數的表示能力,從而提高識別準確率。在四個人臉圖像數據集上的實驗表明了該方法的有效性,但由于該方法利用交替乘子方向法(ADMM)求解,需要較大的時間開銷,因此研究正則跡范數模型的快速求解將是一個不錯的課題。
參 考 文 獻
[1] TURK M,PENTLAND A. Eigenfaces for recognition [J]. Journal of cognitive neuroscience,1991,3(1):71-86.
[2] TOLBA A S,ELBAZ A H,ELHARBY A.Face recognition:a literature review [J]. International journal of signal processing,2008,2(1):88-103.
[3]潘周嫻,陳適,潘慧,等.人臉識別技術的醫學診斷應用的發展與現狀[J].基礎醫學與臨床,2016,36(12):1747-1750.
[4] GAO Y,MA J,YUILLE A L. Semi-supervised sparse representation based classification for face recognition with insufficient labeled samples [J]. IEEE transactions on image processing,2017,26(5):2545-2560.
[5] WRIGHT J,YANG A Y,GANESH A,et al. Robust face recognition via sparse representation [J]. Pattern analysis and machine intelligence,2009,31(2): 210-227.
[6] CHEN X,JIAN C. A tumor classification model using least square regression[C]// International Conference on Natural Computation. IEEE,2014:753-758.
[7] LI Y,NGOM A. Classification approach based on non-negative least squares[J]. Neurocomputing,2013,118(11):41-57.
[8] OBOZINSKI G,BACH F. Trace Lasso: A Trace Norm Regularization for Correlated Designs [C]// International Conference on Neural Information Processing Systems. Curran Associates Inc. 2011:2187-2195.
[9] LU C,FENG J,LIN Z,et al. Correlation adaptive subspace segmentation by trace lasso[C]// IEEE International Conference on Computer Vision. IEEE,2014:1345-1352.
[10] KIM S J,KOH K,LUSTIG M,et al. An interior-point method for large-scale l1-regularized least squares[J].IEEE journal of? selected topics in signal processing,2007,8(8): 1515-1559.
[11] BOYD S,PARIKH N,CHU E,et al. Distributed optimization and statistical learning via the alternating direction method of multipliers[J].Foundations & trends in machine learning,2011,3(1):1-122.