謝文浩,翟素蘭
(安徽大學 數學科學學院,安徽 合肥 230601)
基于加權稀疏近鄰表示的人臉識別
謝文浩,翟素蘭
(安徽大學 數學科學學院,安徽 合肥 230601)
稀疏表示的人臉識別目前受到廣泛的關注。針對現有稀疏近鄰表示算法沒有考慮不同訓練樣本對測試樣本的重構權重,同時為了提高基于稀疏近鄰表示人臉識別的識別率,文中提出一種加權稀疏近鄰表示的人臉識別算法。首先在每一類訓練樣本中尋找與測試樣本最近的k個樣本,構成這一類新的訓練樣本;然后在每一類中都進行同樣的操作,從而構造一個新的訓練字典,在求解l1范數最小化的稀疏系數時,為每一個新的訓練樣本對應的稀疏系數賦上一個權值;最后在新的字典下,根據重構誤差最小化來完成識別任務。在YaleB數據庫和ORL數據庫上的大量實驗結果表明,文中所提算法與KNN算法和稀疏近鄰表示算法相比,取得了較高的識別率,證明了該方法的有效性。
稀疏表示;特征提取;加權近鄰;人臉識別
人臉識別(Face Recognition,FR)是近幾十年來模式識別、圖像處理、機器學習等領域研究的熱點課題之一[1-2],它在檔案管理系統、罪犯身份識別、信用卡驗證、海關及銀行監控的場合具有廣闊的應用前景。
過去二十年已有許多研究者提出一些人臉識別算法。文獻[3]提出主成分分析(Principal Component Analysis,PCA)用于人臉識別,該方法將高維向量降到低維,在特征子空間中完成分類,取得了較好的效果,已成為人臉識別的基準程序和事實上的工業標準。文獻[4]提出線性鑒別分析(Linear Discriminant Analysis,LDA)利用類別歸屬信息,它選擇類內散度與類間散度差異特征進行人臉識別,也取得了一定的成功。近幾年相關研究表明,人臉特征更可能存在于低維非線性流行子空間中,典型的算法有局部線性嵌入(Locality Linear Embedding,LLE)[5]和等距映射(ISOmetric MAPping,ISOMAP)[6],也取得了相當可觀的效果。Wright等將稀疏表示(Sparse Representation,SR)[7]用于人臉識別,由于其對噪聲和遮擋有一定的魯棒性使得人臉識別取得了突破性進展[8-11]。該方法將訓練樣本構成超完備字典,然后求出測試樣本在此字典上的稀疏系數,最后根據重構誤差最小化來完成分類任務,然而該方法沒有考慮樣本的分布特性和訓練樣本的類別代表性,稀疏系數求解的計算量較大,大大限制了它的應用。文獻[12-13]在稀疏表示的基礎上選取與測試樣本最近的k個訓練樣本構成新的字典來進行分類。文獻[14]則在每類中都選取k個最近鄰樣本構成此類的基進行稀疏表示分類。然而以上近鄰的選擇忽略了各訓練樣本對測試樣本的不同權重表示,導致識別率下降。
針對以上問題,文中在文獻[14]的基礎上提出加權近鄰稀疏表示的人臉識別算法。該方法首先在每類訓練樣本中都找出與測試樣本最近的k個樣本構成新字典,然后在求解稀疏系數時,給每個訓練樣本對應的稀疏系數賦上一個權值。該方法充分利用了樣本的分布特性和樣本的局部信息,在YaleB數據庫和ORL數據庫上的大量實驗結果表明,該算法取得了較好的效果。
1.1 稀疏表示分類思想

Step1:將訓練字典A按列進行歸一化,使其具有l2范數;


(1)
其中,ε是誤差容限。
Step3:計算各類訓練樣本對測試樣本的重構誤差。
(2)

Step4:最后將測試樣本歸為重構誤差最小的類別。

(3)
1.2 加權稀疏近鄰表示分類思想
文中提出的加權稀疏近鄰表示的人臉識別算法,不是選擇所有訓練樣本構成字典,而是在每類訓練樣本中選擇與測試樣本最近的k個樣本,然后構成一個新字典,在求解稀疏系數時為每一個訓練樣本對應的系數賦上一個權值,實現對測試樣本的識別。
首先在每一類訓練樣本中選擇與測試樣本最近鄰的k個樣本,如某一類i(1≤i≤C),共有ni個訓練樣本,首先求得測試樣本與每一類中訓練樣本的距離。
distih=dist(y,Aih),h=1,2,…,ni
(4)
其中,dist()表示距離函數,文中采用歐氏距離。
然后對每一類中的距離按從小到大排序,取前k個最小距離對應的訓練樣本作為該類的新的訓練樣本,對每一類都進行同樣的操作,最終可獲得新的訓練字典。


(5)

(6)
其中,W是一個塊對角矩陣,也即是一個權重矩陣,對重構一個測試樣本對應的每一個訓練樣本的稀疏系數賦加一個權值。
diag(W)=[dist(y,x11),…,dist(y,xCk)]
(7)
dist(y,xij)=‖y-xij‖s
(8)
其中,i=1,2,…,C,j=1,2,…,k,s為局部適應參數,當s=0時,文中算法就退化為典型的稀疏近鄰表示算法。
當測試樣本與某一訓練樣本的距離越大,表明測試樣本與這個訓練樣本的差異性越大,那么這個訓練樣本對重構此測試樣本的貢獻就越小。由于圖像容易受噪聲的影響,式(6)轉化為:
通過制定實施財政、金融、擔保等方面的政策,促進政府財政、社會商業性、政策性金融機構以及保險機構等合力支持企業科技成果轉化,彌補市場機制引導企業成果轉化在資金、風險等方面的缺陷和不足,實現科技成果轉化市場的有序良性發展。

(9)
求出稀疏系數后,同樣計算各類別訓練樣本對測試樣本的重構誤差。
(10)


(11)
為了驗證文中算法的有效性,與KNN算法[1]、稀疏近鄰表示算法[14]進行對比。文中將采用式(9)進行加權稀疏系數的求解,采用SPAMS工具箱[15-16],ε設置為10-4,s設置為1.5。實驗采用YaleB[7]數據庫和ORL[12]數據庫。實驗平臺為Inteli3處理器,2.30GHz,4G內存,軟件采用MATLABR2012a。
2.1 Yale B數據庫
Yale B數據庫包括38個人的經裁剪后的2 414幅正面人臉圖像,這些圖像存在不同的光照差異,原始圖像大小為192×168。實驗中采用下采樣后的32×32大小的圖像,每類中隨機選取40幅作為訓練樣本,余下的作為測試樣本,并對每一幅圖像進行了歸一化處理,部分圖像如圖1所示。

圖1 Yale B數據庫部分人臉圖像
由于圖像的維數較高,首先采用PCA進行降維處理,在特征子空間中進行分類,保持0.95的能量,取5次實驗的平均值,實驗結果見表1。

表1 Yale B數據庫上的實驗結果
從表1可以看出,在每類近鄰數k為20時,文中算法的識別率為0.853 5,均大于SNRC算法的0.830 0和KNN算法的0.727 1。當每類近鄰數k為30時,文中算法識別率為0.911 6,也大于SNRC算法和KNN算法的識別率。由此可見,文中算法取得了較好的效果。
為了進一步驗證文中算法的識別率,將在每類近鄰數k為20和30時測試不同維數下的識別率,也重復5次實驗取平均值,實驗結果如圖2、圖3所示。

圖2 Yale B數據庫k=20時不同維數下的識別率

圖3 Yale B數據庫k=30時不同維數下的識別率
從圖2和圖3可以看出,在每類近鄰數為20和30時,文中算法均比SNRC算法和KNN算法的識別率高,并且隨著特征維數的增加,文中算法可以取得相當好的識別效果。
2.2 ORL數據庫
ORL人臉數據庫是由AT&T實驗室提供,共有40個人的400幅圖像,每人10幅圖像。這些人臉圖像在人臉表情和面部細節都有不同的變化,比如眼鏡戴或者不戴,眼睛睜開或者閉著,笑與不笑等。原始圖像為112×92,實驗中采用下采樣至32×32大小,每類隨機選取5幅作為訓練樣本,其余的作為測試樣本。也對每一幅圖像進行了歸一化處理,部分圖像如圖4所示。

圖4 ORL數據庫部分人臉圖像
首先采用PCA進行降維在特征子空間中完成分類任務,并保持0.95的能量。由于ORL為小樣本數據,為了避免數據選取的偶然性,也重復5次實驗求取平均值,實驗結果見表2。

表2 ORL數據庫上的實驗結果
從表2可以看出,當每類近鄰數k為3時,文中算法的識別率為0.803 0,略低于SNRC算法的0.839 0和KNN算法的0.856 0。這是因為ORL為小樣本數據庫,此時每類中選取的訓練樣本個數比較少,算法學習的經驗不足。當每類近鄰數k為4時,訓練樣本個數增加,識別率也會提高。文中算法的識別率為0.900 0,均高于SNRC算法和KNN算法的識別率。由此可見,文中算法還是可行的。
為了進一步驗證算法的有效性,測試每類近鄰數k為3和4時不同維數下的識別率,同樣取5次實驗的平均值,實驗結果如圖5、圖6所示。

圖5 ORL數據庫k=3時不同維數下的識別率

圖6 ORL數據庫k=4時不同維數下的識別率
從圖5可以看出,當維數較低時,文中算法的識別率均高于SNRC算法,但卻低于KNN算法,而當維數進一步增大時,文中算法的識別率有所下降,這是因為此時每類近鄰數k為3,每類選取的訓練樣本較少,又因為PCA降維存在過擬合,主成分多時存在更多的干擾信息。
如圖6所示,當每類近鄰數k為4時,由于每類訓練樣本的增加,所以識別率會進一步提高,此時文中算法的識別率均高于SNRC和KNN算法。所以可以看出,文中算法還是行之有效的。
文中針對稀疏近鄰表示算法沒有考慮訓練樣本與測試樣本的不同權重表示,提出加權稀疏近鄰表示的人臉識別算法。首先在每一類訓練樣本中尋找與測試樣本最近鄰的k個樣本,逐類進行后構造一個新的訓練字典,然后在求解稀疏系數時,對每一個訓練樣本重構測試樣本對應的稀疏系數賦加一個權值。在YaleB數據庫和ORL數據庫上的實驗驗證了文中算法的有效性。
現實中人臉識別受到各種因素的影響,如何設計更合理的訓練字典以及構造更加魯棒性的算法是下一步的研究重點。
[1]ZhaoW,ChellappaR,PhillipsPJ,etal.Facerecognition:aliteraturesurvey[J].ACMComputingSurveys,2003,35(4):399-459.
[2] 李武軍,王崇駿,張 煒,等.人臉識別研究綜述[J].模式識別與人工智能,2006,19(1):58-66.
[3]TurkM,PentlandA.Eigenfacesforrecognition[J].JournalofCognitiveNeuroscience,1991,3(1):71-86.
[4]BelhumeurPN,HespanhaJP,KriegmanD.Eigenfacesvs.fisherfaces:recognitionusingclassspecificlinearprojection[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,1997,19(7):711-720.
[5]RoweisST,SaulLK.Nonlineardimensionalityreductionbylocallylinearembedding[J].Science,2000,290(5500):2323-2326.
[6]TenenbaumJB,deSilvaV,LangfordJC.Aglobalgeometricframeworkfornonlineardimensionalityreduction[J].Science,2000,290(5500):2319-2323.
[7]WrightJ,YangAY,GaneshA,etal.Robustfacerecognitionviasparserepresentation[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2009,31(2):210-227.
[8]ZhangD,YangM,FengX.Sparserepresentationorcollaborativerepresentation:whichhelpsfacerecognition?[C]//ProcofIEEEinternationalconferenceoncomputervision.[s.l.]:IEEE,2011:471-478.
[9]XuY,ZuoW,FanZ.Supervisedsparserepresentationmethodwithaheuristicstrategyandfacerecognitionexperiments[J].Neurocomputing,2012,79:125-131.
[10] 蔡體健,樊曉平,劉遵雄.基于稀疏表示的高噪聲人臉識別及算法優化[J].計算機應用,2012,32(8):2313-2315.
[11] 馬小虎,譚延琪.基于鑒別稀疏保持嵌入的人臉識別算法[J].自動化學報,2014,40(1):73-82.
[12]NanZ,YangJ.Knearestneighborbasedlocalsparserepresentationclassifier[C]//ProcofChineseconferenceonpatternrecognition.[s.l.]:IEEE,2010:1-5.
[13]LiCG,GuoJ,ZhangHG.Localsparserepresentationbasedclassification[C]//Procof20thinternationalconferenceonpatternrecognition.[s.l.]:IEEE,2010:649-652.
[14]HuiK,LiC,ZhangL.Sparseneighborrepresentationforclassification[J].PatternRecognitionLetters,2012,33(5):661-669.
[15]MairalJ,BachF,PonceJ,etal.Onlinedictionarylearningforsparsecoding[C]//Proceedingsofthe26thannualinternationalconferenceonmachinelearning.[s.l.]:ACM,2009:689-696.
[16]MairalJ,BachF,PonceJ,etal.Onlinelearningformatrixfactorizationandsparsecoding[J].JournalofMachineLearningResearch,2010,11:19-60.
Face Recognition Based on Weighted Sparse Neighbor Representation
XIE Wen-hao,ZHAI Su-lan
(School of Mathematical Sciences,Anhui University,Hefei 230601,China)
Currently,face recognition via sparse representation has gained widespread attention.Since the sparse neighbor representation algorithm without considering the different weight of training samples to reconstruct the test sample,simultaneously,to improve the recognition rate of face recognition based on sparse neighbor representation,in this paper,a face recognition algorithm of weighted sparse neighbor representation was proposed.First,in each class of the training samples,ksamplesnearesttothetestsamplesareselected,constructednewtrainingsamplesinthisclass.Andthendothesameoperationineachclass,soastoconstructanewtrainingdictionary,whensolvingsparsecoefficientwithl1normminimization,aweightisgiventothesparsecoefficientofeachnewtrainingsample.Finallywiththenewtrainingdictionary,accordingtotheminimumreconstructionerrortocompletetherecognitiontask.ThemostexperimentsresultsonYaleBfacedatabaseandORLfacedatabaseshowthattheproposedmethodachieveshigherrecognitionratecomparedwithKNNandSNRC(SparseNeighborRepresentationforClassification),whichconfirmstheeffectivenessofthealgorithm.
sparse representation;feature extraction;weighted nearest neighbor;face recognition
2015-05-21
2015-08-26
時間:2016-01-26
安徽省高校省級優秀青年人才基金重點項目(2013SQRL005ZD)作者簡介:謝文浩(1990-),男,碩士研究生,研究方向為圖像處理與模式識別;翟素蘭,副教授,博士,碩士生導師,研究方向為模式識別、視頻分析、數據挖掘。
http://www.cnki.net/kcms/detail/61.1450.TP.20160126.1521.056.html
TP
A
1673-629X(2016)02-0022-04
10.3969/j.issn.1673-629X.2016.02.005