郭磊 周文杰 高少偉



摘? 要:身處信息時(shí)代,為了保護(hù)信息安全,如何準(zhǔn)確鑒定某個(gè)人的身份,已經(jīng)成為社會(huì)各界的難點(diǎn)。作為生物識(shí)別技術(shù)的一個(gè)重要分支,人臉識(shí)別技術(shù)在商業(yè)、安全、身份認(rèn)證等領(lǐng)域有著廣泛的應(yīng)用。通過(guò)對(duì)傳統(tǒng)PCA、分塊PCA、MPCA以及二維PCA的人臉識(shí)別算法中的特征抽取方法以及對(duì)算法取不同參數(shù)情況下的性能和算法間性能對(duì)比,得出二維PCA性能更優(yōu)的結(jié)論,并以此為基礎(chǔ),通過(guò)軟件工具設(shè)計(jì)出了基于以上四種方法的人臉識(shí)別技術(shù)的仿真系統(tǒng)。
關(guān)鍵詞:人臉識(shí)別;特征抽取;主成分分析
中圖分類號(hào):TP311.52? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2021)05-0108-06
Research of the Face Recognition Technology Based on PCA Algorithm
GUO Lei,ZHOU Wenjie,GAO Shaowei
(College of Electronic and Information Engineering,Guangdong Ocean University,Zhanjiang? 524088,China)
Abstract:In the information age,in order to protect information security,how to accurately identify a persons identity,has become a difficult point for all walks of life. As an important branch of bioidentification technology,face recognition technology has a wide range of applications in business,security,identity authentication and other fields. Based on the traditional PCA,block of PCA and MPCA and two-dimensional PCA face recognition algorithm of feature extraction method and the algorithm performance under different parameters and performance comparison between algorithms,two-dimensional PCA performance better conclusions,and on this basis,through the software tools to design the face recognition technique based on the above four methods of simulation system.
Keywords:face recognition;feature extraction;PCA
0? 引? 言
生物特征技術(shù)是指利用人體固有的、具有穩(wěn)定性和唯一性的生理特征,如指紋、面部、虹膜等來(lái)進(jìn)行身份鑒定的技術(shù)。作為生物特征識(shí)別的一個(gè)重要方面,人臉識(shí)別技術(shù)在嫌疑人的身份識(shí)別、互聯(lián)網(wǎng)的認(rèn)證口令以及銀行系統(tǒng)的身份驗(yàn)證等各領(lǐng)域有著廣闊的應(yīng)用前景[1]。同時(shí),人臉識(shí)別技術(shù)還和其他領(lǐng)域存在交集,如神經(jīng)網(wǎng)絡(luò)、人工智能、心理學(xué)等。
目前,人臉識(shí)別研究的主流方向已經(jīng)基本確定,有基于主成分分析方法(PCA),基于Fisher線性判別分析方法(LDA)以及局部特征分析方法(LFA)等。除了對(duì)靜態(tài)的人臉圖像進(jìn)行識(shí)別,動(dòng)態(tài)人臉識(shí)別以及三維圖像研究也逐漸成為研究重點(diǎn)[2]。本文主要對(duì)PCA及其改進(jìn)的算法進(jìn)行研究,再通過(guò)軟件工具實(shí)現(xiàn)人臉識(shí)別的仿真系統(tǒng),并對(duì)算法性能進(jìn)行比較。
1? 基于傳統(tǒng)PCA的人臉識(shí)別算法
基于傳統(tǒng)PCA的人臉識(shí)別算法的主要思想就是在原始的人臉空間中求出一組正交向量,然后利用PCA方法保留其中包含重要人臉信息的向量,由其構(gòu)成一個(gè)新的人臉特征空間,稱其為特征臉。后續(xù)將待識(shí)別人臉與特征臉進(jìn)行比較,從而完成人臉識(shí)別的過(guò)程,其識(shí)別流程如圖1所示。
1.1? 傳統(tǒng)PCA的特征抽取
選擇一定數(shù)量的人臉圖像構(gòu)成訓(xùn)練集,剩余的圖像作為待測(cè)試的樣本。假設(shè)人臉庫(kù)中圖像尺寸均為m×n,則其可以表示為一個(gè)列向量X=[x1,x2,…,xm×n]T。如果有M幅訓(xùn)練圖像,構(gòu)成的訓(xùn)練集如式(1)所示:
TrainSamples=[X1,X2,…,XM]? ? ? ? ? ? ? ? ?(1)
將訓(xùn)練集中的每個(gè)向量減去訓(xùn)練集的均值向量mx,可得新訓(xùn)練集,如式(2)所示:
ctlSamples=[X1-Mx,…,XM-mX]? ? ? ? ? ? ? ? (2)
根據(jù)式(2)可以得到其協(xié)方差矩陣的表達(dá)式,如式(3)所示:
(3)
其中,協(xié)方差矩陣C的大小為(m×n)×(m×n)。為了降低求解矩陣C的特征值和特征向量的計(jì)算量,引入奇異值分解(SVD)方法來(lái)解決計(jì)算過(guò)程中矩陣維數(shù)過(guò)高的問(wèn)題[3,4]。
設(shè)矩陣C的特征值為λi,對(duì)應(yīng)特征向量分別為ui和vi(i=0,1,…,M-1),則矩陣C的特征向量可表示為式(4):
(4)
對(duì)特征值進(jìn)行降序排列,通過(guò)選擇保留一定數(shù)量的特征值及其特征向量,以此構(gòu)成特征臉空間。特征值的選擇可以由累積貢獻(xiàn)率(或閾值)決定,其計(jì)算公式如式(5)所示:
(5)
1.2? 測(cè)試樣本和訓(xùn)練樣本的比較和分類
通過(guò)計(jì)算在N維空間中圖像間的距離,可以測(cè)量圖像之間的相似性。進(jìn)行人臉識(shí)別時(shí),有多樣的分類器供人們選擇,本文進(jìn)行的人臉識(shí)別實(shí)驗(yàn)采用K近鄰算法。其思想是計(jì)算待測(cè)樣本和所有訓(xùn)練樣本的向量距離,從中選取一定數(shù)量的最小距離,根據(jù)這些最小距離對(duì)應(yīng)的訓(xùn)練樣本中,大多數(shù)樣本所屬的類別,判斷出待測(cè)樣本屬于哪個(gè)類別[5]。算法示例如圖2所示。
1.3? 實(shí)驗(yàn)結(jié)果分析
本節(jié)以O(shè)RL人臉庫(kù)作為實(shí)驗(yàn)樣本庫(kù),進(jìn)行基于PCA算法的人臉識(shí)別測(cè)試。其中,ORL人臉庫(kù)由40個(gè)人、每人10幅共400幅灰度圖像組成,部分圖像的背景為黑色,也有光照條件、臉部表情、細(xì)節(jié)等等外界條件的變化;K近鄰分類器采用三階近鄰作為判別依據(jù),實(shí)驗(yàn)結(jié)果如表1所示。
從表1可以看到,隨著訓(xùn)練集的樣本數(shù)增多,系統(tǒng)的識(shí)別精度也會(huì)越高。當(dāng)樣本數(shù)一定時(shí),隨著累積貢獻(xiàn)率的增大,識(shí)別精度也會(huì)有提升,當(dāng)高于85%時(shí),系統(tǒng)的識(shí)別精度變化不大。因此在設(shè)置參數(shù)時(shí),選擇合適的累積貢獻(xiàn)率值和樣本數(shù)量,不僅可以降低訓(xùn)練過(guò)程的計(jì)算量,還可以使系統(tǒng)保持較高的識(shí)別精度。
2? 基于分塊PCA的人臉識(shí)別
PCA方法抽取的是圖像的全局特征,而隨著人臉像素的增多,其會(huì)丟失一些重要的局部信息,導(dǎo)致人臉識(shí)別的效率下降。為了解決這個(gè)問(wèn)題,有學(xué)者針對(duì)特征抽取方面進(jìn)行改進(jìn),提出了分塊PCA算法[6]。其流程圖如圖3所示。
2.1? 基于分塊PCA的人臉識(shí)別算法
分塊PCA的主要思想是先將一個(gè)m×n的圖像矩陣X,分解為i×j塊圖像矩陣,從而通過(guò)式(3),使用PCA和奇異值分解方法,對(duì)這i×j個(gè)協(xié)方差矩陣進(jìn)行特征提取操作,得到i×j個(gè)新的子特征臉。在子人臉圖像經(jīng)過(guò)新的特征臉投影到低維的線性空間后,將所有低維向量組合起來(lái)得到一個(gè)完整的訓(xùn)練集。后續(xù)的識(shí)別過(guò)程與傳統(tǒng)PCA人臉識(shí)別算法一致。圖像的分塊方式如圖4所示。
2.2? 基于MPCA的人臉識(shí)別算法
為了進(jìn)一步改善基于分塊PCA的人臉識(shí)別系統(tǒng)的性能,在分塊PCA方法的基礎(chǔ)上,有學(xué)者提出一種針對(duì)分類過(guò)程的改進(jìn)方法,稱為MPCA。
在訓(xùn)練樣本和測(cè)試樣本經(jīng)過(guò)子特征臉空間映射到低維空間后,均能得到i×j個(gè)子向量集。此時(shí)直接進(jìn)入分類階段:
(1)計(jì)算子訓(xùn)練集與測(cè)試樣本子塊之間的距離;
(2)將每組的所有子塊的距離相加,得到數(shù)個(gè)測(cè)試樣本與訓(xùn)練樣本的距離;
(3)通過(guò)分類器進(jìn)行分類并得出識(shí)別結(jié)果。其示意圖如圖5所示。
2.3? 實(shí)驗(yàn)結(jié)果分析
本節(jié)實(shí)驗(yàn)主要是與第一節(jié)中的基于分塊PCA的人臉識(shí)別進(jìn)行精度以及訓(xùn)練、識(shí)別分類時(shí)間的對(duì)比。選擇每人的前5幅人臉圖像構(gòu)成訓(xùn)練集,剩余人臉圖像作為測(cè)試樣本進(jìn)行分類識(shí)別測(cè)試。詳細(xì)對(duì)比如表2和表3所示。
從表2中可以看出,在不同的分割方式情況下,基于MPCA的人臉識(shí)別的識(shí)別精度均高于基于分塊PCA的人臉識(shí)別,大體上提升了2到3個(gè)百分點(diǎn)。
從表3中可以看出,基于MPCA的人臉識(shí)別在訓(xùn)練時(shí)所耗費(fèi)的時(shí)間稍低于分塊PCA,而分類識(shí)別中耗費(fèi)時(shí)間高于分塊PCA,但這種方法在統(tǒng)計(jì)上能夠盡可能地減小或消除圖像噪聲等不必要的信息對(duì)識(shí)別分類過(guò)程所造成的影響,提高了人臉識(shí)別系統(tǒng)的識(shí)別性能和工作效率。
3? 基于2DPCA的人臉識(shí)別
2DPCA(二維PCA)PCA和傳統(tǒng)PCA的區(qū)別在于,2DPCA并不需要對(duì)圖像進(jìn)行一維轉(zhuǎn)換的處理,直接將圖像堆疊來(lái)獲得協(xié)方差矩陣[7]。
3.1? 2DPCA的特征抽取
向量X表示一個(gè)n維的列向量,通過(guò)一個(gè)線性關(guān)系,將一個(gè)m×n的圖像矩陣A在向量X上進(jìn)行投影,如式(6)所示:
Y=AX? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (6)
其中,X為投影軸;Y是圖像矩陣A的投影特征向量。投影向量Y的分散程度越高,投影軸X越好,兩者的關(guān)系式如式(7)所示:
J(X)=tr(SX)? ? ? ? ? ? ? ? ? ? ? ? ? ?(7)
其中,SX是特征向量Y的協(xié)方差矩陣;tr(SX)是這個(gè)協(xié)方差矩陣SX的跡。當(dāng)式(7)取得最大值的時(shí)候,可找出一個(gè)投影軸X,當(dāng)所有的訓(xùn)練樣本投影在它上面時(shí),特征向量的總體散布矩陣最大。其中,協(xié)方差矩陣SX的跡如式(8)所示:
tr(SX)=XTE[(A-EA)T(A-EA)]X? ? ? ? ?(8)
假設(shè)有M個(gè)大小為m×n的圖像矩陣A,mx為這個(gè)樣本集的均值向量,則協(xié)方差矩陣可由式(9)表示:
(9)
則式(7)變?yōu)槭剑?0):
J(X)=XTGtX? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (10)
其中,X就是經(jīng)過(guò)歸一化處理的正交向量。這個(gè)準(zhǔn)則也叫作廣義總體散布準(zhǔn)則。如果存在一個(gè)向量X,能夠使這一個(gè)準(zhǔn)則最大化,那么這個(gè)向量X就是最佳投影軸。這個(gè)向量X可以通過(guò)選取一定數(shù)量協(xié)方差矩陣Gt的最大特征值對(duì)應(yīng)的特征向量組成投影矩陣獲得[8]。
3.2? 實(shí)驗(yàn)結(jié)果分析
實(shí)驗(yàn)主要對(duì)PCA、分塊PCA、MPCA和2DPCA進(jìn)行識(shí)別性能的對(duì)比,分別選擇每人前1至5幅人臉圖像構(gòu)成訓(xùn)練集,其余人臉圖像作為測(cè)試樣本進(jìn)行分類識(shí)別測(cè)試。識(shí)別精度和訓(xùn)練時(shí)間對(duì)比詳細(xì)結(jié)果如表4和表5所示,PCA與2DPCA的重構(gòu)圖像對(duì)比如表6所示。
對(duì)比表6中兩組重構(gòu)的人臉圖像,不難看出,2DPCA能夠以更少的主成分來(lái)重構(gòu)出效果比PCA更好的人臉圖像。當(dāng)選擇80個(gè)主成分進(jìn)行重構(gòu)時(shí),肉眼基本看不出重構(gòu)圖像和原始圖像的區(qū)別。說(shuō)明2DPCA的主成分保留了更多原始人臉圖像的重要信息,因此在基于2DPCA進(jìn)行人臉識(shí)別時(shí),只需要選擇更少的主成分就可以達(dá)到不錯(cuò)的效果。而抽取特征過(guò)程的計(jì)算量也會(huì)明顯下降,這兩點(diǎn)在表5中已經(jīng)體現(xiàn)出來(lái)。當(dāng)2DPCA選擇20個(gè)主成分進(jìn)行特征抽取時(shí),中間過(guò)程耗費(fèi)時(shí)間明顯低于其他三種方法,而且識(shí)別精度與基于分塊PCA的人臉識(shí)別的精度相當(dāng)。
4? 人臉識(shí)別仿真系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)
4.1? 仿真系統(tǒng)的開(kāi)發(fā)環(huán)境
本文的人臉識(shí)別仿真系統(tǒng)是在Windows系統(tǒng)上實(shí)現(xiàn),內(nèi)存為8 GB,中央處理器為Intel(R) Core(TM) i5-3337U CPU @1.80 GHz 1.80 GHz。工具使用MATLAB R2014a中的GUI設(shè)計(jì)工具。運(yùn)行流程圖及仿真系統(tǒng)界面,如圖6和圖7所示。
4.2? 實(shí)驗(yàn)結(jié)果分析
在本文設(shè)計(jì)的人臉識(shí)別仿真系統(tǒng)中,四種分析方法均選取每人前5幅人臉圖像構(gòu)成訓(xùn)練集,剩余圖像可以用于進(jìn)行分類識(shí)別測(cè)試,每種算法選取5組數(shù)據(jù)取平均值,結(jié)果對(duì)比如表7所示。
從表7中的數(shù)據(jù)可以看出,人臉識(shí)別的仿真系統(tǒng)在正常運(yùn)作時(shí),MPCA的識(shí)別精度最高,可達(dá)到約87.5%,2DPCA雖然識(shí)別精度不如其余兩種分塊PCA方法,但抽取特征的時(shí)間遠(yuǎn)低于其他兩種方法。結(jié)論基本與前面的實(shí)驗(yàn)結(jié)果相符。因此在實(shí)際應(yīng)用人臉識(shí)別時(shí),可按照自己的需求來(lái)選擇不同的抽取特征的方法。
5? 結(jié)? 論
本文主要完成了PCA其改進(jìn)算法的分析并對(duì)它們進(jìn)行了有效性評(píng)價(jià),最終實(shí)現(xiàn)了人臉識(shí)別的仿真系統(tǒng)。盡管人臉識(shí)別技術(shù)現(xiàn)今有一定的成熟度,但不可否認(rèn)這項(xiàng)技術(shù)仍然具有巨大的發(fā)展空間。追求系統(tǒng)的高識(shí)別精度和高效率無(wú)疑還是該項(xiàng)技術(shù)重要的研究課題。
參考文獻(xiàn):
[1] 李武軍,王崇駿,張煒,等.人臉識(shí)別研究綜述 [J].模式識(shí)別與人工智能,2006,19(1):58-66.
[2] 董琳,趙懷勛.人臉識(shí)別技術(shù)的研究現(xiàn)狀與展望 [J].安防科技,2011(10):22-26.
[3] 李穎,張培珍,李燦蘋.基于KL變換的人臉識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) [J].科技資訊,2009(20):218-219.
[4] 周又紅.略談矩陣奇異值分解定理 [J].工科數(shù)學(xué),1996(3):125-126.
[5] 曾勇.廣義近鄰模式分類研究 [D].上海:上海交通大學(xué),2009.
[6] 陳伏兵,楊靜宇.分塊PCA及其在人臉識(shí)別中的應(yīng)用 [J].計(jì)算機(jī)工程與設(shè)計(jì),2007(8):1889-1892+1913.
[7] 孫艷娜.基于2DPCA的人臉識(shí)別方法 [D].西安:西安電子科技大學(xué),2013.
[8] YANG J,ZHANG D,F(xiàn)RANGI A F,et al. Two-dimensional PCA:a new approach to appearance-based face representation and recognition [J].IEEE transactions on pattern analysis and machine intelligence,2004,26(1):131-7.
作者簡(jiǎn)介:郭磊(1982—),男,漢族,黑龍江哈爾濱人,講師,博士,研究方向:圖像處理與機(jī)器視覺(jué);通訊作者:周文杰(1996—),男,漢族,廣東佛山人,助理工程師,本科,研究方向:圖像處理。