簡彩仁,莊凌宇,林智鵬
(廈門大學嘉庚學院,福建 漳州 363105)
人臉識別是基于人臉的面部特征辨識身份的生物識別技術。人臉識別最主要的用途是確定人的身份。隨著計算機技術的不斷發展,人們獲取人臉圖像數據變得異常容易,因此人臉識別的發展和應用更是不斷深入和普及。人臉識別技術已經廣泛應用在軍隊、醫療、銀行、公安、電子商務等行業。由于當前人臉識別的應用場景得到的高維數據愈發龐大,因此研究基于降維的人臉識別方法具有重要的意義。
人臉識別研究是當前研究的熱點問題。許多降維方法被應用于人臉識別研究?;诰€性降維方法的人臉識別研究代表性方法是線性判別分析(LDA)[1],該方法使降維數據類內距離小,類間距離大,但是對小樣本數據容易產生非奇異解?;诹餍螌W習的降維方法,如等距映射(ISOMAP)[2]、局部線性嵌入(LLE)[3]等,旨在保持局部結構實現降維,更適合非線性數據的降維,但是這些方法嚴重依賴于近鄰關系,當存在較小誤差時,可能會對全局估計產生較大的影響?;谙∈璞硎镜慕稻S方法在人臉識別中也有重要的應用,該方法的優點是可以避免過擬合問題,但是運算效率不高[4-5]。
本文從降維的角度研究人臉識別。通過線性降維方法主成分分析和非線性降維方法核主成分分析對人臉圖像數據進行降維研究。降維方法可以有效剔除人臉圖像數據的冗余特征,從而提高識別準確率。通過實驗比較降維人臉圖像數據與原始人臉圖像數據的識別準確率。
主成分分析(Principal Component Analysis,PCA)方法將一組可能存在相關性的變量通過正交變換轉換為一組線性不相關的變量,使其成為統計的依據,轉換后的這組變量叫主成分。主成分分析的主要思想是投影樣本點的方差最大化。從最大可分性的角度可以對主成分分析進行另一種解釋。通過投影矩陣W將樣本點xi投影到新空間的超平面上,投影得到WTxi??梢酝ㄟ^最大化投影樣本點的方差達到盡可能區分投影樣本點的目的。
s.t.WTW=I
(1)
通過拉格朗日乘子法,式(1)可以通過特征值問題XXTW=λW求解。
主成分分析是一種經典的線性降維方法,但不利于發現高維小樣本數據的本質特征。針對這一不足,核主成分分析基于核理論對主成分分析進行“核化”,擴展成適合非線性降維的方法。
給定非線性特征空間映射Φ:Rm→M,其中Rm為高維樣本空間,M是低維流形空間,因此原始高維數據X的低維流形表示為Φ(X)。對高維空間樣本Φ(X)進行主成分分析得到核主成分分析問題的優化目標函數為:
s.t.WTW=I
(2)
直接定義非線性映射Φ(X)是困難的,核表示理論給出了一種不需要定義非線性映射的技術[6-7]。設K∈Rn×n是一個半正定核矩陣,它們的元素定義為:
[K]ij=[(Φ(X),Φ(X))M]ij=Φ(xi)TΦ(xj)=k(xi,xj)

因此核主成分分析的目標函數(2)可以轉化為:
s.t.WTW=I
(3)
通過拉格朗日乘子法,式(3)可以通過特征值問題KW=λW求解。
人臉圖像數據具有高維數的特點,因此人臉圖像數據存在大量的冗余,通過降維可以得到更適合人臉識別的數據集。本節利用主成分分析和核主成分分析研究基于降維的人臉識別方法。
首先利用主成分分析或核主成分分析對數據集進行降維,再對降維后的數據集進行識別研究。結合第1節的理論,將基于降維的人臉識別方法的實現步驟總結成如下算法:

算法:基于降維的人臉識別方法輸入:人臉圖像數據集X,主成分保留比率pcaratio輸出:識別準確率acc(1)標準化訓練人臉圖像數據集X,使每個樣本具有單位L2范數;(2)利用式(1)或式(3)求投影矩陣W;(3)對投影數據WTX用K最近鄰分類法進行分類。
本節通過實驗驗證主成分分析和核主成分分析兩種降維方法對人臉識別的影響。
實驗數據集為兩個常用的人臉識別數據集Yale和ORL。
Yale人臉數據集總共采集了15個人的人臉圖像,該數據集共15個類別,165個樣本,特征數量為1 024個。在這15個對象中,每一個對象都具有11張各不相同的人臉。在這些圖像中,包含各種阻擋因素,例如角度因素、光照強度因素、相關環境變化因素以及遮擋物的影響和不同表情的變化等。圖1為部分Yale人臉圖像。

圖1 Yale人臉圖像示意圖
ORL人臉數據集共有40個對象,每一個對象都具有10張人臉,總數量達到400張灰度圖像人臉,特征數量為1 024個。每一個對象的人臉通過觀察存在肉眼可見的變化,包括遮擋物的變化、表情的變化等,在此基礎之上每個人臉的每一張圖片的大小都是按照一定的規律進行漸次變化,并且每個人臉之間存在20°的水平以及垂直的旋轉變化。圖2為部分ORL人臉圖像。

圖2 ORL人臉數據示意圖
實驗環境為Windows 7系統,安裝內存8.00 GB(3.42 GB可用),用MATLAB R2011b編程實現。利用交叉驗證對比各種方法下的識別準確率。對兩個數據集通過主成分分析(PCA)和核主成分分析(KPCA)進行降維后與原始數據集進行對比,選用K最近鄰分類法進行分類對比分類準確率和運行時間。實驗參數設置如下:主成分保留比率為90%,K最近鄰分類法的最近鄰參數選為1,交叉驗證折數設置為{4,5,6,7,8,9,10}。比較方法為原始數據用K最近鄰分類(KNN)、主成分分析降維數據用K最近鄰分類(PCA-KNN)、核主成分分析降維數據用K最近鄰分類(KPCA-KNN)。
實驗1:Yale人臉圖像數據集識別實驗。該實驗利用KNN、PCA-KNN、KPCA-KNN 3種方法研究Yale人臉圖像數據集的識別準確率。在不同交叉驗證折數下的識別準確率如表1所示,圖3也直觀顯示了不同方法的識別準確率。

表1 Yale人臉圖像數據識別準確率對比 (%)

圖3 Yale人臉圖像數據集識別準確率對比圖
從表1和圖3的實驗結果可以發現,降維后的數據集具有更好的識別準確率。因此降維方法可以有效地緩解人臉圖像數據的冗余問題。再對比核主成分分析和主成分分析兩種降維方法,發現KPCA-KNN方法顯著優于PCA-KNN,這反映了核主成分分析這種非線性降維方法更適應人臉圖像的非線性性質,從而取得更好的識別準確率。
此外,表2給出了不同方法對Yale人臉圖像數據集進行識別的運行時間。

表2 Yale人臉圖像數據集識別時間對比 (s)
從表2可以發現,降維后可以明顯提高識別的效率。而且,非線性降維方法KPCA比線性降維方法PCA更有效率。
實驗2:ORL人臉圖像數據集識別實驗。該實驗利用KNN、PCA-KNN、KPCA-KNN 3種方法研究ORL人臉圖像數據集的識別準確率。在不同交叉驗證折數下的識別準確率如表3所示,圖4直觀顯示了不同方法的識別準確率。

表3 ORL人臉圖像數據識別準確率對比 (%)

圖4 ORL人臉圖像數據集識別準確率對比圖
從表3和圖4的實驗結果可以發現,ORL人臉圖像數據集的識別實驗結果與Yale人臉圖像數據集的識別實驗結果類似:降維有利于人臉圖像的識別,并且核主成分分析這種非線性降維方法更適應人臉圖像的非線性性質,有更好的識別準確率。
表4給出了ORL人臉圖像數據集在不同交叉折數下進行識別的運行時間。

表4 ORL人臉圖像數據集識別時間對比 (s)
從表4的運行時間對比可以發現,降維可以明顯提高識別的效率。非線性降維方法KPCA比線性降維方法PCA更有效率。不僅如此,當樣本的個數更多時,KPCA的運行效率比PCA有明顯的改善。
通過以上兩個人臉圖像識別實驗的識別準確率和運行時間對比分析,可以明顯地發現經過主成分分析和核主成分分析的降維,無論是識別準確率還是識別效率對比無降維數據,都具有顯而易見的優勢。其中,核主成分分析作為主成分分析的改進,比主成分分析有更加精確的識別準確率以及更好的識別效率。
本文利用主成分分析和核主成分分析對基于降維的人臉識別方法進行了研究。實驗結果表明降維可以有效地提高人臉識別準確率,而非線性降維方法更適合人臉圖像數據的降維。不僅如此,降維后的數據可以明顯提高識別效率。因此,本文的研究具有一定的實用價值。