
摘 要:人臉識別是一項極具發展潛力的生物特征識別技術,在公共安全,信息安全等領域具有廣闊的應用前景。本文試驗基于ORL人臉數據和Yale人臉數據,在監督的保持鄰域嵌入算法(NPE),度量優化的保持鄰域嵌入算法(MONPE)均取最優參數的前提下對分類準確率和運行時間進行了比較。試驗表明:MONPE算法與NPE算法相比,在實際應用中可以表現出明顯的優勢。
關鍵詞:人臉識別 監督的保持鄰域嵌入 度量優化的保持領域嵌入
中圖分類號:TP391.41文獻標識碼:A文章編號:1674-098X(2012)09(b)-0001-02
1 研究背景
從20世紀60年代末經過幾十年的發展,人臉識別技術的研究已經取得了很大的進展。與其它身份識別技術相比,人臉識別具有其顯著的優點:靈活性和易獲取的特點,使得這種方法能在最自然、直接,特別是在非接觸條件和不驚動被檢測人的情形下進行[1-2]。因此計算機人臉識別技術成為最活躍的研究領域之一。
2 近鄰保持嵌入算法(NPE)介紹[3-6]
NPE 可以同時學習動作的低維流形表示以及由高維圖像特征空間到低維流形空間的映射關系。NPE算法有以下特點值得強調:
首先,NPE算法和局部保持投影(LLP)有一些相似的性質,但是它們的目標函數是完全不同的。
其次,NPE是一種線性算法,這樣其快速和適宜性便于實際運用。
下面是具體的NPE算法[7-10]:
1)構造鄰接圖:假設G是生成的鄰接圖,圖G中的第i個節點對應于第個數值點(其中數值點是由人臉數據庫中的人臉圖像拉成的向量)。有兩種建立鄰接圖的方式:
選用K近鄰(KNN):首先建立任意兩點之間的距離矩陣,然后對于
①距離矩陣按行或列進行排序,選取其前個作為該點的近鄰。例如:對于點而言,如果點到的距離從小到大在前個之內,那么點是的近鄰之一。這樣對應于鄰接圖上是從第個節點到第個節點建立一條有向邊。
②選用近鄰:如果第個節點到第個節點的距離小于,則在此兩個節點間建立一條邊。
2)計算權重系數:假定G表示具有個節點的圖,對應于第個采樣。近鄰可采用近鄰或近鄰。計算權重矩陣對每個數據點,由其鄰域關系,計算線性重構系數,使得最小,且。
3)計算,使得代價函數
(1)
最小。這一優化題可通過對的特征值分解得到。令的最小個特征值及對應的特征向量對為,除去特征值為0的特征向量(此特征向量為,即把所有點映射到一個點上)。第個樣本嵌入的第個分量即為,是的第個分量。
3 NPE算法的理論依據及其改進
正如在前面所述,NPE方法是對LLE方法的線性逼近。和PCA方法不同的是,PCA方法旨在保持全局的結構特性,而NPE方法則是保持局部特性。所謂的保持局部特性就是用某一點鄰近的點的組合來線性的表示此點。在MONPE算法中,除了NPE算法的相關知識,還涉及到了PCA算法,和LDA算法的相關知識。
在已得到數據集的情況下,我們可以選取近鄰,進而建立鄰接圖。在某些情況下,數據點分布在一個非線性子流形上,但是只考慮局部鄰近的情況下,假設其是線性的,這樣的做法可能是合理的。這樣的話,我們能夠通過某一點由其鄰近線性表示的權重系數來反映此點鄰近的局部特性。通過最小化其重建誤差確定權重系數。如下:
(2)
其中的重建誤差是每個點由其鄰近重建的誤差之和。為了實現用鄰近點進行線性表示,我們必須要考慮將初始點映射為一條線的問題。如果要得到一個好的映射,應該使得下面的目標函數取到最小值。
(3)
式子(2)和(3)中表示第幅人臉圖像對應的數值點,表示的近鄰內的點。,,,是一個足夠好的映射,使得上式的取值最小。
4 仿真結果
4.1 人臉數據庫介紹
ORL人臉數據庫是由ATT劍橋實驗室與劍橋大學語音、視覺和機器人組聯立的(01ivetti數據庫),由40個不同的人每人10幅不同的圖像組成。這些圖像是在不同時期、不同光照、不同面部表情和臉部細節條件下拍攝。樣本圖像如(圖1)所示:
4.2 試驗結果
為了減小隨機性和某些干擾的影響,在所有參數取最優的前提下,對于所考慮的每個訓練數隨機選取40種不同的訓練方式,然后比較其均值。另外,由于改進的算法在時間復雜度上幾乎沒有改變,所以此試驗結果中只進行分類準確率的比較。在ORL人臉數據下的試驗結果(表1)。
4.3 試驗結果分析
由分類準確率的最高點比較結果顯示:與NPE算法相比,改進的算法MONPE沒有表現出明顯的優勢。但是,人臉識別系統的實際應用中不可能一直取到最優下降維數。由ORL和Yale人臉數據庫均顯示:當訓練數大于2并且隨著下降維數的升高,MONPE算法穩定的優于NPE算法;其中,在Yale人臉數據下,這一現象表現的更加明顯。
5 結語
在本文中,對于每個算法選取分類準確率最高的狀態,然后,進行算法的比較,得出最優參數,即算法在最優狀態下的參數的取值。本文首先明確了試驗的目的,確定試驗的步驟;然后,在ORL人臉數據庫上進行試驗。在最優參數的情況下,用隨機選取的40種不同訓練方式的平均值進行比較。試驗結果表明,在分類準確率最高點的比較中,MONPE算法沒有表現出明顯優勢;在考慮實際應用情況下,MONPE算法優于NPE算法。
參考文獻
[1] WBledsoe.Man-machine facial Recognition.Panoramic Research Inc.Palo Alto,CA,1966,Rep PRI:22.
[2] Berto R,Poggio T.Face recognition: Feature versus templates,lEEE Trans. on PAMI,1993,15(10):1042-1052.
[3] Ziquan Hong.Algebraic feature extraction of image for recognition. Pattern Recognition,1991,24(3):211-219.
[4] Nakamura O,Mathur S, Minami T. Identification of human faces based on isodensity maps.Pattern Recognition, 1991,24(3):263-272.
[5] Lades M,Vorbuggen J,Buhmann J et al.Distortion invariant object recognition in the dynamic Link architecture. IEEE Trans,on Computers,1991,42(3): 300-311.
[6] Samaria F,Young S.HMM-based architecture for face identification Image and Vision Computing,1994, 12(8).
[7] Teenbaum J B,de Silva V,Langford J C.A Global Geometric Framework for Nonlinear Dimensionality Reduction. Seience,2000,290(5500):2319-2323.
[8] Roweis S L,Saul L.Nonlinear dimensionality reduction by locally linear embedding.Seience,2000,290(5500): 2323-2326.
[9] Donoho D L,Grimes C.HeSSian eigenmaps: New locally linear embedding techniques for high-dimensional data.Proc.of the National Academy of Sciences,2003,100(10):5591-5596.
[10] Zhang C S,Wang J,Zhao N Y,etal. Reconstruction and analysis of multi pose face images based on nonlinear dimensionality reduction.Pattern Recognition,2004,37(1):325-336.