摘要:考慮到類內(nèi)差與類間差的分布實際并不是嚴格的高斯分布,在概率密度估計方面提出改進的方案。采用非參數(shù)技術(shù)而不是高斯模型估計后驗概率,將其應(yīng)用于傳統(tǒng)的貝葉斯分類器。在FERET數(shù)據(jù)庫的FB及FC子集上的實驗結(jié)果表明,使用非參數(shù)技術(shù)的貝葉斯分類器優(yōu)于或相當(dāng)于使用高斯模型的分類器,且具有訓(xùn)練簡單的優(yōu)點。
關(guān)鍵詞:貝葉斯分類器;非參數(shù)技術(shù);人臉識別
中圖分類號:TP301文獻標(biāo)志碼:A
文章編號:1001-3695(2007)07-0292-03
0引言
自動人臉識別技術(shù)在安全、法律等領(lǐng)域廣泛潛在的應(yīng)用,以及其在模式識別、人工智能等方面的理論價值使得在過去幾十年間,國內(nèi)外廣大研究者對人臉識別研究傾注了極大的熱情[1]。先后提出了很多人臉識別算法,如基于幾何特征的方法[2]、模板匹配[3]、特征臉[3,4] 、線性判別分析[5]、神經(jīng)網(wǎng)絡(luò)[4]、彈性圖匹配[6]、變形模型[7]、貝葉斯分類器[8]、局部特征分析[9]、Gabor Fisher分類器[10]等。盡管這些技術(shù)進一步促進了人臉識別的研究,但是人臉識別技術(shù)仍然面臨著很多技術(shù)難題。其中之一便是較大的類內(nèi)變化,以及由于圖片的采集壞境(如光照、姿態(tài)、表情等)不同帶來的相對較小的類間變化。因此,如何對類內(nèi)變化以及類間變化精確建模成為人臉識別研究的一個重要目標(biāo)。在眾多的建模方法中,統(tǒng)計模型無疑是一種主流方法。其中Moghaddam的貝葉斯分類器[8]得到了廣泛的應(yīng)用。該算法對類內(nèi)差與類間差分別用高斯分布建模,最后使用概率相似度作為衡量兩幅圖像的相似度。
在后人的研究中,貝葉斯分類器得到了進一步的發(fā)展。由實驗觀察發(fā)現(xiàn),類內(nèi)差與類間差的分布更遵從多高斯分布,因此使用混合高斯模型而不是原算法中的單高斯模型對類內(nèi)差以及類間差的分布建模。Wang等人[11]對類內(nèi)變化做聚類,對各子類計算其分布,最后再融合各子類。另外一個擴展是對貝葉斯分類器采用的特征進行改進。在各種各樣可供分類器采用的特征中,Gabor特征被證明是目前人臉識別中最好的一種描述子。因此Gabor特征也被引入到貝葉斯分類器中。文獻[12]中的試驗結(jié)果表明,采用Gabor特征后與采用圖像灰度特征相比得到了更好的識別結(jié)果。
傳統(tǒng)的用于人臉識別的貝葉斯方法,采用單高斯模型或混合高斯模型估計后驗概率或類條件概率密度。這種方法的一個假設(shè)是類條件概率密度的分布形式已知(如假設(shè)它們是高斯分布),但是密度函數(shù)的一些參數(shù)(如均值和方差)未知,需要確定。盡管在大多數(shù)情況下,這一假設(shè)是可行的也是有效的,但是這樣引入的假設(shè)常常由于復(fù)雜的實際分布而減弱了效果,而且關(guān)于高維概率密度可以表示成一些一維概率密度的乘積的假設(shè)往往不成立。為了描述這一復(fù)雜的分布,考慮使用另外一種更直觀、條件更弱的概率估計方法——非參數(shù)技術(shù)[13]。非參數(shù)技術(shù)可以直接估計后驗概率,在計算上比高斯模型更便捷,同時該試驗也表明非參數(shù)技術(shù)得到了好于或相當(dāng)于高斯模型的結(jié)果。
3實驗
為了評估對貝葉斯分類器的兩種改進的有效性,在著名的FERET人臉數(shù)據(jù)庫上測試該算法。FERET人臉數(shù)據(jù)庫提供了一種標(biāo)準的測試方法:將圖像劃分為三個集合:訓(xùn)練集、原型圖像集以及測試集。在Moghaddam 的試驗中,他們在FB子測試集上測試他們的算法。本文同時在FB和FC兩個子測試集上進行了測試。其中FB與FC子集各有1 195人以及194人的照片,且每人只有一張;原型圖像集一共包含1 196人的照片,同樣也是每人一張。在訓(xùn)練該系統(tǒng)時,采用FERET的標(biāo)準訓(xùn)練集(僅包含正面人臉照片),因此,用于訓(xùn)練的訓(xùn)練集包含429人的1 002幅正面圖像。在試驗中,將圖像提供給分類器前,所有的人臉圖像都歸一化為72×96再直方圖均衡化,如圖1所示。
在實驗中比較了如下五種識別算法:
(1)BC。Moghaddam提出的貝葉斯分類器。
(2)GMM-BC。基于混合高斯模型的貝葉斯分類器。
(3)Gabor GMM-BC。將Gabor特征用于基于混合高斯模型的貝葉斯分類器。在該算法中原始的72×96大小的人臉圖像經(jīng)過前述40個Gabor濾波器得到276 480維Gabor特征;然后經(jīng)過下采樣(Down-sampling)得到15 640維特征;最后使用PCA降維到1 000維。
(4)Non-parametric-BC。使用非參數(shù)技術(shù)估計后驗概率的貝葉斯分類器。
(5)Gabor Non-parametric-BC。使用Gabor特征以及非參數(shù)技術(shù)估計后驗概率的貝葉斯分類器。
由圖2、3可以得到如下結(jié)論。
(1)非參數(shù)技術(shù)取得了優(yōu)于或相當(dāng)于高斯模型的識別結(jié)果;同時它們都優(yōu)于傳統(tǒng)的單高斯的貝葉斯分類器。
(2)使用Gabor特征的非參數(shù)技術(shù)貝葉斯分類器比高斯模型得到了更多的性能提升。
(3)在FC測試集上使用非參數(shù)技術(shù)相對于混合高斯模型得到了更好的性能;在FB測試集上它們?nèi)〉昧讼喈?dāng)?shù)臏y試結(jié)果。
由于非參數(shù)技術(shù)可以同時利用所有類內(nèi)差與類間差的信息,帶來了性能上的提升。總體來說,非參數(shù)技術(shù)取得了優(yōu)于或相當(dāng)于高斯模型的識別結(jié)果;同時又具有訓(xùn)練簡單、計算復(fù)雜度小的優(yōu)點。
4結(jié)束語
從改進概率密度估計方法出發(fā),提出了使用非參數(shù)技術(shù)估計后驗概率的貝葉斯分類器,它簡化了模型的訓(xùn)練過程。利用訓(xùn)練樣本所有類內(nèi)差與類間差的信息,將其應(yīng)用于各種貝葉斯分類器,得到了優(yōu)于或相當(dāng)于高斯模型的結(jié)果。
致謝:上海銀晨智能識別科技有限公司資助。
參考文獻:
[1]CHELLAPPA R, WILSON C L,SIROHEY S.Human and machine recognition of faces:a survey[J].Proc of the IEEE,1995,83(5):705-740.
[2]BRUNELLI R, POGGIO T.Face recognition: features versus template[J].IEEE Transactions on Pattern Analysis Machine Intelligence,1993,15(10):1042-1052.
[3]TURK M,PENTLAND A. Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[4]ZHANG Jun, YAN Yong, LADES M.Face recognition:eigenface,elastic matching and neural nets[J].Proc of the IEEE,1997,85(9):1422-1435.
[5]BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J.Eigenfaces vs fisherfaces: recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis Machine Intelligence,1997,19(7):711-720.
[6]WISKOTT L,F(xiàn)ELLOUS J M,KRUGER N,et al.Face recogniton by elastic bunch graph matching[J].IEEE Transactions on Pattern Analysis Machine Intelligence,1997,19(7):775-779.
[7]LANITIS A,TAYLOR C J,COOTES T F.Automatic interpretation and coding of face images using flexible models[J].IEEE Transactions on Pattern Analysis Machine Intelligence,1997,19(7):743-756.
[8]MOGHADDAM B,JEBARA T,PENTLAND A.Bayesian face recognition[J].Pattern Recognition,2000,33(11):1771-1782.
[9]PENEV P,ATICK J.Local feature analysis: a general statistical theory for object representation[J].Network: Computation in Neural Systems,1996,7(3):477-500.
[10]LIU C,WECHSLER H.Gabor feature classifier for face recognition[C]//Proc of the 8th International Conference on Computer Vision.[S.l.]:IEEE Computer Society,2001:270-275.
[11]WANG Xiaogang, TANG Xiaoou.Bayesian face recognition based on Gaussian mixture models[C]//Proc of the 17th International Conference on Pattern Recognition.2004:142-145.
[12]WANG Xiaogang,TANG Xiaoou.Bayesian face recognition using Gabor features[C]//Proc of ACM SIGMM Workshop on Biometrics Methods and Applications.2003:70-73.
[13] DUBA R O,HART P E,STORK D G,et al.Pattern classification[M].2nd ed.[S.l.]:Wiley,2001.
[14]PHILLIPS P J,MOONH,RIIVI A,et al.The FERET evaluation methodology for face-recognition algorithms[J].IEEE Transactions on Pattern Analysis Machine Intelligence,2000,22(10):1090-1104.
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文”