摘 要:最佳鑒別平面作為一種重要的特征抽取方法,在人臉特征降維中具有重要的影響。然而,傳統(tǒng)的最佳鑒別平面是基于Fisher準(zhǔn)則的,只能用于有監(jiān)督模式。為此,提出了一種將最佳鑒別平面擴(kuò)展到無監(jiān)督模式下的方法,其基本思想是以投影空間中模糊類間離散度和模糊類內(nèi)離散度的比值最大為優(yōu)化目標(biāo),計(jì)算出無監(jiān)督模式下最佳鑒別矢量及模糊離散度矩陣,進(jìn)而獲得一種新的基于無監(jiān)督最佳鑒別平面的特征抽取方法。較之同屬于無監(jiān)督特征抽取的主成分分析,該方法更容易獲得有利于分類的特征。對(duì)CMUPIE人臉數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn),結(jié)果表明,在樣本類別信息缺失的情況下,該方法盡管無法具有與有監(jiān)督模式下的最佳鑒別平面特征抽取方法同樣的性能,但當(dāng)不同類之間差異較大時(shí),將優(yōu)于主成分分析方法。
關(guān)鍵詞:人臉識(shí)別; 特征抽取; 最佳鑒別平面; 無監(jiān)督模式
中圖分類號(hào):TP181文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2010)06-2352-04
doi:10.3969/j.issn.10013695.2010.06.102
Face recognition based onunsupervised optimal discriminant plane
CAO Suqun1,2, WANG Shitong1, WANG Jun1,3
(1.School of Information, Jiangnan University, Wuxi Jiangsu 214122, China; 2.Faculty of Mechanical Engineering, Huaiyin Institute of Technology, Huaian Jiangsu 223003, China; 3.School of Computer Science Technology, Nanjing University of Science Technology, Nanjing 210093, China)
Abstract:As an important supervised feature extraction method, optimal discriminant plane has great influence in the facial feature reduction. However, traditional optimal discriminant plane is based on Fisher criterion function and it can only be used in supervised pattern. This paper presented a novel method to extend optimal discriminant plane to unsupervised pattern. Using the maximum ratio between fuzzy betweenclass scatter and withinclass scatter in the projection space as its optimization objective, an optimal discriminant vector and fuzzy scatter matrixes in unsupervised pattern could be figured out. With these, obtained a novel feature extraction method based on unsupervised optimal discriminant plane. Compared to principal component analysis(PCA) unsupervised feature extraction algorithm,this method is easier to get the features for the classification. The experimental results for CMUPIE face database demonstrate that although this method can’t have the same performance of traditional optimal discriminant plane in the condition of unlabelled data, it is superior to principal component analysis when the difference between one class and the another class is big.
Key words:face recognition; feature extraction; optimal discriminant plane; unsupervised pattern
0 引言
人臉識(shí)別是當(dāng)前計(jì)算機(jī)模式識(shí)別領(lǐng)域的研究熱點(diǎn),它屬于生物特征識(shí)別技術(shù),在護(hù)照、信用卡、駕照、刑偵等身份鑒別領(lǐng)域有著廣泛的應(yīng)用前景。人臉識(shí)別研究主要圍繞三個(gè)方面來進(jìn)行,包括圖像分割、特征抽取和人臉分類[1]。特征抽取作為特征降維的一種,是人臉識(shí)別中的關(guān)鍵步驟,特征臉和Fisher臉是目前較為流行的人臉特征抽取方法,它們的理論基礎(chǔ)分別是主成分分析(principle component analysis,PCA) [2,3]和線性判別分析(linear discriminant analysis,LDA) [4]。
PCA方法是1901年P(guān)earson在研究回歸分析時(shí)附帶提出的,其數(shù)學(xué)基礎(chǔ)是在1933年由Hotelling奠定的,隨著模式識(shí)別、機(jī)器學(xué)習(xí)等的興起與發(fā)展,PCA成為該領(lǐng)域特征抽取最重要的手段之一[3]。PCA將原數(shù)據(jù)空間投影到一個(gè)新的坐標(biāo)空間,并保證在新坐標(biāo)空間中保存的數(shù)據(jù)能量最大,該思想來源于KarhunenLoeve變換,其目的是通過線性變換找到一組最優(yōu)的單位正交向量基 (也稱主成分),用這組向量基的線性組合來重建原樣本,并使得重建后的樣本和原樣本的誤差最小。PCA在圖像處理、人臉識(shí)別、文本聚類等領(lǐng)域展示了良好的降維性能[5~7]。
LDA是在Fisher準(zhǔn)則[8]下的線性投影變換,通過變換使模式在投影空間中類間離散度和類內(nèi)離散度的比值最大,從而得到最有利于分類的模式特征,這種方法又叫Fisher線性判別(Fisher linear discriminant,F(xiàn)LD)。Belhumeur等人[9]以兩類兩維樣本為例,對(duì)PCA與FLD作了對(duì)比,如圖1所示,將二維數(shù)據(jù)投影到一維時(shí),PCA選擇的投影方向顯然不如FLD選擇的投影方向更能區(qū)分這兩類,因此,F(xiàn)LD更強(qiáng)調(diào)類別間的可分性。與FLD相比,PCA在降維的同時(shí)也容易丟失樣本內(nèi)有助于判別的信息。
由于LDA只能獲得一個(gè)最佳鑒別矢量,為此,Sammon[10]對(duì)其進(jìn)行了擴(kuò)展,提出了最佳鑒別平面技術(shù),即在Fisher準(zhǔn)則函數(shù)取得最大值的條件下,求得與Fisher鑒別矢量正交的第二個(gè)最佳鑒別矢量,進(jìn)而構(gòu)成最佳鑒別平面。1975年,F(xiàn)oley等人[11]將其進(jìn)一步擴(kuò)展,提出了最佳鑒別矢量集技術(shù)。1982年,Longstaff[12]提出了分別基于FukunagaKoontz變換和基于徑矢(radius vector)的最佳鑒別平面。1992年,程永清等人[13]探討了小樣本情況下求解最佳鑒別平面的方法。1999年,金忠等人[14]證明構(gòu)成最佳鑒別平面的兩個(gè)鑒別矢量是統(tǒng)計(jì)相關(guān)的,提出將正交約束條件更改為總體散布矩陣共軛正交條件,以求得統(tǒng)計(jì)不相關(guān)的兩個(gè)鑒別矢量,進(jìn)而獲得了具有統(tǒng)計(jì)不相關(guān)性的最佳鑒別平面。2000年,趙海濤等人[15]指出由于類間散布矩陣是對(duì)稱矩陣,存在既滿足正交又滿足總體散布矩陣共軛正交兩個(gè)條件的鑒別矢量,并基于此,提出了一種改進(jìn)的最佳鑒別平面技術(shù)。此后,吳小俊等人[16~18]從譜分解和廣義統(tǒng)計(jì)不相關(guān)角度分別對(duì)最佳鑒別平面技術(shù)進(jìn)行了拓展。
上述的這些最佳鑒別平面的技術(shù)都是以基于Fisher準(zhǔn)則求得Fisher最佳鑒別矢量為基礎(chǔ)的。由于傳統(tǒng)上無法通過未標(biāo)記樣本計(jì)算Fisher最佳鑒別矢量,這些方法只能用于有監(jiān)督模式。針對(duì)此,本文給定模糊Fisher準(zhǔn)則的定義,通過對(duì)該準(zhǔn)則優(yōu)化,在無監(jiān)督模式下求得最佳鑒別矢量,進(jìn)而給出最佳鑒別平面擴(kuò)展到無監(jiān)督模式的方法,并將其應(yīng)用于人臉識(shí)別。
1 Fisher準(zhǔn)則與最佳鑒別平面
設(shè)X包含N個(gè)d維樣本x1,x2,…,xN,可用d×N矩陣表示,模式類別有c個(gè),各類別樣本數(shù)分別為Ni(i=1,2,…,c),有N1+N2+…+Nc=N, 定義模式類間散布矩陣Sb和類內(nèi)散布矩陣Sw分別為
Sb=∑ci=1NiN(mi-x)(mi-x)T
Sw=1N∑ci=1∑Nij=1(xij-mi)(xij-mi)T
其中:mi(i=1,2,…,c)是第i類樣本的均值向量,是總體樣本的均值向量。
定義Fisher準(zhǔn)則函數(shù)為
JF(ω)=ωTSbωωTSwω,ω≠0(1)
使JF(ω)取得極大值的矢量ω1稱為最佳鑒別矢量,此時(shí),樣本在ω1方向投影將具有最大類間散布和最小類內(nèi)散布。使用拉格朗日(Lagrange)乘子法求解知,當(dāng)Sw非奇異時(shí),有
Sbω1=λSwω1(2)
其中:λ為L(zhǎng)agrange乘子,ω1為該廣義特征方程中最大的特征值對(duì)應(yīng)的特征向量。通過Y=ωT1X,實(shí)現(xiàn)模式X由d維向一維的投影轉(zhuǎn)換。
根據(jù)Sammon[10]的思想,在Fisher準(zhǔn)則函數(shù)取最大值的條件下,求得與Fisher最佳鑒別矢量ω1正交的第二個(gè)最佳鑒別矢量ω2,從而由ω1、ω2構(gòu)成最佳鑒別平面。
顯然,ω2是在滿足下列正交條件下使得式(1)取得最大值的向量:
ωT2ω1=0(3)
經(jīng)求解,ω2是下列廣義特征方程中最大的特征值對(duì)應(yīng)的特征向量:
PSbω2=λSwω2(4)
其中:P=I-ω1ωT1S-1wωT1S-1wω1, I是d×d的單位矩陣。
通過Y=ωT1ωT2X,實(shí)現(xiàn)模式X由d維向二維的投影轉(zhuǎn)換。
2 模糊Fisher準(zhǔn)則與無監(jiān)督最佳鑒別平面
設(shè)uij為隸屬函數(shù),表示第j個(gè)d維樣本隸屬第i類的程度,uij∈[0,1]且對(duì)于所有j,有∑ci=1uij=1;m為模糊指數(shù),m>1。
在樣本空間,定義各類樣本均值向量記為mi,模糊類內(nèi)散布矩陣記為
Sfw=∑ci=1∑Nj=1umij(xj-mi)(xj-mi)T(5)
模糊類間散布矩陣記為
Sfb=∑ci=1∑Nj=1umij(mi-)(mi-)T(6)
設(shè)y=ωTx,在該投影空間,定義各類樣本均值向量記為i,有
i=ωTmi(7)
定義模糊類內(nèi)散布矩陣記為
S~fw=∑ci=1∑Nj=1umij(yj-i)(yj-i)T=ωTSfwω
模糊類間散布矩陣記為
S~=∑ci=1∑Nj=1umij(i-)(i-)T=ωTSfbω
定義模糊Fisher準(zhǔn)則(fuzzy Fisher criterion)函數(shù)[19]:
JFFC=S~fbS~fw=ωTSfbωωTSfwω(8)
使用Lagrange乘子法求解JFFC取得極大值時(shí),ω、mi和uij的取值。
定義Lagrange函數(shù)為
L=ωTSfbω-λωTSfwω+∑Nj=1λj(∑ci=1uij-1)
式中λ和λj(j=1,2,…,n)為L(zhǎng)agrange乘子。
將L分別對(duì)ω、mi和uij求偏導(dǎo)數(shù),并令偏導(dǎo)數(shù)為零,由此,可給定如下約束條件:
Sfbω=λSfwω(9)
當(dāng)Sfw可逆時(shí),λ取為S-1fwSfb的最大特征值,ω取其對(duì)應(yīng)的特征向量。
mi=∑Nj=1umij(xj-1λ)∑Nj=1umij(1-1λ)(10)
uij=F1F2(11)
其中:
F1=(ωT(xj-mi)(xj-mi)Tω-1λωT(mi-)(mi-)Tω)-1m-1
F2=∑ck=1(ωT(xj-mk)(xj-mk)Tω-1λωT(mk-)(mk-)Tω)-1m-1
由于uij∈[0,1],對(duì)式(11)給出如下限定條件,若
ωT(xj-mi)(xj-mi)Tω≤1λωT(mi-)(mi-)Tω(12)
則uij=1,且對(duì)所有i′≠i,有ui′j=0。
在模糊Fisher準(zhǔn)則函數(shù)取最大值的條件下,使用以上公式進(jìn)行迭代運(yùn)算,最終可由式(9)求得模糊Fisher最佳鑒別矢量,記為ω1。
在此基礎(chǔ)上,求得與ω1正交且模糊Fisher準(zhǔn)則函數(shù)取最大值的第二個(gè)鑒別矢量ω2,由ω1、ω2構(gòu)成無監(jiān)督最佳鑒別平面,求解方法可參照定理1。
定理1 若ω2是在滿足下列正交條件下使得式(8)取得最大值的向量:
ωT2ω1=0(13)
則ω2是下列廣義特征方程中最大特征值對(duì)應(yīng)的特征向量:
PSfbω2=λSfwω2(14)
其中:P=I-ω1ωT1S-1fwωT1S-1fwω1, I是d×d的單位矩陣。
證明 采用Lagrange乘子法,定義:
L=ωTSfbω-λωTSfwω-βωTω1
其中λ和β均為拉格朗日乘子。
對(duì)ω求導(dǎo),有
Lω=02Sfbω-2λSfwω-βω1=0(15)
將式(15)兩邊同乘ωT,得
2ωTSfbω-2λωTSfwω=0λ=ωTSfbωωTSfwω(16)
由此式可知,λ表示該表達(dá)式取得的最大值。
將式(15)兩邊同乘ωT1S-1fw,得
2ωT1S-1fwSfbω-2λωT1S-1fwSfwω-βωT1S-1fwω1=0(17)
βωT1S-1fwω1=2ωT1S-1fwSfbω
β=2(ωT1S-1fwω1)-1ωT1S-1fwSfbω
將此式代入式(15),得
2Sfbω-2λSfwω-ω1×2(ωT1S-1fwω1)-1ωT1S-1fwSfbω=0
Sfbω-ω1(ωT1S-1fwω1)-1ωT1S-1fwSfbω=λSfwω
I-ω1ωT1S-1fwωT1S-1fwω1Sfbω=λSfwω(18)
根據(jù)式(16),由于λ是模糊Fisher準(zhǔn)則函數(shù)最大值,ω即為該廣義特征方程中最大特征值對(duì)應(yīng)的特征向量,證明完畢。
通過以上分析,求得ω1和ω2,進(jìn)而由
Y=ωT1ωT2X(19)
實(shí)現(xiàn)模式X由d維向二維的投影轉(zhuǎn)換。
綜上所述,提出一種基于無監(jiān)督最佳鑒別平面(unsupervised optimal discriminant plane,UODP)的特征抽取算法。UODP算法描述如下:
a)給定閾值ε或迭代次數(shù),使用Kmeans算法初始化隸屬矩陣U以及聚類中心mi;
b)使用式(5)(6)分別計(jì)算Sfw、Sfb;
c)根據(jù)式(9)求得廣義特征方程的最大特征值λ,并取ω1為屬于λ的模為1的特征向量;
d)使用式(10)(11)分別計(jì)算新的隸屬矩陣U以及聚類中心mi;
e)使用式(8)計(jì)算模糊Fisher準(zhǔn)則函數(shù)JFFC,若它相對(duì)上次準(zhǔn)則函數(shù)數(shù)值的改變量小于閾值ε或迭代次數(shù)超過設(shè)定次數(shù),則轉(zhuǎn)f),否則返回b);
f)使用式(14)計(jì)算λ2和對(duì)應(yīng)的ω2;
g)使用式(19)完成特征抽取,算法結(jié)束。
3 實(shí)驗(yàn)結(jié)果及分析
采用美國(guó)卡耐基梅隆大學(xué)的姿態(tài)、光照和表情數(shù)據(jù)庫CMUPIE[20]進(jìn)行測(cè)試,以便比較主成分分析(PCA)、獨(dú)立成分分析(ICA)[21] 、無監(jiān)督最佳鑒別平面(UODP)和傳統(tǒng)最佳鑒別平面(ODP)等特征抽取方法在人臉數(shù)據(jù)降維中的性能。
CMUPIE數(shù)據(jù)庫收集了68個(gè)人的41 368幅圖像,分別是每個(gè)人在13種不同姿態(tài)、43種不同光照以及4種表情下的圖像。本實(shí)驗(yàn)選取C05、C07、C09、C27、C29五個(gè)姿態(tài)以及不同光照和表情的圖像 [22]中差異明顯的一男一女兩個(gè)人圖像作為實(shí)驗(yàn)數(shù)據(jù)。圖2為實(shí)驗(yàn)中所用部分圖像。
為避免小樣本問題,分別將圖像分辨率縮小到4×4、6×6、8×8、10×10、12×12、14×14、16×16以及18×18的大小,分別取每人前15%和20%圖像作為訓(xùn)練集,其余圖像作為測(cè)試集,使用最近鄰分類器,對(duì)分別采用PCA、FastICA[18]、UODP和ODP得到的降維數(shù)據(jù)進(jìn)行測(cè)試。經(jīng)測(cè)試,采用ODP有監(jiān)督特征降維,除了在圖像分辨率為4×4時(shí),錯(cuò)分10個(gè)外,其余均能100%正確分類。這一方面說明了樣本類別信息對(duì)降維的重要性,體現(xiàn)了ODP屬于有監(jiān)督特征降維的優(yōu)點(diǎn);另一方面也證明了此兩類人臉數(shù)據(jù)具有良好的可分性。而對(duì)采用PCA、fastICA和UODP得到的降維數(shù)據(jù)進(jìn)行測(cè)試所得錯(cuò)分樣本數(shù)如表1所示。
a)由于屬于有監(jiān)督特征抽取的ODP方法有效地利用樣本類別信息,在三種降維方法中占有絕對(duì)的優(yōu)勢(shì),當(dāng)圖像分辨率在6×6~18×18,采用ODP特征抽取降維數(shù)據(jù)進(jìn)行最近鄰分類器分類的錯(cuò)分?jǐn)?shù)均為0,也說明了原兩類人臉數(shù)據(jù)具有良好的可分性。
b)采用UODP特征降維數(shù)據(jù)與PCA和FastICA特征降維數(shù)據(jù)人臉識(shí)別相比,錯(cuò)分?jǐn)?shù)較少。由于無監(jiān)督最佳鑒別平面技術(shù)強(qiáng)調(diào)投影空間類內(nèi)相對(duì)集中的同時(shí),還強(qiáng)調(diào)類間相對(duì)分散,當(dāng)類別數(shù)據(jù)具有良好的可分性時(shí),UODP比PCA更易于獲取有利于分類的特征。
c)采用總數(shù)據(jù)的20%作為測(cè)試集時(shí),PCA在分辨率為4×4、10×10和14×14時(shí)優(yōu)于UODP;而采用總數(shù)據(jù)的15%作為測(cè)試集時(shí),PCA僅在分辨率為10×10時(shí)優(yōu)于UODP。
相比較而言,采用總數(shù)據(jù)的20%作為測(cè)試集時(shí),PCA性能更好,主要的原因在于PCA算法需要一個(gè)數(shù)據(jù)量充足的協(xié)方差矩陣,當(dāng)測(cè)試集數(shù)據(jù)量較少時(shí),將導(dǎo)致PCA計(jì)算不夠準(zhǔn)確,從而造成性能下降。
與PCA相比,UODP對(duì)測(cè)試數(shù)據(jù)占15%與20%不敏感,兩種情況下均具有較為穩(wěn)定的性能。
4 結(jié)束語
本文針對(duì)特征降維,提出了一種基于模糊Fisher準(zhǔn)則的無監(jiān)督最佳鑒別平面,并將其應(yīng)用于無監(jiān)督特征抽取。該方法改變了傳統(tǒng)最佳鑒別平面只能在有監(jiān)督模式下運(yùn)用的情況,拓展了最佳鑒別平面技術(shù)使用范圍。對(duì)CMUPIE人臉數(shù)據(jù)降維后的人臉識(shí)別實(shí)驗(yàn)結(jié)果表明,盡管由于樣本信息的缺失,本方法無法獲得與用于有監(jiān)督特征降維的傳統(tǒng)最佳鑒別平面同樣的性能,但當(dāng)樣本類別差異大,能夠很好地利用模糊類間離散度,從而獲得比同屬于無監(jiān)督特征抽取的PCA以及ICA方法更好的性能。必須指出,該方法在多樣本數(shù)據(jù)降維中取得較好的效果,對(duì)于小樣本數(shù)據(jù)降維問題,在未來工作中還需加以研究。
參考文獻(xiàn):
[1]JIN Z, YANG J Y, HU Z S, et al. Face recognition based on the uncorrelated discriminant transformation[J]. Pattern Recognition, 2001, 34(7):1405-1416.
[2]WEBB A R. Statistical pattern recognition[M]. 2nd ed. New York: Wiley, 2002.
[3]王玨, 周志華, 周傲英. 機(jī)器學(xué)習(xí)及其應(yīng)用[M]. 北京: 清華大學(xué)出版社, 2006.
[4]邊肇祺, 張學(xué)工. 模式識(shí)別[M]. 2版. 北京: 清華大學(xué)出版社, 2000.
[5]HSIEH P C, TUNG P C. A novel hybrid approach based on subpattern technique and whitened PCA for face recognition[J]. Pattern Recognition, 2009, 42(5):978-984.
[6]MYOUNG S P, JIN Y C. Theoretical analysis on feature extraction capability of classaugmented PCA [J]. Pattern Recognition, 2009, 42(11):2353-2362.
[7]VENKATESH Y V, KASSIM A A, RAMANA MURTHY O V. A novel approach to classification of facial expressions from 3Dmesh datasets using modified PCA[J]. Pattern Recognition Letters, 2009, 30(12):1128-1137.
[8]FISHER R A. The use of multiple measurements in taxonomic problems[J]. Ann Eugenics, 1936,7:178-188.
[9]BELHUMEUR P N, HESPANHA J P, KRIEGMAN D J. Eigenfaces vs. Fisher faces: recognition using class specific linear projection[J]. IEEE Trans on PatternAnal Mach Intell, 1997,19(7):711-720.
[10]SAMMON J W. An optimal discriminant plane[J]. IEEE Trans on Computers, 1970,19(9):826-829.
[11]FOLEY D H, SAMMON J W. An optimal set of discriminant vectors[J]. IEEE Trans on Computers, 1975, 24(3):281-289.
[12]LONGSTAFF I D. On extensions to fisher’s linear discriminant function[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1987, 9(2): 321-325.
[13]程永清, 莊永明, 楊靜宇. 小樣本下的最佳鑒別平面[J]. 華東工學(xué)院學(xué)報(bào), 1992, 61(1):1-5.
[14]金忠, 婁震, 楊靜宇. 一種具有統(tǒng)計(jì)不相關(guān)性的最佳鑒別平面[J]. 模式識(shí)別與人工智能, 1999, 12(3):334-338.
[15]趙海濤, 金忠. 一種改進(jìn)的最佳鑒別平面[J]. 南京理工大學(xué)學(xué)報(bào), 2000, 24(1): 88-92.
[16]吳小俊, 楊靜宇, 王士同,等. 基于譜分解的FS最佳鑒別平面及艦船識(shí)別研究[J]. 船舶力學(xué), 2003, 7(2):116-120.
[17]吳小俊,楊靜宇,王士同,等. 改進(jìn)的統(tǒng)計(jì)不相關(guān)最優(yōu)鑒別矢量集[J]. 電子與信息學(xué)報(bào), 2005, 27(1):47-50.
[18]WU X J, WANG S T, ZHENG Y J, et al. A new statistically uncorrelated discriminant plane[C]//Proc of International Conference on Neural Networks and Brain. 2005:712-716.
[19]曹蘇群, 王士同, 陳曉峰,等. 基于模糊Fisher準(zhǔn)則的半模糊聚類算法[J]. 電子與信息學(xué)報(bào), 2008, 30(9):2162-2165.
[20]RALPH G. Robotics Institute: PIE database[EB/OL]. (2001). http://www.ri.cmu.edu/research_project_detail.html?project_id =418menu_id=261.
[21]FastICA package for MATLAB[EB/OL].(2007). http://www.cis.hut.fi/projects/ica/fastica/.
[22]CAI D, HE X, HAN J, et al. Orthogonal Laplacianfaces for face recognition[J]. IEEE Trans on Image Processing, 2006,15(11): 3608-3614.