(大連大學 a.先進設計中心; b.遼寧省信息與科學重點實驗室 遼寧 大連 116622)
摘 要:依據主成分分析方法(PCA)對圖像具有很好的表達能力,即能很好地重構原圖像,而線性鑒別分析(LDA)可使圖像樣本具有較高可分性的特點,提出對圖像先進行PCA處理,再進行LDA處理,從而降低人臉特征維數并對人臉圖像進行了特征提取;并提出用FCM動態聚類算法作為識別分類器,對人臉進行識別。實驗和分析結果表明,在人臉識別中,這種融合PCA和LDA的分類方法能夠更好地對特征進行提取,且FCM動態聚類分類器比K近鄰判別分類器更具有靈活的分類能力。
關鍵詞:主成分分析; 線性判別分析; 模糊C均值動態聚類算法; 人臉識別
中圖分類號:TP391.41文獻標志碼:A
文章編號:1001-3695(2009)05-1947-02
Face recognition based on linear projection analysis and FCM dynamic clustering
HU Ming ZHANG Qiang WANG Zhi-pingb
(a. College of Information Engineering b.Liaoning Key Laboratory of Intelligent Information Processing Dalian University Dalian Liaoning 116622 China )
Abstract:This paper proposed a face recognition classifier based on FCM dynamic clustering. First as for linear projection principle component analysis and linear discriminant analysis were expounder. Where PCA seeked directions that were efficient for representation LDA seeked directions that were good at discriminating samples. Then used FCM dynamic clustering calculate threshold to recognize face. Experiments on ORL face database used the combining algorithms above to extract features. The experimental result indicates that the recognition performance of classifier combination in decision level is superior to others and is more robust.
Key words:principal component analysis(PCA); linear discriminant analysis(LDA); FCM dynamic clustening analysis; face recognition
人臉識別是統計模式識別領域中一個非常熱門的研究課題,具有非常廣泛的應用前景。近幾年來,人臉識別技術得到了很大的發展,相繼提出了許多優秀的算法[1,2]。PCA[2]是模式識別中的一種非參數方法,它的目標是在低維子空間表示高維數據,但模式的低維表示與基于低維表示設計的分類器性能沒有直接聯系。為了利用PCA的優勢,提高分類系統的分類能力,必須對分類器的設計進行研究。實際應用中總是希望設計的模式識別系統能獲得最好的分類性能。為了實現這個目標,經典的以K-L變換為基礎的PCA人臉識別方法是統計最優的,它使得壓縮前后的均方誤差最小,且變換后的低維空間有很好的分辨能力。但PCA方法也存在缺陷[4]:a)作為一種圖像的統計方法,圖像中的所有像素被賦予了同等的地位,可是角度、光照、尺寸及表情等干擾會導致識別率急劇下降,因此較好的識別算法都對人臉進行了矯正預處理,且只考慮裸臉;b)人臉在人臉空間的分布近似高斯分布,且普通人臉位于均值附近,而特殊人臉則位于分布邊緣,因此,越普通的人臉越難識別。很多學者對此進行了研究,文獻[5]為解決PCA在轉換人臉圖像的矩陣為高維向量時所產生的龐大運算量和矩陣奇異的問題,提出了直接基于2D人臉圖像矩陣而無須矢量化的2D-PCA方法,有效解決了運算量和矩陣奇異的問題。文獻[6]提出了比2DPCA更具有魯棒性的模塊二維主成分分析(M2DPCA)方法。為解決人臉圖像在光照、角度等其他外界因素影響的人臉識別,以及尋找更具有魯棒性的分類器,本文依據PCA對圖像具有很好的表達能力但不具備很好的可分性,而LDA可使圖像樣本具有較高可分性的特點,提出對圖像先進行PCA特征提取,再進行LDA特征提取,從而降低人臉特征維數并對人臉圖像進行了最優特征提取,顯示出很強的聚類性;并首次提出用FCM動態聚類算法作為識別分類器,對人臉進行識別。FCM動態聚類算法是一種迭代優化的無監督方法[7,8]。一方面,它具有良好的局部收斂特性;另一方面,它適合在高維特性空間中進行像素的分類。該算法是依據最小二乘原理采用迭代方法優化目標函數來獲得對數據集模糊劃分的方法[9]。
1 人臉識別算法
1.1 基于PCA和LDA的線性投影算法
基于PCA和LDA的線性投影算法可以有效地解決PCA算法可能產生非奇異分解及LDA算法存在的小樣本問題 是一種有效的分類器融合方法。
在訓練和識別之前首先要對圖像進行歸一化處理,使其具有一個統一的大小。假設歸一化后的圖像有C類,每類有N個樣本,樣本總數M=N×C。訓練階段的步驟如下:
a)設歸一化后的人臉圖片為xij=(i=1,2,…,N),計算平均臉
f=1/M∑Ci=1∑Nj=1xij(1)
b)計算每一幅人臉與平均臉的差值:
dij=xij-f(2)
c)構建協方差矩陣:
U=1/M∑Ci=1∑Nj=1dijdTij(3)
d)求出U的特征值,并取前K個最大特征值的特征向量組成一個PCA的投影矩陣WPCA。
e)將所有訓練樣本投影到步驟d)中的K維投影子空間,得到降維后的特征向量
ηij=WTPCAdij(4)
f)計算所有樣本的均值向量m以及第i類人臉樣本的均值向量mi
m=1/M∑Ci=1∑Nj=1ηij(5)
mi=1/N∑Nj=1ηij(6)
g)按照式(1)和(2)計算樣本類內離散度矩陣和類間離散度矩陣:
Sw=∑Ci=1∑Mj=1pi(ηij-mi)(ηij-mi)T(7)
SB=∑Ci=1pi(mi-m)(mi-m)T(8)
h)計算矩陣S-1wSB特征向量 并取前t個最大特征值的特征向量組成線性判別式分析(LDA)的投影矩陣WLDA。
i)用步驟e)中同樣的方法 將所有訓練樣本投影到t維子空間 得到最佳分類特征:
Γij=WTLDAηij=WTLDAWTPCAdij;i=1,2,…,N
這就是含有C類特征的人臉識別數據庫。
1.2 FCM動態聚類算法
模糊C均值聚類算法是一種迭代優化的無監督方法,它具有良好的局部收斂特性,適合在高維特性空間中進行像素的分類。該算法是依據最小二乘原理,采用迭代方法優化目標函數來獲得對數據集模糊劃分的方法。它的目標(損失)函數定義為
JFCM(U,V)=∑nk=1 ∑ci=1μmik‖Xk-Vi‖(9)
其中:X={x1,x2,…,xk,…,xn} 表示數據集X,xk為p維向量;m∈[1,∞)為加權指數,且m取得越大,所得的分類矩陣模糊程度越大,m=1時為硬分類,通常取值為2;vi是p維向量,其vi表示第i類聚類中心;μik為第k個像素屬于第i類的隸屬度,如果將X分為c類,使得每一類中至少包含一個樣本,再將每一樣本屬于某一類的程度用模糊隸屬度表示,則分類結果可用c×n階模糊矩陣U表示:
U=μ11 μ12 … μ1n
μ21 μ22 … μ2n
μc1 μc1 … μcn(10)
這里μik需要滿足如下約束條件:
μik∈[0,1],1≤i≤cc1≤k≤nk;∑ci=1μik=1,1≤k≤nk;0<∑ci=1μik<n,1≤i≤cc(11)
JFCM=(U,V)表示各類中樣本到聚類中心的加權距離平方和。聚類準則取為尋求最佳組對(U,V),以使JFCM=(U,V)取得最小值,結合式(8)中的約束條件,利用拉格朗日乘數法求解可以得到
μik=1/∑cj=1[‖xk-vi‖2/‖xk-vj‖2]1/(m-1)(12)
vi=∑nk=1μmikxk/∑nk=1μmik(13)
識別階段的步驟如下:
a)用待識別的人臉圖像減去平均臉,得到差值矩陣uij。
b)對uij做兩次投影變換,得到最佳分類特征Γ。
c)確定聚類類別數c=2和加權指數m,設定迭代停止閾值ε為一小正數,初始化迭代次數l=0和模糊分類矩陣U(0)。
d)將u(l)代入式(13)計算聚類中心矩陣V(l)。
e)根據式(12),利用V(l)更新U(l),得到新的模糊分類矩陣U(l+1) 。
f)若‖U(l)-U(l+1)‖<ε,停止;否則置l=l+1返回d)。
g)依據聚類中心θ進行人臉識別的判別。
2 實驗結果與分析
本文研究的原始圖像取自ORL人臉數據庫。ORL人臉圖像是在不同時間、不同視角、各種表情(閉眼/睜眼、微笑/吃驚/生氣/憤怒/高興)和不同臉部細節(戴眼鏡/沒戴眼鏡、有胡子/沒胡子、不同發型)的條件下拍攝的。該數據庫由400幅大小為112×92、灰度級為256的人臉圖像所組成。每人10幅,共40人。訓練集由每人前5幅共200幅人臉圖像所組成。測試集由每人后5幅共200幅人臉圖像所組成,且訓練集和測試集中的人臉圖像互不重疊。訓練集的樣本分為40類,每類5幅圖像。圖1是其中一個人的5幅樣本圖。
本文算法實驗環境為MATLAB 7.0,圖2是從實驗中選取的部分實驗結果圖。實驗表明,本算法在ORL人臉庫中不同的人臉表情和不同臉部細節方面都具有較強的魯棒性。
為了驗證本文方法的效果,進行了對比實驗。在本次實驗中,分別對PCA、2DPCA、M2DPCA、PCA+LDA及PCA+LDA+FCM方法作對比研究。