周松鋒+戴曙光
摘 要:主成分分析法(PCA)由于具有高識別率和簡便性的優點,成為人臉識別技術學習者的首選。介紹了K-L變換和PCA算法的主要步驟,由于PCA算法對異常值很敏感,因此在PCA基礎上進行改進,提出了PCA-LDA人臉識別方法。該方法通過 PCA算法求得訓練樣本集的特征空間,接著執行LDA 算法獲得兩者融合的特征空間,然后對投影于特征空間的人臉進行訓練及識別。實驗結果表明,改進的PCA-LDA人臉識別算法比傳統的PCA算法識別率高,速度更快,很好地綜合了兩個算法的優點,達到了預期效果。
關鍵詞:圖像處理;人臉識別;PCA算法;LDA算法;特征空間
DOIDOI:10.11907/rjdk.172280
中圖分類號:TP312
文獻標識碼:A 文章編號:1672-7800(2018)002-0015-04
0 引言
人臉識別是最早在19世紀末由美國科學家提出的一種生物識別技術,進入新世紀以來,隨著計算機科學的快速發展,人臉識別技術也發展迅速,并以其唯一性、簡便性、隱蔽性、安全性等特點成為模式識別及圖像處理領域的研究熱點,廣泛應用于智能交通、軍事作戰、智能安防等社會領域[1]。主成分分析方法作為特征提取方法,具有快速、操作簡便等優點,但在現實中依舊會受到人臉圖像分辨率、光照、角度等要素影響,造成實際結果與理論結果有很大差距。為了提高識別率,采用圖像直方圖均衡化、中值濾波對人臉圖像進行預處理,在傳統的PCA算法上結合LDA算法消除子空間誤差,同時利用粗糙集知識和神經網絡來提高人臉識別準確率。
1 圖像預處理
圖像預處理是對待識別人臉作一些數據方面的處理,不論采用什么角度、采集設備與采集方案,得到的圖片往往并不完美,需要利用圖像預處理去除其中的噪聲等干擾信息,并突出有用信息,比如圖像邊緣信息,以更好地進行下一步識別。本文采用的圖像預處理方法包括圖像增強、噪聲抑制及邊緣檢測。
1.1 圖像增強
直方圖均衡化的主要思想是對圖像中像素個數多的灰度級進行展寬,同時壓縮像素個數少的灰度級,以擴展像素取值動態范圍,提高對比度,改善灰度色調變化,使圖像更加清晰[2]。
通過直方圖均衡化處理的效果如圖1所示。
1.2 噪聲抑制
噪聲點處像素的灰度值通常比非噪聲點像素灰度值大或小,可以用一些合適的灰度值代替噪聲點像素的灰度值,以達到理想的濾波效果。中值濾波的主要思想是,對整個圖像的灰度值進行重新排序,把灰度值突然變大(?。┑脑肼朁c放在最左(右)邊,最終研究處于中間的非噪聲點數據,以實現抑制噪聲的效果[3]。
中值濾波的基本原理是取一個二維模板矩陣,將需要濾波的圖像像素點按單調序列進行排列,然后利用濾波公式:
其中,f(x,y)、g(x,y)為原圖像和處理后的圖像,W為二維模板。中值濾波效果如圖2所示。
1.3 邊緣檢測
邊緣檢測的目的是提取圖像邊緣信息,根據邊緣情況分割圖像,獲取所需的人臉圖像。使用最多的邊緣檢測方法是Canny算子,以下為Canny算子檢測過程。
由于高斯函數具有可分性,可以把G分解成兩個在行列方向上的一維濾波器:
按照Canny的定義,計算出Gn與圖像f(i,j)的卷積在邊緣方向上的最大值即為中心邊緣點,根據每個點在梯度方向上的強度大小進行判斷,如果該點強度是最大值,該點則為邊緣點。Canny檢測效果如圖3所示。
2 K-L變換
K-L變換是指由矢量信號M的協方差矩陣ω中的歸一化特征正交矢量N所組成的正交矩陣P,對于矢量信號M作正交變換Y=PM,稱這個變換為K-L變換[4]。假定n是一個M×1的向量集合n={n1,n2,n3,…,nm},ni是變量n的平均值,可以統計M個樣本的向量估計。
向量信號在K-L變換前后是相同的,然而在變換前后各個分量各不相同。該做法不但最大程度地保留了所需信息,而且降低了圖像維數,更有利于數據的壓縮與存儲。
3 基于PCA算法的人臉識別
3.1 PCA介紹
主成分分析(PCA)是一種數學上的降維方法,其原理是將原來具有一定相關性的指標重新組合,然后用一組新的互不相關的綜合指標取代原有指標,實現對主成分分析的解釋,并且最大限度地保留原數據的結構分布,在最小均方意義下建立最能代表原始數據的投影,從而達到空間特征降維的目的[5]。
3.2 PCA算法流程
如果人臉庫有N個人臉圖像,可以用I1,I2,I3,…,IN表示,由公式得到人臉庫中人臉圖像的平均臉:
以上給出了以主成分分析為基礎的人臉識別算法的全部步驟,其中包括了重要的K-L變換,并利用MATLAB仿真軟件設計了一個人臉識別系統。通過人臉樣本的訓練建立標準庫,接著對注冊人員進行識別,并研究了特征值選擇與距離標準問題。為進一步提高人臉識別效率,研究發現PCA算法對異常數據比較敏感,異常數據會使估計子空間偏差較大,不能反映真實狀況,同時無法處理非線性數據[6]。為了嘗試解決該難點,提出利用PCA -LDA構建特征臉的方法,并通過對比實驗驗證該算法效果。
4 PCA-LDA人臉識別
LDA(Linear Discriminant Analysis)算法是從特征空間提取一些重要特征,這些特征具有判別能力,同時可以聚集同類樣本,分隔開不同樣本。選取使樣本類間離散度Sb與樣本類內離散度Sw之間比值達到最大的特征。也即是說,樣本類間離散度越大,代表樣本間間隔越大越好,樣本內離散度越小越好[7]。具體定義為:
LDA算法通常遇到的小樣本問題可以通過PCA-DAL融合算法解決,首先利用改進的PCA算法對人臉圖像進行降維處理,將人臉圖像投影到特征子空間,保證類內離散度矩陣是非奇異的,并利用LDA算法在次特征空間取得最優變換[8]。endprint
本文所述算法的運行過程分為訓練階段和測試階段,如圖6所示。
5 實驗結果
為了驗證融合算法的有效性,將融合算法與傳統PCA算法在不同維數的識別率進行對比。結果如表1所示,融合算法的識別率均比標準PCA高,這是因為融合算法的融合特征空間可以消除異常數據的影響[9]。
7 結語
改進的PCA-LDA算法在一定程度上融合了兩種算法的優點,并且通過實驗證明該算法比傳統算法更加高效,減小了光照不均勻的影響,擴寬了PCA算法應用范圍。該算法具有很好的魯棒性,可將光照和表情變化的影響降到最低,且識別性能良好,因此具有廣闊的應用前景[10]。
參考文獻:
[1] 齊興敏.基于PCA的人臉識別技術的研究[D].武漢:武漢理工大學,2007.
[2] 胡正平,李靜.基于低秩子空間恢復的聯合稀疏表示人臉識別算法[J].電子學報,2013(5):987-991.
[3] 湯德俊.人臉識別中圖像特征提取與匹配技術研究[D].大連:大連海事大學,2013.
[4] 田印中,董志學,黃建偉.基于PCA的人臉識別算法研究及實現[J].內蒙古科技與經濟,2010(6):56-57.
[5] 賈川.淺談人臉識別技術應用及發展趨勢[J].中國安防,2010(3):83-86.
[6] 陳伏兵,陳秀宏,王文勝,等.人臉識別中PCA方法的推廣[J].計算機工程與應用,2005(34):34-38.
[7] 郭聳.人臉檢測若干關鍵技術研究[D].哈爾濱:哈爾濱工程大學,2011.
[8] 陳冠潼.人臉檢測與識別算法的研究與應用[D].大連:大連理工大學,2013.
[9] 王智文,蔡啟先,陳勁飆,等.利用膚色分割和自適應模版匹配的人臉檢測[J].廣西工學院學報,2013(1):1-8,106.
[10] JING JIN, BIN XU, XIAOLIANG LIU, et al. A face detection and location method based on feature binding[J]. Signal Processing: Image Communication,2015,36(C):179-189.endprint