周 威,毛 力,趙鵬洋,吳 楠,程 敏,劉 梅
(西安建筑科技大學信息與控制工程學院,西安710055)
基于MB_LBP和PCA算法的人臉識別研究
周威,毛力,趙鵬洋,吳楠,程敏,劉梅
(西安建筑科技大學信息與控制工程學院,西安710055)
本文通過分析LBP算法和PCA算法各自的優缺點,針對人臉識別領域,結合了MB_LBP算法提取人臉圖像的局部特征和PCA能夠對人臉特征進行降維的優點,提出了MB_LBP+PCA的人臉識別算法。人臉圖像首先經過MB_LBP處理,然后用PCA算法對人臉特征降維,最后用SVM進行人臉特征分類與識別。在ORL人臉庫上進行了測試驗證,實驗結果表明,MB_LBP+PCA算法與傳統的PCA算法相比,識別率提高了13%以上。
特征提取;MB_LBP;PCA
當前社會運用最多的身份識別技術是以證件和身份密碼為主的傳統識別方法,然而這些識別方法存在著很大的漏洞和不安全性。人臉識別是模式識別研究領域的重要課題,也是一個目前非常活躍的研究方向。它不僅具有重要的應用價值,如在安保系統、犯罪識別及身份證明等方面,同時也是模式識別理論中比較典型的多類型判別問題。給定一個輸入圖像和檢測到的人臉區域,人臉識別是指從人臉數據庫中鑒定出一個和已檢測人臉最相似的圖像。人臉識別問題已經研究了30多年,并且研究導致了許多成功的商業應用。然而,仍然存在兩個主要挑戰:人臉姿態變化和光照變化。目前人臉識別的方法大致可分為三類,第一類是整體方法,即人臉區域的每一個像素都輸入到識別系統中,目前常用的整體方法有Kitby和Tutk等人提出的主成分分析方法(Ptincipa1Component Ana1ysis,PCA),Be1humeut等人提出的線性判別分析(Latent Diticg1et A11ocation,LDA)和Batt1ett等人提出的獨立分量分析(Independent Components Ana1ysis,ICA)等。第二類是基于特征的方法,首先檢測臉上的特征或者標志,如眼睛、鼻子和嘴巴,它們的位置和鄰域將被輸入到分類器或是數據庫,如局部二值模式(Loca1Binaty Pattetns,LBP)、局部特征分析(Loca1Featute Ana1ysis,LFA)、Gabot小波等。第三類是混合方法,結合了前兩類的融合方法。研究人員表明,在大數據方面,整體方法是有效的,能夠從整體上對人臉圖像進行描述,抓住圖像的主要信息。基于特征的方法對光照、姿態和遮擋等變化具有較強的魯棒性,但是其識別率高度依賴于特征提取和定位方法的可靠性。
LBP算法最初是用于紋理描述中,該算法具有計算簡單、特征分類能力強等特點而被Ahonen等人引入到人臉識別中。Ahonen將人臉圖像劃分為幾個互不相重疊的區域,利用LBP算子提取局部特征和直方圖統計特征,該方法在FERET人臉庫上取得了較高識別率。但是LBP算子本身還不夠完善。為了解決原始LBP算法易受噪聲影響以及計算復雜度高的問題,本文提出了基于MB_LBP和PCA的人臉識別算法,在ORL人臉庫上進行實驗,并與傳統PCA算法相比較,證明了該方法的優越性。
基本的LBP算子易受噪聲的影響,具有不穩定性。MB_LBP算法能夠改善原始LBP受噪聲的影響,提高算法的穩定性。MB_LBP算法提取圖像特征是在LBP算法的基礎上,把LBP算法中一個中心像素的應用擴展到包含多個像素的矩形區域,傳統LBP算子像素之間灰度值的比較背像素塊之間的平均灰度之間的比較所代替,即周圍矩形區域灰度值的平均值與中心矩形區域的灰度值平均值進行比較。
PCA算法是一種常用的特征提取方法。它根據圖像的統計特性進行正交變換,其目的是在數據空間中找到一組向量以盡可能地解釋數據的方差,從而用降維后的低維向量保存原數據中的主要信息。采用如下步驟提取圖像的特征信息。
(1)人臉圖像集為[Xi|i=1,..,M],其中M為訓練樣本總數,Xi為第i個訓練樣本的圖像向量,對各幅人臉圖像Xi(i=1,2,3,..,M)求出∑,并根據∑計算圖像的平均臉,并用每幅人臉圖像數據減去平均臉數據。
(2)計算圖像數據的協方差矩陣。
(3)對協方差矩陣進行奇異值分解得到圖像的特征值和特征向量,并找出前N個最大特征值對應的特征向量。
(4)將實驗樣本投影到由這些特征向量組成的子空間上,得到M個投影向量,以此M個投影向量構成實驗樣本的PCA特征。
支持向量機(Suppott Vectot Machine,SVM)是一種機器學習方法,它是在統計學習理論的基礎上發展而來,能夠較好地解決小樣本、高維度、非線性等分類問題。SVM基本思想是通過非線性變換將輸入向量映射到一個高維空間,然后在這個高維空間中求得一個最優線性分類超平面,這個超平面與各類數據的距離都最遠,從而能夠將數據盡可能的正確分類。SVM的超平面是通過判別函數求得的,判別函數如公式(1)所示。

其中k(xi,xj)稱為核函數,核函數的選取應使其為特征空間的一個點積,即存在函數Φ,使Φ(xi)·Φ(xj)=k(xi,xj)。在SVM中,常用的核函數主要有線性核、多項式核、徑向基核和二次神經網絡核函數。
本文采用了MB_LBP和PCA結合的特征提取方法,對人臉圖像進行特征提取,分類器采用SVM。實驗證明,MB_LBP+PCA的方法與傳統PCA相比,識別率有明顯提高。LBP作為一種紋理特征提取算法,可以有效的提取圖像的局部紋理特征,但是原始LBP算法存在圖像噪聲多、不穩定的特點,分塊LBP可以有效解決LBP處理圖像的噪聲問題,但是分塊過小,圖像存在噪聲,分塊過大,會使得圖像粒度化,破壞原有的很多圖像特征,因此分塊大小的選取是MB_LBP+PCA算法有待討論的問題。
10.3969/j.issn.1673-0194.2016.13.098
TP391.41
A
1673-0194(2016)13-0181-02
2016-04-14
陜西省教育廳專項科研計劃(14JK1438);西安建筑科技大學基礎研究基金項目(JC1514);2015年國家級大學生創新創業訓練計劃項目(201510703121);2015年陜西省級大學生創新創業訓練計劃項目(1136)。