劉文輝 許瑞


摘 ?要:針對少數民族人臉識別效果的關鍵在于能否有效提取該民族面部特征的問題,文章提出了將3種特征提取方法——PCA、LBP和Gabor小波應用于少數民族人臉圖像特征提取的方法。首先,對少數民族人臉圖像預處理歸一化,以便消除光照姿態等影響,然后運用3種方法提取維吾爾族和哈薩克族人臉圖像的特征,最后使用K近鄰分類算法對所提取的民族特征進行了驗證,Gabor小波提取的民族特征有最好的效果,2個民族識別率達到了96.75%和97.02%。
關鍵詞:特征提取;PCA;LBP;Gabor小波
中圖分類號:TP391.41 ? ? 文獻標識碼:A 文章編號:2096-4706(2020)21-0088-03
Research on Facial Feature Extraction of Ethnic Minorities
LIU Wenhui,XU Rui
(School of Information Sciences and Technology,Xinjiang Teachers College,Urumqi ?830043,China)
Abstract:In view of the problem that the key to the effect of minority face recognition is whether the facial features can be extracted effectively,the article proposes a method to apply three feature extraction methods——PCA,LBP and Gabor wavelet to the feature extraction of minority face images. Firstly,the minority face image is preprocessed and normalized to eliminate the influence of illumination and posture. Then,three methods are used to extract the features of Uygur and Kazakh face images. Finally,the K-nearest neighbor classification algorithm is used to verify the extracted ethnic features. Gabor wavelet has the best effect,and the recognition rate of the two ethnic minorities reaches 96.75% and 97.02%.
Keywords:feature extraction;PCA;LBP;Gabor wavelet
0 ?引 ?言
少數民族面部特征研究屬于人臉識別研究的重要內容。研究表明不同民族之間存在面部特征的差異。即使同一民族在不同地域之間也會表現出細微的差異,研究這些差異有助于深化人臉識別技術,并可以作為歷史演變的重要依據。新疆地處祖國大西北,戰略地位極為重要。其中該地區主要民族成分是少數民族,具有較為獨特的面部特征。該地區人臉特征與鄰近我國的幾個國家的人臉特征有許多相似之處,因此研究該地區少數民族的人臉識別技術對促進新疆信息技術的發展有重要意義[1]。研究少數民族人臉識別,首先要考慮如何有效提取各民族典型人臉特征的數字化問題。近年來人臉識別中已經出現了一批經典人臉特征提取方法,比如:PCA和KPCA方法、Gabor小波特征、LBP特征提取、面部膚色特征提取、聚類特征等[1-3],但是人臉圖像的特征很容易被光照、表情、眼鏡、胡須等影響和干擾,因此將這些方法應用到提取人臉圖像民族特征時,需要考慮如何對圖像進行預處理,如何取消非均勻光照影響、降低表情干擾和局部遮擋影響,如何壓縮和選取特征等問題[1],為此,本研究團隊預備在這方面做一些有益探索,比如少數民族人臉圖像雙眼定位基準問題、歸一化民族圖像問題、少數民族人臉圖像五官的特征提取方法等??紤]到可以將現有人臉識別的一些方法應用于面部的民族特征提取,本研究將把PCA、LBP和Gabor小波3種特征提取方法引入到少數民族人臉圖像的特征提取上來,分析各種方法之間的差異性,揭示各個少數民族人臉圖像民族特征的基本方法。
1 ?幾種常用臉部圖像特征提取方法
人臉識別準確率的高低主要取決于對圖像有效特征的提取,其次才是具體的識別算法。研究表明人臉的特征既有反映人臉整體的全局性特征,也有反映人臉細節和局部信息的局部性特征。從人臉圖像提取方法角度來看,主要有兩類特征提取方法。一類是以反映人臉中五官位置信息的特征,我們稱之為幾何特征,這類特征提取方法主要有:特征點選取、膚色特征、距離特征等,幾何特征屬于高層特征,與人類識別的方法類似,但是提取特征時要考慮輪廓和匹配問題,自動化特征提取較為困難;一類是以人臉圖像矩陣為基礎進行各類變換,提取矩陣的統計特征,我們稱之為代數特征,這類特征提取方法主要有:PCA、傅里葉變換特征;小波特征(Gabor特征)等。其中人臉圖像的代數特征提取方法不需要考慮圖像對準匹配等操作,更適應自動化大規模操作,從而該類方法稱為當前研究的主流。本文也是選取代數特征提取方法為主來提取少數民族人臉圖像的特征。
1.1 ?PCA特征提取方法
主成分分析法(principle component analysis),該方法是將所有訓練樣本組成原始矩陣,然后對該矩陣進行正交變換[1]。具體過程如下:
將k個圖像樣本堆疊為k行,n列的矩陣:S={S1×n,S2×n,…,Sk×n},其中Si×n為第i個樣本圖像。S的協方差矩陣為:
(1)
令:
J(X)=tr(G) ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
J為投影變換,則取Max(J(X))的投影方向X即為特征向量,即:
Y=SX ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)
Y為最大方差投影方向,是包含信息最多的方向。通??梢赃x取其中d個較大特征值,其對應特征向量X1,X2,…,Xd,即為投影方向,進而可以大幅度壓縮維度。
1.2 ?LBP特征
為了進一步減少光照對人臉特征的影響,Timo等學者提出了LBP特征提取方法,并在人臉識別領域取得了較好的效果。該方法的主要思路是以圖像每個中心點像素灰度值為閾值,以r為半徑,包含p個像素點圓形區域,比較該鄰域中像素點灰度值與中心點灰度值,從而構造二進制碼,即LBP值,如圖1所示。
LBP特征可以很好反映圖像的紋理特征,且具有較強的光照魯棒性,其統計直方圖往往可以作為人臉的紋理特征[2]。
1.3 ?Gabor小波特征
Daugman最早把Gabor小波用于提取圖像特征,并發現了Gabor小波與人類視覺細胞對光信號的刺激方式有很多相似之處,且該特征對方向圖像邊緣變化響應靈敏。Gabor變換為:
(4)
其中,h(x,y)為二維Gabor濾波器,θ為Gabor濾波器的方向,σu和σv分別為高斯包絡在u軸和v軸上的標準差(u軸平行于θ、v軸垂直于θ), 為調制頻率。h(x,y)可以進行旋轉變換和尺度變換,讓圖像與濾波器h(x,y)做卷積操作,將產生一系列Gabor小波??梢詫abor函數分解為實部R(x,y)和虛部I(x,y)兩個分量,則該復函數的模就可以作為使用Gabor小波提取的圖像特征[3]。
2 ?新疆少數民族面部特征提取方法
建立高質量和大數量的少數民族人臉圖像庫是研究少數民族人臉特征的關鍵基礎,本研究在相關基金的支持下,構建了一個新疆少數民族人臉圖像庫,主要選取居住在祖國邊疆地區縣鄉的維吾爾族、哈薩克族等民族的人臉圖像,如圖2所示。
一般來說,原始圖像都存在光照、姿態、遮擋等干擾噪聲,如果不對其進行處理,將會大幅度增加特征噪聲,甚至使得特征掩蓋于噪聲中,因此需要對原始圖像做預處理工作。少數民族人臉圖像的預處理工作主要有圖像的灰度歸一化和幾何歸一化兩個方面的工作?;叶葰w一化工作的主要目的是消除光照影響,常用的方法有直方圖均衡化等方法;幾何歸一化主要消除姿態影響,主要有圖像配準方法等。
2.1 ?少數民族人臉圖像的PCA特征提取
選取維吾爾族、哈薩克族人臉圖像各600幅為樣本圖像。首先對圖像歸一化預處理,圖像大小為120×100,為消除光照影響,對圖像做直方圖均衡化處理。構建樣本矩陣S1、S2和S。S1為維吾爾族人臉圖像矩陣(600×12 000),S2為哈薩克族人臉圖像矩陣(600×12 000),S為2個民族混合人臉圖像矩陣(1 200×12 000)。其中S1中任取500個樣本作為訓練樣本,100個樣本作為測試樣本;S2按照S1同樣處理。PCA方法的主要特點是將全部人臉圖像向某個特征向量方向投影,即最大信息熵方向,為此采用如下方法投影壓縮:
對S1使用PCA算法進行維數壓縮。按照特征值大小順序排列,貢獻率設置為90.00%,這樣獲得矩陣,則取W1=E(),E為數學期望,即的均值向量作為維吾爾族人臉特征。
對S2類似處理,取W2=E(),即 ?的均值向量作為哈薩克族人臉特征。
對全體樣本矩陣S使用PCA壓縮,壓縮維數與S1相同。
樣本距離計算取歐氏距離,設x和xi為任意2個樣本向量,即:
d=‖x-xi‖ ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(5)
分類算法使用K近鄰分類算法,計算待分類圖像特征到所有圖像的歐式距離,以周圍已經分類圖像的類別為本圖像的分類類別。算法循環執行100次,識別率取均值,則維吾爾族識別率為94.63%,哈薩克族識別率為96.41%。
2.2 ?少數民族人臉圖像的LBP特征提取
在上面2個民族人臉圖像中各自選取200幅圖像,其中每個民族人臉圖像選取150幅作為訓練樣本,50幅作為測試樣本,預處理同上操作。首先需要標注少數民族人臉圖像關鍵點16處:即額頭3點、眉毛3點、眼睛1點、鼻尖1點、臉頰2點、嘴巴3點、下巴3點,然后對這16個關鍵點使用LBP算子計算,如圖3所示。
樣本距離計算還是取歐氏距離,即式(5)。分類算法使用K近鄰分類算法,分類算法循環執行100次,識別率取均值,則維吾爾族識別率為92.52%,哈薩克族識別率為94.18%??梢钥闯鯨BP特征提取的識別率略低于PCA,這主要是由于本方法僅僅標注了16個關鍵點,對面部特征的全局信息丟失較多的緣故。
2.3 ?少數民族人臉圖像的Gabor小波特征提取
按照上面方式選取維吾爾族、哈薩克族人臉圖像各300幅,共計600幅人臉圖像。選取每族100幅作為測試樣本,其余作為訓練樣本。預處理操作與前面相同。
在上面Gabor變換式(4)中,令:
k=kve-jφμ
kv=kmax/f v ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (6)
其中,f v為頻率尺度,φμ為采樣方向角度。本文采用φμ={0,π/8,π/4,3π/8,π/2,5π/8,3π/4,7π/8}8個方向,v={0,1,2,3,4}5個尺度頻率。因此,每幅圖像有40個Gabor特征圖像,將這40個特征圖像依次展開為1個樣本特征,這樣維吾爾族人臉特征圖像矩陣的階數為:300× 480 000;哈薩克族人臉圖像類似處理。采用PCA壓縮特征和取矩陣均值作為2個民族人臉的Gabor特征代表,最后使用樣本距離計算,取歐氏距離,即式(5),分類算法使用K近鄰分類算法,分類算法循環執行100次,識別率取均值,則維吾爾族識別率為96.75%,哈薩克族識別率為97.02%。可以看出Gabor小波特征提取的民族特征識別率較高,這是因為Gabor小波特征提取特征較為全面,既包含圖像局部信息,也包含全局信息,但是所提取的特征維數較高。
3 ?結 ?論
本文將人臉識別中常用的3種特征提取方法:PCA、LBP、Gabor小波,運用于少數民族人臉特征提取。探索了在使用這3種方法時,如何進行少數民族人臉圖像預處理、標識和標注關鍵點等問題,在此基礎上使用3種方法提取圖像中的民族特征,并運用K近鄰算法進行分類,以確定提取的民族特征的有效性。經研究發現維吾爾族與哈薩克族人臉特征區別明顯,特別是采用Gabor小波提取民族特征效果較好,有一定實用價值。當然另一方面由于時間所限,我們僅僅研究了2個民族的情形,如果是較多民族情形特征提取的有效性還有待進一步驗證。
參考文獻:
[1] 劉文輝,許瑞,劉華詠,等.基于分塊KPCA集成的人臉民族特征提取研究 [J].計算機科學,2014,41(9):294-297+319.
[2] 張敦鳳,高寧化,王姮,等.基于分塊LBP融合特征和SVM的人臉識別算法 [J].傳感器與微系統,2019,38(5):154-156+160.
[3] LI C,WEI W,LI J X,et al.A cloud-based monitoring system via face recognition using Gabor and CS-LBP features [J].The Journal of Supercomputing,2017,73(4):1532-1546.
作者簡介:劉文輝(1969—),男,漢族,河北深州人,畢業于華中師范大學,副教授,碩士,研究方向:圖像處理、模式識別、人臉識別等;許瑞(1967—),女,漢族,甘肅高臺人,畢業于新疆大學,副教授,碩士,研究方向:中文信息處理、模式識別等。