摘 要:人臉特征點的定位是自動人臉識別系統和人臉表情識別的重要組成部分,小波變換是近年發展起來的一種有效的信號分析工具。在小波變換基礎上,提出了一種基于多尺度梯度矢量的對稱變換方法,將此方法應用于人臉特征點定位,不僅減少了計算量,而且提高了定位準確度,同時對光照變化和人臉表情變化也具有很強的魯棒性。
關鍵詞:小波變換;特征點定位;對稱變換;融合
中圖分類號:TP391文獻標識碼:B
文章編號:1004-373X(2008)07-154-03
Location of Facial Feature Based on Wavelet Transform and Gradient Vector
CHEN Jie,WANG Dianhong
(Institute of Mechanical and Electronic Engineering,China University of Geosiciences,Wuhan,430074,China)
Abstract:Location of facial feature plays an important part in automatic recognition technology of facial and facial expression,and wavelet transform is a new signal analysis theory developed in recent years.A symmetry transform approach based on multi-scale gradient vector and wavelet transform is proposed.This method applies to location of facial can yield results with higher location accuracy.In addition,the method is also robustness to different illuminant condition and facial expression.
Keywords:wavelet transform;feature points location;symmetry transform;fusion
隨著多媒體技術的發展,人臉圖像在人機交換系統、視頻監測系統、人臉圖像數據庫管理系統、人臉檢測與識別系統等領域中具有越來越重要的作用。而在這些應用系統當中,人臉特征定位是重要組成部分之一,是許多其他的人臉圖像研究工作的前提,直接關系到其他研究工作能否順利地進行。目前關于特征點定位的方法很多,有的研究人員提出了將人臉視為一個整體模式馬塞克方法[1]和特征臉方法[2]等。還有的提出了基于人臉個別器官的特征點的定位方法,如:神經網絡方法[3],廣義對稱方法[4]等。針對上述算法適用性不夠廣泛,對圖像要求較高的缺點,提出了融合小波信息的對稱性檢測方法并應用于人臉特征點定位。小波變換因其良好的時頻局部化特性,能夠提供最為實質的人臉特征、削弱噪聲的干擾、減少計算量,因此將小波變換應用于人臉特征點定位具有良好的發展前景。
1 基于小波變換的眼睛定位
1.1 圖像信號的小波分解
在圖像處理中,信號是一個能量有限的二維函數 f(x,y)∈L2(R2) ,對于多分辨率空間{Vj}j∈Z,如果尺度函數是可分的,即:
φ(x,y)=φ(x)φ(y)[JY](1)
圖像f(x,y)在分辨率2-j下的逼近仍然等于在對應多分辨率空間Vj上的正交投影,可由以下內積表征:
Sj=[
而在分辨率2- j+1離散逼近圖像Sj-1和在分辨率2-j下的離散逼近圖像Sj的信息差可由三個小波基:
類似于一維情況,式(2)和式(4)計算Sj和Dk,j(k=1,2,3)的內積可以用二維卷積來表征。由于3個小波Ψ1(x,y),Ψ2(x,y)和Ψ3(x,y)完全由可分離的φ(#8226;)和Ψ(#8226;)的乘積給出,所以他們的卷積寫成:式(5)表明,在二維情況,Sj和Dk,j的卷積可以分別沿x軸和y軸對信號進行濾波來計算。這樣,對于任意J>0,離散圖像S0完全由(3J+1)幅離散圖像表示:這組圖像稱為二維正交小波表示,Sj是一幅參考的粗糙圖像,Dk,j給出不同方向和不同分辨率的細節圖像,在算法實現上,二維圖像的小波分解可以用類似于一維分解的樹狀算法來實現。二維小波變換可以看作是分別沿x軸和y軸的一維小波變換,在每一層分解中,Sj-1被分解成Sj,D1,j,D2,j和D3,j,如圖1所示。
圖1 二維小波分解
由圖2可見,我們首先用Sj-1的行與一維濾波器卷積,并經2∶1選抽;再用生成信號的列與另一維濾波器卷積,也經2∶1選抽。
圖2 小波分解示意圖
1.2 眼睛定位算法
[BT4]1.2.1 廣義對稱變換
圖像上任意一點pk(xk,yk)k=1,…,K,(K為圖像上像素總數)的方向梯度表示為:
pk=xpk,ypk[JY](7)
梯度矢量相角為:
θk=arctanxpk[HT3]/[HT10.SS]ypk[JY](8)
對于圖像上任意兩點pi,pj,其連線l與水平線的逆時針夾角記為aij,aij的取值為[0,π],定義鄰域:
Γ(p)=(i,j)pi+pj2=p[JY](9)
他是以p為連線中心點的點對集。
定義i,j間高斯距離為:
Dσ(i,j)=12πσexp-‖pi-pj‖2σ[JY](10)
其中σ用于控制距離有效范圍,稱為距離控制因子。方向因子記為:
p(i,j)=[-cos(θi+θj-2aij)][-cos(θi-θj)][JY](11)
則點p處廣義對稱變換的強度定義為:
Mσ(p)=∑(i,j)∈Γ(p)C(i,j)[JY](12)
其中C(i,j)=Dσ(i,j)p(i,j)rirj,rk=log(1+‖pk‖)。
廣義對稱變換的方向定義為:
φ(p)=Maxφ(p)φ(p)=θi+θj2,(i,j)∈Γ(p)[JY](13)
通過計算圖像各點的對稱強度Mσ(p),就可找出局部強對稱點,從而實現對稱物體的對稱中心準確定位,并可根據φ(p)來確定其對稱方向。
1.2.2 小波算法融合
實驗證明,雖然廣義對稱算法對特定的人臉圖像有較好的定位效果,但他應用成像質量較差的人臉圖像,不僅定位準確率比較低,而且所用時間長。而小波的應用恰能將圖像的細節信息提取出來,利用反對稱正交小波的微分功能和小波變換的多分辨特性,實現由粗至精的檢測過程,這樣不僅減少了工作量,而且提高了定位精度。由于低分辨率圖像只保存了較強的大結構對象的梯度信息,因而本方法對噪聲也有很強的抑制作用,降低的分辨率圖像同時減弱了光線對定位的影響。
[BT4]1.2.3 待選區域生成
首先對圖像進行反對稱雙正交小波分解,得到j的近似aj和三個方向的細節d(1)j,d(2)j,d(3)j;然后利用d(1)j和d(3)j的每一列做一次重構便得到了第j+1級近似圖像的x方向的偏導數d(x)j+1;同樣利用d(2)j和d(3)j的每一行做一次重構便得到了第j+1級的y方向的偏導數d(y)j+1;最后可以得到對于圖像的j+1級近似的梯度矢量[TX→]j+1=(d(x)j,d(y)j),這樣就在小波分解域中實現了對稱變換,此時,距離控制因子也應隨著分辨率級別的變化而變化,即σj=σ02-j。采用小波域對稱變換對雙眼進行定位時,將眼部分為圓形對稱區和橢圓行對稱區,依據廣義對稱變換梯度矢量的局部算子,從梯度圖像出發建立眼睛模型。對于灰度圖像矩陣采用差分運算代替求導,梯度方向定義為高灰度到低灰度,方向梯度表示為:
xS[i][j]=0.5(S[i+1][j]-S[i-1][j])[JY](14)
yS[i][j]=0.5(S[i][j-1]-S[i][j+1])[JY](15)
要選擇恰當的距離控制因子σ,以便準確地進行人臉定位,對于以上眼睛梯度簡化模型。
取距離控制因子σ0為瞳孔半徑,以及σ1=1.5σ0,σ2=3σ0;則高斯距離因子表示為:
[HT5”]
Dσ(i,j)=12π σ0exp-(xj-xi)2+(yi-yj)22σ02
12πσ1σ2 exp-(xj-xi)22σ21exp-(yi-yj)22σ22[JB)][JY][HT10.SS]
(16)
考慮到眼球常常部分被上下眼皮所覆蓋,可以限制|yi-yj|<2(σ0+1)。在圓行區域內部做對稱變換時,將廣義對稱方向權重因子p(i,j)修改為:
p(i,j)=[+cos(θi-aij)cos(θj-aij-π]aij-π2[JY](17)
表達式因子[+cos(θi-aij)cos(θj-aij-π)]的設置能增強對圓形物體檢測,因為對于圓形邊緣上的兩對稱點i,j,其梯度方向θi,θj與i,j連線成0°或180°。而考慮到眼球可能部分地被上、下眼皮所覆蓋,所以引入了因子|aij-π2|以增大水平方向對稱點權重,減弱垂直方向的強對稱性所產生的強對稱點,所以此算法對眼睛張開程度較小的圖像也具有較好的定位能力。
[BT4]1.2.4 待選點的篩選
從人臉圖像的對稱強度圖中取出多個對稱性最強的點,采用模板匹配方法對這些點進行篩選。
模板的生成:為了更加突出人臉的共性,把圖像庫中標準人臉進行小波變換后取取其低頻成分,這樣把表示不同人之間的特性差異盡量淡化。通過對計算ATT實驗室的ORL人臉庫所選取的150張人臉對應像素的均值生成模板。模板如圖3所示。
圖3 人臉模板
設模板矩陣為B[i,j],人臉模板與候選區域的相關系數為R,則R表示如下:
R=∑nj=1∑mi=1(A[i,j]-μA)(B[i,j]-μB)[∑nj=1∑mi=1(A[i,j]-μA)2][∑nj=1∑mi=1(B[i,j]-μB)2][JY](18)
式中:μA為候選區域的均值,μB為模板的均值,R值越大表示模板與候選區域的匹配程度越高。
[BT4]1.2.5 算法流程
以上對基于小波的定位方法進行了詳細闡述,其算法流程圖如圖4所示。
圖4 算法流程圖
2 實驗結果與分析
利用上述方法我們對人臉圖像眼部的定位進行了實驗,實驗的人臉圖片主要來源于網絡和數碼相機,包括300個人臉圖像,這些圖像中包含表情、光照的一定變化,還有些戴眼鏡,有些還有稍微偏轉。實驗表明本文所使用的方法準確率達到93%以上,對鏡片反光的干擾有較好的魯棒性。實驗部分的定位結果如下:
圖5 自拍圖像在j=-1時用于帶眼鏡時定位結果
圖6 自拍圖像在j=-1級下的定位結果
表1 定位速度和準確率的比較實驗結果
分辨率級別[]0[]-1[]-2[]人臉特征[]準確率
相對耗時[]0.985[]0.059[]0.007[]眼鏡干擾[]91.5%
準確率[]82.4%[]94.5%[]88.3%[]眼睛閉合[]89.2%
實驗結果分析:
在人臉特征點定位中,人臉圖像不能太大,圖像越大,需處理的信息數據越多,定位速度就越慢。實驗結果可得到:
(1) 使用反對稱雙正交小波對圖像做小波分解,能使工作量大大節省。
(2) 在分辨率j=-2時定位效果最好。
(3) 對戴眼鏡和眼睛閉合的情況下,與其他方法相比,本文所使用的方法能取得較好的效果。
3 結 語
本文提出了一種基于小波變換的人臉特征點定位方法,通過計算小波變換后圖像每一點的方向梯度和對稱度,選取對稱強度強的點,再結合小波變換的多分辨特性,即先在低分辨率上實現快速粗定位,再根據粗定位的結果局部地逐級提高定位精度,最后選取對稱強度最強的兩個點作為最后的定位結果,此方法應用與人臉眼睛定位,不僅滿足了高精度定位的要求,而且計算工作量也有較大的減少,對光照變換也有一定的魯棒性。
參 考 文 獻
[1]Yang G Z,Huang T S.Human Face Detection in a Complex Background[J].Pattern Recognition,1994,27(1):53-63.
[2]Turk M,Pentland A.Eigenfaces for Recognition[J].Cognitive Neuro-science,1991,3(1):71-79.
[3]Lin S H.Face Recognition/Detection by Probabilistic Decision-based Neural Network[J].IEEE Trans.Neural Networks,1997(8):114-132.
[4]Reisfeld D,Wolfson H,Eshurun Y Y.Context-free Attentional Operators:The Generalizes Symmetry Transform[J].Computer Vision,1995,14:119-130.
[5]彭進業,俞卞章,王大凱.多尺度對稱變換及其應用于定位人臉特征點[J].電子學報,2002,30(3):363-366.
[6]Kawato S,Ohya J.Two-step Approach for Real-time Eye Tracking with a New Filtering Technique[A].IEEE International Conference on Systems,Man Cybernetics,2000.
[7]王忠,胡步發,嚴世榕.一種改進的對稱變換應用于人臉圖像眼睛定位[J].計算機應用,2004,30(11):119-121.[8]Garcia C,Zikos G,Tziritas G.Face Detection in Color Images Using Wavelet Packet Analysis[EB/OL].http://www.csd.uch.gr/tziritas/papers/ICMCS-99.pdf.2004.
作者簡介
陳 潔 女,1982年出生,湖北荊門人,碩士研究生。主要從事圖像處理與傳輸,人工智能與模式識別等方面的研究。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。