邱鵬瑞
人臉識別是當前人工智能與模式識別領域一個重要的研究課題,人臉識別已被廣泛應用于視頻監控、身份驗證、醫學分析、多媒體數據庫檔案管理、視頻會議、考場管理等很多方面。人臉識別包括人臉特征定位提取與人臉識別兩個技術環節,人臉特征定位提取指的是從圖像中檢測到人臉、準確定位其位置并從圖像中將人臉特征提取分割的過程;人臉識別則是對分割出來的人臉區域進行匹配識別完成對人物身份信息的比對查找,以及判定個體的特定身份等[1][2]。一直以來人臉識別得到了廣泛和深入的研究,但對于人臉特征提取與定位研究得比較少,人臉特征提取與定位是一個困難而有意義的問題,對這個問題的研究不僅給人臉識別研究帶來很大的推動作用,也從方法論的角度促進模式識別、人工智能等計算機科學分支乃至整個計算機科學的發展[3][4]。
本文提出基于膚色建模、積分投影、灰度幾何結構的面部器官定位算法。該算法對背景、尺寸等細節具有很好的適應性,定位效率高,在人臉檢測特征定位與提取方面具有良好的應用價值。
本文采用由Rein Lien Hsu提出的基于YCbCr 空間加入亮度補償的膚色模型,該模型采用膚色庫中大量的膚色標準來訓練系統,得到一個膚色中心點位置,然后對比考察的像素與該膚色中心點的距離得到一個相似度,每個像素都有一個相似度,最后得到待檢圖像的相似度分布空間[5][6]。Rein Lien Hsu 通過研究發現膚色區域的形狀由Cb、Cr 和Y 的取值決定,由此建立該膚色模型由公式(1)、(2)

對 MIT 人臉庫圖像進行數據計算,得到各個參數取值,其中 cx=109.38,cy=152.02,θ=2.53(弧度),ecx=1.60,ecy=2.41,a=25.39,b=14.03,以上各值皆由 Cb’-Cr’空間的膚色聚集區域計算得到。
通過膚色分割獲得膚色區域后,對人臉的幾何特征進行分析,通過人臉比例、大小結構特性判斷二值化圖中的目標區域是否為人臉從而可以排除非人臉區域[7]。
1.2.1 基于區域填充率的方法
對于膚色分割后得到的二值化連通區域,使用該連通區域的像素數與其外接矩形的像素數之比來表示這個區域的空間屬性。假設S為目標區域的像素數,S’為外接矩形的像素數,若0.45
1.2.2 基于區域長寬比滿足黃金分割的方法
根據人臉固有的幾何特征,人臉區域的長寬比應在穩定閾值內,因此可以利用待選區域的長寬比對人臉進行初步檢測。通過對待檢區域的長短軸比例分析可以將細長區域和圓形區域區分開來。研究表明,理想人臉的長寬比滿足黃金分割比例,即根據實驗結果分析,本文將區域的長短軸比例ratio大于0.5小于2.5的區域視為人臉區域。實驗結果,如圖1(a)和(b)所示:

圖1 (a)候選區域,(b)黃金分割方法
通過上述步驟系統基本可以得到人臉區域,接著對人臉區域垂直和水平兩個方向分別進行灰度值累加統計,即利用灰度積分投影的方法分析得到具有強灰度值的區域中心點并確定區域邊界。設區域大小為 m*n,各點像素灰度值為g(x,y),積分投影函數為:


其中Py(x)是對第x列的所有像素點的灰度值投影,Px(y)是對第y行的所有像素點的灰度值投影,第n列的垂直投影值為Pv,第m行的水平投影值為Ph。考慮到人臉部器官在垂直投影位置上有重疊,因此在垂直投影時需要針對眼鼻嘴的特定區域進行投影。
通過對面部區域水平投影可以得到眼睛、眉毛和嘴唇上下區域邊界。然后分別對眼睛、眉毛和嘴唇各自邊界內的幾行象素進行垂直投影可以確定其左右邊界位置。再通過組合就可以得到眼眉、嘴區域的上下邊界和左右邊界最終確定面部各個特征的矩形區域位置。
實驗中對人臉區域進行積分投影統計后在投影曲線上大于峰值1/2的點賦值1,其余點賦值0,這樣眼眉、嘴的區域段將被很好的凸現出來,有時面部器官由于個體差異導致凸顯的區域段之間會有小的斷裂,如果斷裂的區域段間距小于十分之一的人臉長度則進行合并。同時考慮眼眉區域定位特點,對眼睛上方區域即眉毛區域不進一步處理。接著在已經確定的眼、嘴特征的水平投影區域內,進行垂直投影,分別累加區域內的每列象素。例如得到的水平投影的眼睛縱坐標范圍在第20行到第30行之間,則僅對第20行到第30行之間的每列象素進行垂直投影。同樣通過與水平投影相同的方法就可以得到眼、嘴特征區域的橫坐標范圍。按照“三庭五眼”規則,如果垂直投影的區域段間距小于十分之一臉寬(橢圓的短軸)則將其進行合并。實驗結果,如圖2所示:

圖2 積分投影(a)處理圖片,(b)積分投影
積分投影方法能夠對人臉特征進行快速定位,但最大的缺陷在于如果采集的人臉區域是傾斜的,會導致人臉特征在積分投影坐標系中不再保持水平和垂直,那么對其使用積分投影確定位置也就失去意義[8]。對人臉區域傾斜的判斷可比對眼睛和眉毛的區域在進行水平投影后是否合并到一起。如果投影區域合并到了一起無法區分眼睛眉毛區域,則表示有傾斜,還需采用針對人臉發生傾斜的方法精確定位人臉特征。
在人臉器官中,眼睛是相對較為穩定的特征,因為人眼受光照或表情變化的影響最小且瞳孔間的連線,具有隨人臉的偏轉而發生角度變化特點,瞳孔連線可以作為人臉傾斜的依據。如果能夠精確定位雙眼位置,則可以大大簡化人臉特征檢測的難度。
規則如下:
(1)提取人臉局部區域。根據人臉器官分布幾何結構特點,選取人臉區域高度的1/3到4/5作為研究對象。按照生理學知識,未成年人眼睛距離下巴大概在頭高一半的位置,隨著年齡增長,眼睛與下巴的距離在整個頭高中所占的比例有所增加,考慮個體差異,有寬扁、瘦長等各種臉形,一般不可能超過頭高的3/4,同時考慮到膚色分割不不完全的脖子區域可能導致局部臉的圖像受到影響,使得眼睛與下巴距離在整個頭高中所占比例變大,即便如此,眼睛與下巴距離也不可能超過整個人臉區域高度的4/5。另外,考慮到個體差異,如額頭較高或者光頭,會倒是眼睛相對于整個人臉的位置偏下,所以把眼睛搜索區域的下邊界定為人臉圖像高度的三分之一位置是合理的,這樣既避免脖子和頭發帶來的影響,又縮小檢索區域,提高了效率。
(2)確定眼睛灰度閾值。由于受光照影響,人臉區域灰度值與眼睛灰度的對比度有大有小。為了減少光照的影響,對局部臉進行平均灰度計算得到平均灰度G,由于瞳孔比皮膚黑很多,再用G減去一個適當的灰度值H就可以得到眼睛灰度的大致范圍0~E(E=G-H)。
(3)局部區域搜索眼睛。在局部區域中用 a×a的方框進行平移搜索。對方框中所有灰度值小于閾值 E的點進行計數,當計數值大于一定的值(0.8×a×a),即黑點占到方框80%以上則記錄下方框所在的位置,并確定為候選眼睛區域。由于提取人臉區域存在誤差,比如可能還有緊挨著眼睛的眉毛部分,或者有一些殘留的發跡,這樣導致候選眼睛區域可能不只兩個,還需對數據進一步處理。考慮到眉毛和發跡的位置一般都在眼睛之上的特點,取局部臉的中心,計算候選眼睛區域與局部臉中心的距離,距離小于閾值的數據就確定為眼睛區域。
(4)灰度復雜度精確定位人眼。人眼一個重要特征是眼白和瞳孔的灰度值具有突變性,即眼白的灰度值較低,而瞳孔灰度值較高。根據人眼灰度變化的明顯特征,通過對候選人眼區域進行灰度復雜度計算可以精確定位人眼。根據人眼特征,把 a×a的候選人眼區域進行擴展為 m 行 n列(m=a,n=2*a),則圖像塊的灰度分布復雜度Comp (g)的計算公式由式(7)定義

式中,min(j, n-j)為權值,離圖像中心越近權值越大,Gij為圖像塊第i行第j列像素點的灰度值。Comp(g)為圖像塊灰度值的橫向一階加權導數,實驗表面,這種定義符合人眼復雜度的計算。根據人眼灰度值突變的特性,通過計算候選眼睛塊的灰度復雜度,找出復雜度最大的眼睛塊即為檢測目標。找到眼睛塊后可對眼睛塊中心連線進行角度對比,并做對人臉旋轉校正。最后再對旋轉校正后的人臉進行積分投影定位嘴巴的位置。實驗結果,如圖3(a.b.c)所示:

本章在膚色分割和基于區域特征人臉區域提取的基礎上,通過人臉器官分布特點,采用積分投影與人眼灰度復雜度相結合的方法定位人眼和嘴唇,最終實現人臉器官快速定位。試驗表明,該算法是有效的。
[1]梁路宏,艾海舟,徐光佑等,人臉檢測研究綜述,[j]計算機學報,2002,25(5):449-458.
[2]王科俊,姚向輝.人臉圖像檢測與識別方法綜述.[j]自動化技術與應用.2004(12):5-8
[3]李剛,高政,人臉自動識別方法綜述[J].計算機應用研究,2003:20(8):4-9.
[4]周杰,盧春雨,張民水等.人臉自動識別方法綜述.[j]電子學報,2000,28(4):102-106.
[5]周德龍,張曉華,劉博等.JDL大規模人臉圖像數據庫介紹[J].生物識別研究新進展[C].北京:清華人學出版社,2003,118-120.
[6]Hsu Rein Lein. Face detection in color images[J].Pattern Analysis and Machine Intelligence,2002,24(5).
[7]周敬利,王志強,陳加忠,余勝生.基于膚色分割、區域分析和模板分布的人臉檢測研究[J].計算機工程與應用,2004,Vol.21(5):16-18.
[8]邱鵬瑞.基于膚色模型與灰度復雜度的人臉檢測研究[D].云南師范大學,2008.