韓靜怡+王元臻


摘 要:眼球定位識別算法作為一種重要的圖像處理方法對于圖像的相關處理有很重要的作用使用精確的方法對人眼球進行定位可以方便人臉特征識別以及人機交互等一系列的應用,眼睛定位的準確度直接影響到了最終的識別率,因此人眼定位算法具有很重要的研究意義。本文利用Matlab開發算法,研究的主要內容包括三部分,主要是圖像的二值化算法、人臉檢測及人眼定位的原理及相關算法實現,詳細展示了各種方法的具體原理,對比選擇了最為合適的檢測方法。
關鍵詞:圖像二值化;人臉檢測;眼球定位;靜態圖像
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1671-2064(2017)17-0026-03
1 引言
在一幅圖像中,人們往往只對圖像中某些既定的特征感興趣,這些目標常占據一定區域,并且在某些特征和周圍圖像有所區別,我們經常利用這些細微的區別使用圖像處理技術,通過計算機來獲取該區域的相關信息。眼睛作為人臉的特征部位,其位置重要并且對于人臉信息相關問題的處理檢測有著很重要的意義,如果人眼位置定位準確可以提高識別和檢測的準確性及檢測速度,還具有降低識別算法復雜度的作用,可以提高處理速度,使得后續的檢測操作更加容易,算法處理更加簡便,所以實現較為精確地眼睛定位是至關重要的。
本文的算法是在二值化圖像的基礎上進行的,采用迭代法閾值分割的方法將圖像進行二值化分割,關于人臉區域識別方法的選取,文章考慮到膚色分割受光線影響較大的問題,選用了基于圖像網絡分割的人臉識別,先將臉部圖像分割成多個小塊,將分割形成的各個小塊單獨進行處理,對每個小塊完成相應的檢測,從而可以識別出整個人臉區域。人眼定位算法的選取,本文使用了快速Hough圓檢測變換方法,該方法在噪聲較大的環境下也能有很好的檢測結果,并且對于數據的處理量較低,計算時長較短,滿足對人眼檢測實時性的要求,通過檢測圖像來看,該方法實驗效果較優,人眼的定位清晰,該方法滿足本文所需,是一種優秀的人眼識別算法。
2 圖像二值化分割算法
閾值分割法是一種簡單有效的圖像分割方法,可以將圖像中所需的有意義的特征區域提取出來,利用閾值大小的不同區分物體及背景,閾值的選擇需要根據具體問題來確定,對于給定的圖像,通過分析直方圖確定最佳閾值,以用來進行物體與背景的判定。
利用迭代法進行閾值分割首先選定一個近似的閾值,將原始圖像分割成為兩部分,計算兩區域的均值,選擇兩區域均值的均值為新的閾值進行下一次分割,重復以上步驟的直至均值不再發生變化為止,迭代法以近似和逼迫的思想為主,該方法能區分物體和背景優于雙峰法對細節的處理更加精細。該方法規定一個特定閾值作為初始的閾值估計值,按照一定的規律方法進行一步步的細化閾值,這個方法的關鍵在于如何選擇合適的閾值進行迭代改進,正確的閾值選擇有連個特征分別為首先能夠快速的進行收斂,另外在迭代過程中新產生的閾值比上一次更優,其具體算法為:
利用閉值兀把圖像分割成兩個區域:和,用(1)(2)式計算區域和凡的灰度均值和。
重復上述步驟,直到和的差小于某個給定值。
通過該方法可知當圖像中目標和背景像素灰度呈正態分布并且標準差相等,目標和背景的像素比例相等時, 可得到最佳分割閾值為目標和背景像素灰度均值的平均值。在本文的算法中,利用迭代閾值分割法的語句更加簡潔更容易理解,可操作性較強,從實驗所得的效果上來分析,該算法能較好地實現實驗目的,并且迭代法抗干擾能力較強,迭代法每次運行所選閾值都比上一次更優,可根據具體環境的要求設定閾值大小,實驗操作更加靈活。所以,在相同實驗條件下,本文優先選用迭代式閾值分割算法對給定圖像進行二值化分析,經過迭代法閾值分割算法得到的二值圖像特征分割清晰,細節展示清楚,主要特征不會發生丟失。
3 利用圖像網絡分析進行人臉識別
本文采用了圖像網絡分析法來進行人臉的特征識別,首先將目標圖像進行網絡化分割,分割后圖像變為小方塊,要對這些小方塊進行去噪聲分析和灰度化常規預處理這些基本操作,對進行完基本操作的的小塊圖像進行人臉的識別,并且判斷小方塊圖像是否位于人臉的相關區域,將識別成功的小方塊進行整合就是整個的人臉區域。
首先,將圖片進行二值化,利用中值濾波法對二值圖進行去噪聲處理和預處理的基本操作,使圖像滿足后續處理要求。其次,對圖像進行分割,本文中對目標圖像采取10*10的分割方法,將圖像分割成100個小方塊,對于不同的圖像可以根據具體要求靈活的劃分分割區域的大小,然后對于每個小方塊單獨進行分析檢測,對黑色像素的比例進行統計,對滿足面部的小方塊進行標記,然后對小方塊進行逐個的列變換和行變換,每個小方塊進行相同的檢測,最后把滿足需求的小方塊進行整合,這就是所得到的人臉識別區域。
下面圖1、2、3、4分別展示了人臉的網絡分割效果、人臉識別效果以及二值圖下進行臉部識別的最終結果,可以看出識別的準確度較高。
4 利用快速Hough圓檢測進行眼球定位
4.1 基于空間累加的圓心檢測算法
快速Hough圓檢測的核心思想是:在這個圓的三維空間中,垂直于圓的相應邊界點的垂線最終會通過圓心,如沿著圓的邊緣區域畫出每個邊界點的垂線,就會在圓區域的圓心處得到一個“亮點”,這些“亮點”是眾多的垂線重疊最多的地方。
5圖中為一個(a,b)的參數空間,該圖像展示了將圓的邊緣點對應的垂線變換成空間中的線段。
式中,,,其中,定義了圓半徑的范圍,空間矩陣用A表示,表達了邊緣的強度。
在上述圓心檢測算法中,這種變換在圓心處邊緣點的垂線的重合較大,所以形成了很亮的“亮點”,這種檢測方法對于目標的圓的圓度要求比較嚴格,如果目標圓是一個橢圓形,因為橢圓的圓度較小,那么此時這個“亮點”會迅速的擴散從而很難形成可以檢測到的區域,故我們常使用濾波器使得“亮點”區域盡量集中,利用濾波器的聚合功能減小中心“亮點”的擴散速度,使得中心“亮點”的亮度更大。由于一副圖像中可能存在若干個目標圓,目標圓的圓心在數學上可以用空間的局部極大值表示,采用遞歸算法找到區域局部最大值,從而找到所有可能存在的圓心。對于不同大小的圓來說,他們形成的邊界點如果用相同的標準來累加這些圓,所形成的大圓“亮點”比小圓的“亮點”來說更亮,,所以必須給(a,b)空間的線段強度加一個約束,來限制兩個不同半徑的圓的亮度,使得圓的亮度約束在一個統一的條件下。endprint
該公式中的每個邊緣點都傾向于將選票投給與它距離最近的圓心,這樣不會使錯誤的傳遞的太遠,以引起圖像中的其他區域計算錯誤。
4.2 基于r空間累加的半徑計算方法
上述方法將圓心定位之后,接下來介紹尋找圓的半徑的方法,通過以半徑為坐標的一維空間的累積來實現,對于區間上的每個半徑r,它的總投票值R(r)就是以r為半徑的圓上所有邊緣點P的邊緣強度E(P)之和。
這種方法在兩個方面對檢測方法進行了優化,該方法更傾向于檢測大圓,將邊緣強度E(P)增加一個約束1/r,以使該方法對不同大小的圓都合適。其次,該方法將所有處于半徑r處的邊緣點都計算在內,忽視了這些點的垂線并非都指向目標圓心,因而我們定義一個范圍對這些點進行篩選,定義為邊緣點與圓心連線的角度,對于所有處于半徑r處的邊緣點,我們只考慮垂線角度在范圍內的點,這樣就能極大減小假邊緣點的影響,在各種情況環境的仿真實驗中,我們通常采用或。
計算完r空間之后,我們對其進行閾值化就能找到可能的半徑了,閾值的選取需要考慮相應的目標區域環境,如果目標圓只有一個,那么只需要選取r空間的極大值就能找到這個圓,如果目標圓是多個,那么閾值的選取與最后獲得的圓的個數需要進行分別的測試。
下圖展示了人眼識別的二值圖像,圖6展示了圖像網絡的分割檢測出的人臉圖像,圖7和圖8分別展示了經過快速Hough圓檢測變換之后的眼睛圖像,可以看出實驗后所得到的實驗結果較為清晰,易滿足人們對于實驗結果的要求。
5 結語
本文構建了一種可以較為精確地實現人眼定位的算法,能夠實現對于一副靜態圖像的眼球進行較為精確地定位,本文實現的這種人眼定位的方法是比較精確地,并且這種人眼識別的對于抗噪聲能力較強,受環境變化的影響較小,使用簡便,所以人眼定位時常使用這種方法。本文討論的算法在一定環境情況下能夠較好的實現人臉的檢測以及人臉相關特征識別檢測,并且本文這種算法對于光照要求較低,受噪聲影響小,本文討論的這種算法主要針對靜態圖像,在后續的研究中,要做好動態圖像的采集,研究開發面向動態的人臉圖像識別,以便使該算法使用范圍更為廣泛。
參考文獻
[1]張艷君,宋京偉.人臉識別中利用眼球進行人臉歸一化[J].北京聯合大學學報(自然科學版),2006,(02):35-39.
[2]王磊,莫玉龍,戚飛虎.眼球的自動定位[J].紅外與毫米波學報,1998,(05):31-38.
[3]Zhou Z H, Geng X. Projection functions for eye detection[J]. Pattern Recognition,2004,37(5):1049-1056.
[4]張歐平,丁志剛,彭娟春.組合型人眼識別方法及其應用[J].計算機工程,2011,37(9):223~225.
[5]陶亮,莊鎮泉.復雜背景下人眼自動定位[J].計算機輔助設計與圖形學學報,2003,(1):15-1.endprint