唐云龍 何麒 陳平
摘要:論文通過對目前國內外主流人臉檢測的算法進行比較研究,探討如何提高人臉識別算法的精確度和檢測速度,為國內開發各類人臉識別系統提供參考,主要是通過分析以膚色特征為主的人臉檢測法,了解其計算過程和原理,對其擁有的色彩空間、預處理人臉圖像檢測技術以及依據人臉特點建立相應的膚色模型等算法、檢測技術進行深度分析。通過研究,筆者認為在社會經濟發展中,人臉檢測應用比較廣泛,相較之其他識別人體生物的系統,人臉識別方式更加直接與友好,已成為未來識別認證身份的一種重要發展趨勢。以膚色特征為主的人臉檢測法,不僅色彩空間廣,且運用了綜合檢測技術,提高了檢測精確度,檢測速度也更加快捷,主流人臉檢測算法均有各自的特性,但總體而言,建立在臉部膚色特點基礎上的人臉檢測技術與綜合檢測技術相結合,不僅能夠有效提高膚色檢測技術的準確率,還可以極大地提高Adaboost算法的檢測速度與效率,使用比較廣泛。
關鍵詞:人臉檢測;算法;色彩
中圖分類號: TP18? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)19-0198-03
隨著現代化科技水平的快速發展,信息技術的安全性日益凸顯。在國家安全部門、公安系統、司法部門、電子商務及政務系統、甚至安全檢查等相關領域,都需要準確的識別個人身份,而識別與鑒定身份的基礎則是系統的安全性,而傳統身份鑒別系統已難以滿足社會發展需求。眾所周知,人臉識別,就是依據個體相貌特點來確定其身份的一種手段,在日常生活與生產活動身份鑒別中,應用比較廣泛。作為生物特征的表現,人臉具有顯著的穩定性,不易偽造及丟失性,相較之其他人體識別系統如視網膜、指紋、基因及虹膜等,人臉識別技術更加直接與友好,也是未來識別認證身份技術的重要發展趨勢。
對于人臉檢測技術的研究最早始于人臉識別,在人臉識別系統中,人臉檢測技術是非常關鍵的一種環節。在20世紀60年代,一些學者開始探究人臉檢測技術,并對該檢測算法做出了一些研究分析。但是由于傳統人臉識別系統受人臉圖像的約束,因此該技術發展比較慢。直到20世紀90年代,隨著電子商務技術的發展應用,傳統的人臉識別系統已無法滿足社會發展需求。此外,隨著高性能計算機技術的發展,這也成為人臉檢測的技術保障。在良好發展形勢下,研究學者開始重視人臉檢測技術,推動該技術發展壯大。
在人臉識別系統中,其主要技術內容覆蓋了數學、數字圖像處理、心理學、生理學、神經網絡、模式識別及計算機視覺等不同領域,應用非常廣泛。近些年,計算機圖像處理技術快速發展并取得了顯著成果,現代化圖像采集設備得到普及推廣,在開關保險柜、樓宇門禁及開關計算機手機等系統中也開始應用人臉檢測識別技術,開鎖的唯一“標志”即為人臉。
在安全驗證、海關、交通、銀行、視頻會議及數字娛樂等領域,人臉檢測技術應用前景也比較廣闊。該身份識別技術適用于認證身份、檢索數據庫圖像、見識公共場合個體、甚至提高人機交互能力等。隨著社會經濟的快速發展,人口流動量、速度及區域日益提高,在管理與統計流動人口方面人臉檢測技術也有非常重要的作用。在許多如保安系統、確認信用卡、過境海關檢查及識別罪犯等重要場合,都需要對個體實施無限制,沒有傷害而又可靠的人臉檢測識別技術,因此快速發展的信息時代,推動了人臉檢測技術的快速發展與研究。
在研究人臉檢測算法的發展與現狀,將該檢測技術主流算法劃分為三種形式逐一進行分析闡述,具體表現為:以膚色特征為主的人臉檢測法、啟發式模型的檢測法以及統計理論檢測法。下面將對以膚色特征為主的人臉檢測法做重點介紹。
1 概述人臉檢測技術擁有的色彩空間
只有在分析個體膚色特征基礎上,選用合理的色彩空間構建規范的個體臉部膚色模型,才能實施以膚色特征為主的人臉檢測法,實現預期分割膚色的目標。其中“色彩空間”又可以稱之為“色域”(ColorSPace)。根據色彩學相關理論,某種顏色的表達模型不同,可以通過一、二、三或四維空間坐標表示,因此這種根據坐標系統做出界定的色彩范圍即為色彩空間?,F階段,RGB、HSV及YCbCr等色彩空間是常用顏色空間形式。
2 預處理人臉圖像檢測技術
選取好相應的色彩空間后,就要采取相應措施預處理人臉圖像。根據相關研究證明,在獲得待測個體臉部圖像時,其變動性比較強,特別是受外部光照條件作用,不同技術參數、獲得設備、地點及時間等因素的變化,都會導致光照強度與色度出現相應變化,也會干擾到圖像中個體臉部信息的識別。在日常攝影錄像時常會出現飽和度不足或者過大以及偏色等問題,這都是差異光照干擾的實際表現?;诖?,為了有效清除不確定因素光照等對圖像個體膚色造成的影響,在人臉檢測前必須要進行色彩平衡及補償光照等操作處理。下圖為針對圖像出現偏色而通過色彩平衡與補償光照等技術操作處理后的實際效果圖:
3 依據人臉特點建立相應的膚色模型
依照人臉特點建立相應的膚色模型就是膚色建模,首先介紹并討論人臉膚色的主要特征表現:
1)如果光照條件確定時,個體臉部膚色分布類似于高斯分布;
2)在選定的色彩空間中,個體臉部膚色分布范圍小而集中;
3)光照一定,個體臉部膚色分布類似于高斯分布。
直方圖、簡單高斯及混合高斯等模型是目前人臉檢測技術研究中,常用膚色模型。其中直方圖模型,就是通過直方圖膚色統計分布來進行個體臉部特征描述的一種模型。其主要優勢在于效果好,特別是通過三維直方圖做出的統計;而需要訓練很多樣本才能建成該模型,樣本訓練周期長工作量大是其最大的缺點。相比之下,簡單與混合高斯模型屬于在概率統計基礎上建立的膚色模型,其對于能夠更加準確的描述膚色分布,針對該膚色模型的個體臉部擁有較高的檢測效率。與混合高斯模型相比較,簡單高斯模型估測、計算參數更容易,而且建模與檢測速度比較快,因而能夠較快地確定膚色區域。
3.1 個體臉部膚色分割
基于上文討論分析的膚色聚類特點與模型,就能夠對彩色人臉圖像實施膚色分割技術。在膚色模型基礎上對個體臉部膚色進行分割,就是根據已經構建的膚色模型二值化處理圖像的過程。
其中選擇分割閾值是非常關鍵的,也就是要明確界定膚色與非膚色區域。根據上文提出的膚色模型,一般采用以下算法:選擇一個近似膚色的數值作為最有效的分割閾值,將此數值與圖像中所有像素點的膚色相似值進行比較,超過該數值的則被劃定為皮膚區域并分割為白色;相反低于該數值則被化為非皮膚區域并被分割為黑色。對于如何確定最有效的分割閾值,本文則選用otsu自適應閾值分割計算法,也就是依照圖像類似直方圖自動選擇閉值。試驗研究表明,該計算方法效果顯著,針對不同圖像的不同亮度與色度,分割閾值范圍在【0.45,0.55】之間。系統根據膚色模型計算所有輸入系統圖像的膚色近似度,并構建相應的相似度直方圖,再依照自適應閉值分割計算法得出最合理的閾值,再二值化處理圖像,并將相應膚色與非膚色區域分別分割為白色與黑色。
3.2 用形態學處理粗檢圖像
在分割膚色后,必須采取形態學原理處理檢測到的粗檢區域圖像,主要包含計算檢測區域的膨脹與腐蝕值,并對相應圖像作平滑處理,才能獲得更加清晰、干凈而且連續的個體臉部膚色區域。
膨脹操作,具體而言就是對二值化圖形進行形態學運算,它屬于將物體背景邊緣化像素集中到物體區域內的運算過程,也是物體圖形邊緣不斷多外延伸的一個過程,其主要用于填補圖形中出現的空洞。腐蝕操作則是運用形態學原理對已知圖像進行運算,其屬于將物體自身邊緣圖形像素向內消除的過程,也是物體圖像邊緣向內收縮的一個運算過程,主要用于清理圖像中的雜質。在處理圖像時要將二者結合應用,其級聯方式主要有:1)開運算的先腐蝕后膨脹;2)閉運算的先膨脹后腐蝕。其中前者能夠有效清理分散的孤點與圖像“毛刺”,后者則是將兩個相鄰目標區域連接起來。聯合應用膨脹與腐蝕,不但能夠消除噪音,還能夠確保圖像信息的完整。因此,在本文選用的膚色檢測技術中,膨脹、腐蝕及兩者級聯而成的開、閉運算操作是非常關鍵的環節。
3.3 選定候選個體臉部區域
經過膚色分割與形態學處理操作,可以得到原膚色圖像的二值化圖像,其中白色為膚色區域,這樣就能夠選定候選個體臉部區域。
4 基于Adaboost算法的人臉檢測過程
4.1 放大檢測窗口
臉部膚色特點基礎上的人臉檢測技術與綜合檢測技術相結合,不但能夠有效提高膚色檢測技術的準確率,還可以極大地提高Adaboost算法的檢測速度與效率。
AdaBoost算法的主要特點是將一種新的圖像表示方式:積分圖像,引入面部檢測,可以用于快速計算面部樣本圖像的Haar-like樣特征值。選擇適當的Haar-like特征作為AdaBoost訓練過程的輸入,AdaBoost算法用于為每輪訓練選擇最佳弱分類器,這些弱分類器疊加為強分類器。最后,這些強分類器被串聯成級聯結構的層疊級聯分類器用于面部檢測。
傳統的面部檢測機制是使用圖像縮放的方法來檢測人臉。檢測的基本原理是按照一定的比例減小要檢測的圖像的大小,形成金字塔狀結構,稱為“圖像金字塔”,保持檢測窗口的尺寸不變,用該窗口窮舉圖像金字塔中待檢測的子窗口,將要測量的子窗口輸入到分類器進行判斷,并最終檢測出包含臉部的子窗口。其主要特征是圖像逐層變窄,檢測子窗口的大小保持相同的大小,這些特征也會造成一個缺點,當圖像被檢測到較大時 ,圖像逐層減少轉換將需要很多時間,這將大大降低檢測速度。
為了提高系統的檢測速度,可以使用多尺度的方法來檢測人臉。檢測的基本原理是按照一定比例放大檢測窗口,保持要檢測的圖像的大小,檢測窗口遍歷要檢測的整個圖像,根據檢測窗口的位置和大小從圖像中提取子圖像,然后將捕獲的子圖像發送到級聯分類器進行檢測,并輸出檢測結果。通過將檢測窗口的長度和寬度值乘以放大因子來擴大檢測窗口,該放大因子比圖像的縮小更有效并且具有更高的檢測速度。
所選的檢測窗口實際上是類似Haar-like的特點。 檢測窗口的放大本質上是矩形特征的擴大,對于任何Haar-like的特征,其特征的計算價值是相同的,它也是矩形特征作為弱的選擇分類器的優點。檢測窗的放大系數不能太大,如果太大可能會導致大量漏檢,實驗證明放大系數設定為1.2或1.25時更合理,然后漏檢較少,檢測速度較快。當檢測窗口被放大時,弱分類器的閾值,即Haar-like特征的特征值將改變。為了保持不變,Haar-like特征特征值的計算方法需要稍微改變,定義如下:
4.2 區域合并
采用上述方法放大后檢測窗口圖像,在不同的尺度和鄰近位置上會多次檢測到相同的臉部,所以最終需要組合檢測到的矩形以獲得獨特的臉部位置和臉部尺度。合并處理是將原始的多個檢測框的進行平均,將所有檢測到的面部區域的坐標平均值作為最后組合面部區域的坐標位置,并且將所有檢測到的臉部區域的平均值作為最后合并獲得的臉部面積的尺寸。 合并過程分為兩個步驟:
(1)檢測到的面部區域以相同的尺度合并
當以相同的比例掃描輸入圖像時,可以在相同的臉部位置附近檢測到臉部數次,這些相同的臉部區域必須被合并。由于相應的窗口大小在相同的比例尺度上相同,所以僅需要合并位置。定義鄰域半徑R和閾值M。如果某窗口的中心坐標為[x0,y0],半徑為R的鄰域[x-x02+y-y02≤R2]內人臉窗口中心數為T,當T (2)合并不同尺度條件下檢測到的面部區域 把每個尺度上檢測到的面部區域的大小和位置恢復到原始比例圖像。當兩個面部區域的重疊區域大于設定閾值時,兩個面部區域被認為是相同的面部,并且將它們的位置和尺寸的平均值作為合并面部區域的位置和大小。當兩個面的重疊面小于設定的閾值時,它們被認為代表兩個不同的面部區域。 綜上所述,檢測過程實際上就是發送被檢測的子窗口到級聯分類器的強分類器層進行檢測,當檢測結果小于當前層的強分類器閾值時,就認定不是人臉,否則就是。將檢測到面部的窗口到下一層強分類器進行檢測。級聯分類器最初的強分類器比較簡單,因此可以排除大部分非人臉的窗口,大大減少了后續處理窗口的數量,提高了檢測速度。 參考文獻: [1] 郭磊,王秋光.Adaboost人臉檢測算法研究及OpenCV實現[J].哈爾濱理工大學學報,2009(5):124-126. [2] 肖南峰.基于RBF神經網絡的人臉識別算法[J].重慶理工大學學報,2010(10):56-57. [3] LIENHARTR , MAYDTJ. An Extended Set of Haar like Features for Rapid Object Detection[J].IEIE ICIP 2002, 2002(1): 900-903. [4] 汪洋.基于差空間的雙向2DPCA和SVM人臉識別算法[J].計算機科學,2012(10):269-270. [5] 田啟川,張重生.刷臉背后[M].北京:清華大學出版社,2017. [6] 鄭峰,楊新.基于Adaboost算法的人臉檢測[J].計算機仿真,2005(09):39-41. [7] 高旭升,張學智,姬春英.彩色圖像中人臉檢測的研究[J].自動化技術與應用,2005(10):156-157. [8] 田巍,莊鎮泉.基于HSV色彩空間的自適應膚色檢測[J].計算機工程與應用,2004(14):87-88. [9] 劉劍.一種基于改進高斯過程隱變量模型的多角度人臉識別算法[J].電子與信息學報,2013(9):2034-2035. [10] 姜文濤.一種基于曲量場空間的人臉識別算法[J].計算機學報,2013(9):1740-1741. 【通聯編輯:唐一東】