王自偉,盛惠興,2
(1.河海大學物聯網工程學院,常州213022;
2.常州市傳感網與環境感知重點實驗室,常州213022)
人臉是一個常見而復雜的視覺模式,人臉所反應的視覺信息在人與人的交流和交往中有著重要的作用和意義,對人臉進行處理和分析在視覺監控、公共安全、視頻會議以及人機交互等領域都有著廣泛的應用前景。人臉檢測是指對任意給定的一幅圖像或者一段視頻采用一定的方法和策略對其進行搜索以確定其是否含有人臉以及所有人臉在圖像中出現的位置[1]。近年來基于圖像的方法為主要研究熱點。這類方法主要有基于線性子空間的方法,基于神經網絡的方法,基于SVM的方法,基于Adaboost的方法等。其中,Adaboost算法[2]和其他方法相比,其檢測效果和穩定性都較好,被廣泛用于人臉檢測中。而在視頻圖像中,運動目標檢測是計算機視覺領域的一個重要研究課題。預先對運動物體進行檢測,然后在提取的運動區域上進行Adaboost人臉檢測算法,可以很大程度上縮短人臉檢測的時間。
因此將KIM算法[3]和Adaboost人臉檢測方法相結合,提出了一種快速的人臉檢測算法,該算法對于人臉檢測具有較好的準確性和實時性。
常用的運動區域檢測方法主要有光流法、幀間差分法和背景減法等[4-5]。
光流法是采用運動目標隨時間變化的光流特性,有效地實現運動目標的檢測與跟蹤。該類檢測方法可以適用于攝像機靜止和運動兩種場合。但是多數光流場計算方法相當復雜,且容易受到噪聲影響,因此應用性和實時性較差。幀間差分法是通過對相鄰的兩幀做減法,閾值化后得到運動目標的區域。該方法簡單快速,實時性好,并且對動態環境具有較好的適應性。但該方法對噪聲十分敏感,而且提取的運動區域容易產生空洞現象,不能有效地提取完整目標。背景減法是利用當前幀圖像與背景圖像相減得出運動區域,當背景穩定的情況下,可以完整的檢測出前景運動目標。而當光照突變時,容易產生將背景像素誤判為前景目標的現象,引起較大的檢測誤差。因此該方法對于背景建模和背景更新要求較高,而且對于與背景灰度相近的目標不能夠完全檢測出來。
此次采用的KIM算法是將三幀差法和背景減法相結合來有效提取運動區域。這種方法既能克服背景差法易受外界環境的影響,還能夠避免幀差法中運動目標重疊而檢測不出來的現象,因此可以得到更加全面的運動區域。KIM算法原理框圖如圖1所示。

圖1 KIM算法流程圖
設 It-1、It、It+1為視頻的連續 3 幀圖像,利用幀間差分法原理,首先計算It-1和It的差值以及It和It+1的差值,然后通過閾值化分割得到二值圖像,并將結果進行與運算,得到其共同部分,從而有效去除幀差法的“雙影”效果。
因此在三幀差法中使用一種改進的自適應閾值選擇方法,利用幀差圖像的結果,即運動像素的均值作為閾值,然后對幀差結果進行二值化處理,公式描述如下:

其中,d(i,j)表示圖像中點(i,j)的灰度值,n 為圖像中像素不為0的點的個數,M,N分別為圖像的高度和寬度,如果d(i,j)≥Tth,則改點為運動點。
由圖2的實驗結果可知,該方法得到的運動區域檢測效果比采用固定閾值和OTSU法(大津法)即最大類間方差法得到的結果要好的多。手動設定閾值和OTSU法得到的二值圖像明顯缺失了大部分運動區域,而自適應均值法則能很好的提取出運動區域部分。
但是在視頻圖像中無運動目標時,輕微的環境變化會使檢測的噪聲很大,此次是通過設定閾值下限來改善無運動目標時噪聲很大的情況。當得到差值圖像Dt(x,y)時,先求得其像素的最大與最小值的差值 Xt,若 Xt<T,則令差分圖像 Dt(x,y)=0,若Xt≥T,則通過上述的自適應閾值方法得到二值圖像,此處使T=40。

圖2 三種閾值分割方法的結果圖
背景減法一般有統計中值法、卡爾曼濾波法、高斯模型法、Surendra法等。考慮到實時性因素,這次是使用均值法進行初始背景計算,然后利用Surendra算法[6]進行背景更新和背景建模。首先利用連續的N幀視頻圖像取像素平均值建立初始背景B(x,y),公式描述如下:

然后將初始背景與當前幀進行差值計算,并設置閾值T,若差值小于閾值時,對當前幀進行累加求和并使計數器加一,若差值大于閾值則忽略不計。如此反復進行下一幀與初始背景的差值計算。累加到一定幀數后對累加的和進行均值計算,得到背景,如果累加和為零,則用初始背景的像素點作為新的背景。
獲取背景圖像后,將當前幀與背景圖像做差值運算,得到的就是運動區域,即前景圖像。然后通過閾值化分割得到二值化圖像,閾值通過上述的自適應閾值法求得。
由于光照等外界環境的影響,背景在不斷的變化,因此需要建立背景更新模型來降低背景減法所帶來的檢測誤差。這次利用閾值分割的二值化結果TBt(x,y)使用了一種自適應背景更新模型。公式描 述如下:

其中,Bt+1(x,y)和 Bt(x,y)分別為輸入第 t+1幀、第t幀圖像后得到的背景,It+1(x,y)為輸入的第t+1幀圖像,TBt(x,y)=1 表示點(x,y)被判定為運動點,背景像素不變,TBt(x,y)=0 表示點(x,y)被判定為背景點,利用當前幀進行背景更新。α為背景模型學習速率。α值太小,則背景更新很慢,不能很好地體現出視頻圖像的變化,會降低對運動目標檢測的正確率;而α值太大,則背景更新很快,容易產生虛假檢測。因此,α的取值不能太大或者太小,經驗值在0.05 到0.1 之間,取 α =0.05。
將三幀差法和背景減法閾值化后得到的二值圖像進行或運算,得到初步的運動區域,由于檢測圖像中會存在一些散點和噪聲,因此對結果圖像進行形態學處理來消除這些影響,一般的形態學處理有腐蝕、膨脹、開運算和閉運算。
2001年,Viola和 Jones[7]提出了積分圖像的概念和基于Adaboost方法訓練人臉檢測分類器的方法,建立了第一個真正實時的人臉檢測系統。其基本思想是在給定的訓練集上反復訓練,挑選出關鍵的分類特征(弱分類器),然后把這些在訓練集上得到的弱分類器線性組合起來構成一個最終的強分類器。
此次的人臉檢測方法主要是基于類Haar特征的積分圖運算、Adaboost算法和級聯分類器相結合的方法。人臉檢測原理框圖如圖3所示。

圖3 人臉檢測流程圖
類Haar特征是一種矩形特征,主要分為三類:邊緣特征、線性特征和對角線特征。這些特征模板都是由兩個及以上的全等矩形相鄰組合而成,特征模板內有黑白兩種矩形,并定義模板的特征值為白色矩形內的像素和減去黑色矩形內的像素和。為提高訓練與檢測的速度,選擇了圖4中3種類型5種形式的矩形特征。

圖4 3種類型的5種矩形特征
利用所得的積分圖矩陣可以快速計算矩形特征。矩形特征的特征值計算,只與此特征端點的積分圖有關,而與圖像坐標值無關。因此,不管矩形特征的尺度如何,特征值的計算所耗費時間均為常量,而且只是簡單的加減運算。
Adaboost算法是一種迭代算法,它能自適應的調節訓練樣本權重的大小。起初每一個訓練樣本都被賦予一個權重,表明它被某個分類器選入訓練集的概率。如果某個樣本點被準確分類,則在構造下一個訓練集中,它被選中的概率降低,反之,則它的權重提高。在每一次迭代訓練后,挑選出當前樣本權重分布下分類錯誤率最小的弱分類器作為最佳弱分類器,并通過線性組合將這些最佳弱分類器組成一個強分類器。Adaboost算法具體步驟如下[8]:
(1)給定一系列訓練樣本 (x1,y1),(x2,y2),...,(xn,yn),其中 yi=1 表示人臉,yi=0 表示非人臉。
(3)迭代T次求取最佳弱分類器,即最佳特征。For t=1,2,...,T
b.對每個特征 f,訓練一個弱分類器 h(x,f,p,θ),計算對應所有特征的弱分類器的加權qt的錯誤率 εf:εf= ∑iqi|h(xi,f,p,θ)- yi|
c.選取最佳弱分類器hi(x),即擁有最小錯誤率εt:

ht(x)=h(x,ft,pt,θt)
其中ei=0表示xi被正確分類,ei=1表示xi被錯誤分類
(4)最后的強分類器:

多層級聯分類器結構的每一層都是由Adaboost算法訓練得到的強分類器。級聯結構可以快速有效地對輸入圖像中的非人臉部分進行排除,從而提高人臉檢測的速度。在圖像檢測中,待檢測子窗口依次通過每一層分類器,位于前端的強分類器所包含的特征較少,分類速度很快,可以將大部分的非人臉子窗口排除,通過每一層分類器的檢測子窗口即為候選的人臉窗口。位于后面幾層的強分類器包含的特征數目增多,用來區分那些與人臉類似的負樣本。雖然特征數量變多了,但是能夠達到這些層的子窗口數已經很少,因此在實際檢測時,后面幾層的檢測也不耗時。這些通過訓練得到的每一層分類器,都要滿足一定的性能要求,即檢測率和虛警率。每一層的檢測率和虛警率可以依據整個系統的檢測率與虛警率得到,系統的檢測率和虛警率分別等于各層的檢測率與虛警率的乘積。
為了驗證算法的有效性,使用監控攝像機在實驗室中拍攝的視頻進行實驗,視頻單幀圖像大小設定為320×240進行算法測試。圖5與圖6為這次算法對視頻中的人臉進行檢測的實驗結果圖。實驗結果表明,這種算法在視頻圖像中基本能夠準確、實時的進行人臉檢測。

圖5 算法的實驗過程結果圖

圖6 視頻圖像的檢測結果
由于高原地區霧天較多,同時由于霧霾天氣增加,霧景圖像增強技術需求不斷增強,因此科研領域產生了很多霧景圖像增強新算法,它們各有其優缺點。由于自然圖像的復雜性,現存的很多算法不能完全滿足需要。因而,霧景圖像增強領域必須解決以下幾個問題:在圖像增強的時候,會出現噪聲擴大,細節丟失的現象,這仍是今后需要改進的地方。找到一個算法可以增強霧霾條件下圖像是今后研究的重點和難點,也是今后圖像去霧研究的發展方向。盡量減少人工干預的成分,使參數獲得智能化、自動化。將一些性能好的智能算法、優化算法應用到霧景圖像增強方面,以提高霧景圖像增強的效率。
[1]劉治群,汪榮貴,楊萬挺.一種改進的處理霧天降質圖像的增強算法[J].淮北煤炭師范學院學報,2008,4(29):52-56.
[2]周衛星,廖歡.基于高頻強調濾波和CLAHE的霧天圖像增強方法[J].數字視頻,2010(7):38-40.
[3]胡大南,何濤.基于霧天環境下圖像增強方法研究[J].科技論壇,2011(2):14 -15.
[4]衛婷婷,紀峰,龐勝軍.圖像增強算法新進展[J].寧夏師范學院學報(自然科學),2012(12):6-33.
[5]黃黎洪.一種基于單尺度Retinex的霧天降質圖像增強新算法[J].應用光學,2010,31(5):728 -733.
[6]ROSENMAN J,ROE C A,CROMATRIE R.Portal film enhancement:technique and clinical utility[J].International Journal of Radiation Oncology,Biology,Physics,1993,25(2):333 -338.
[7]John P.Oakley,Brenda L.Satherley.Improving Image Quality in Poor Visibility Conditions Using a Physical Model for Contrast Degradation[J].IEEE TRANSACTIONSONIMAGEPROCESSING,1998,7(2):167-179.
[8]錢徽,朱淼良.大氣退化的自然山體圖像復原研究[J].計算機輔助設計與圖形學學報,2002,14(6):526-529.
[9]劉錦鋒,黃峰.天氣影響的場景影像復原方法[J].光電工程,2005,32(1):71 -73.
[10]葛君偉,謝祥華,方義秋.霧天圖像清晰化方法及應用[J].重慶郵電大學學報(自然科學版),2010,22(2):223-226.
[11]汪榮貴,楊萬挺,方帥.基于小波域信息融合的MSR改進算法[J].中國圖象圖形學報,2010,15(7):1901-1908.
[12]董慧穎,方帥,王欣威.基于物理模型的惡化天氣下的圖像復原方法及應用[J].東北大學學報(自然科學版),2005,26(3):217 -219.
[13]許志遠.霧天降質圖像增強方法研究及DSP實現[D].大連:大連海事大學博士論文,2010.
[13]胡學友.霧天降質圖像的增強復原算法研究[D].合肥:安徽大學碩士論文,2011.