張寶華,劉 鶴
(內蒙古科技大學信息學院,包頭014010)
基于序列圖像的運動目標檢測是計算機視覺和圖像處理領域的重要研究方向,被廣泛應用于視頻監控、模式識別、自動控制等諸多領域。可見光和紅外圖像是目標檢測的主要研究對象,可見光圖像在夜晚和暴雨、大霧等極端天氣條件下,難以有效地檢測運動目標;相比而言,紅外圖像即使在夜晚和光線不足的條件下,也能捕捉跟蹤運動目標,因此,基于紅外序列圖像的運動目標檢測受到學者重視。LI在提取感興趣區域基礎上,利用小波分析和支持向量機實現了熱紅外運動目標檢測[1],提高了檢測的方法的魯棒性;ZIN將多特征融合后利用混合特征分析實現了近紅外紅外目標檢測,擴展了檢測方法的應用范圍[2];GENIN采用基于高斯混合模型的匹配濾波器,實現在非平穩背景下的紅外點目標檢測[3];ELGUEBALY構造多維非對稱廣義高斯混合模型實現對紅外行人目標進行檢測[4]。LI和 WANG 等人[5-6]結合形態學及其改進方法檢測紅外運動目標,優化了原有方法,檢測準確率進一步得到提高。
幀間差分法、光流法、背景差分法等方法是主要的紅外序目標檢測方法,其中以背景差分法應用最廣泛[7-8],通過獲取背景模型并比較當前幀與背景模型的差異,檢測出序列圖像中的運動目標。背景模型的精度決定背景差分法的有效性,若背景建模過程發生場景變動、成像設備顫動等情況,會嚴重降低圖像的對比度和信噪比,影響對紅外目標的識別。基于高斯混合模型的背景建模方法,采用多個高斯分量模擬背景信息,根據背景信息變化有效地檢測出運動目標,但當高斯混合模型初始化,新模型建立以及學習率不匹配時都會產生虛影現象,為了克服這一缺陷,作者提出了一種基于脈沖耦合神經網絡(pulse coupled neural network,PCNN)和高斯混合模型(Gaussian mixture model,GMM)的目標檢測算法,通過分水嶺算法結合表征目標區域離散像素點的空間信息得到閉合區域,再通過基于PCNN的分割算法消除虛影,最終檢測出完整的紅外運動目標。
STAUFFER等人提出了GMM的表達形式[9],能夠檢測復雜背景下的運動目標,其基本思想是:序列圖像中各像素點在不同時刻的灰度值相互獨立且具有相同分布,用3個~5個獨立高斯分布表示像素點在一段時間內的取值x1,x2,…,xt,從而得到該點的概率分布函數,即P(xt):

式中,ωi,t表示t時刻像素點屬于第i個高斯分布的權重,ui,t為高斯模型均值,T 為經驗常數,Σi,t為高斯模型的協方差,σi,t為標準差,I為單位矩陣,m 為當前時刻像素值xt的維數,η為高斯模型的概率密度函數。高斯混合模型在學習過程中根據新一幀的圖像信息對權重、均值、協方差更新。將當前時刻像素值xt與K個高斯模型匹配,若xt與第i個高斯模型的差小于2.5倍標準差σi,t,則認為與當前模型匹配,并通過下式更新:

式中,α為學習率,表示運動目標融入背景的速度;ρ為權值;Mt=1時表示匹配,Mt=0表示不匹配。不匹配時,減小權重,且不對均值,方差進行更新。將K個高斯模型按照 ωi,t/σi,t的比值降序排列,若 xt與 K 個高斯模型都不匹配,則把排在最后的高斯模型使用新的模型代替,新模型的均值為xt,標準差和權值分別為初始值。每次更新后,對權值進行歸一化處理,使各權重的和始終為1。
由于與xt最為匹配的高斯模型具有最大權值和最小標準差,可以根據與xt的匹配度對K個高斯模型排序,以確定背景區域和運動目標;處于排序靠前的高斯模型對應穩定背景,而靠后的高斯模型對應運動目標。將K個高斯模型排序中的前b個作為像素背景模型B,Q表示背景高斯模型在像素點的概率分布中所占的最小比例,如下式所示:

紅外序列圖像(見圖1a)受隨機噪聲干擾嚴重,由高斯混合模型檢測得到代表運動目標的像素點集夾雜部分離散點,因而構成的目標區域不連續,如圖1b所示。為了獲得輪廓清晰、結構完整的目標區域,需要獲取像素點所在區域的外圍輪廓信息,外圍輪廓對應于序列圖像中運動目標邊緣灰度值變化劇烈的區域,而圖像的空間頻率能表示圖像中灰度值變化的劇烈程度。所以計算圖像的空間頻率(spatial frequency,SF)可以準確定位紅外目標邊緣。首先將原矩陣AM×N圍繞邊界進行鏡像反射擴展為A1,A1=A(M+2)×(N+2)×A(M+2)×(N+2),然后根據下式求出圖像的空間頻率矩陣C(x,y):


Fig.1 Extraction of infrared closed areaa—original image b—discrete target c—target edge d—closed target
根據圖像的空間頻率信息可以快速獲取圖像的邊緣,如圖1c所示。再通過沉浸法分水嶺變換[10],將得到的若干個閉合區域合并為同一區域,實現將離散的像素點合并為閉合聯通的目標區域,如圖1d所示。分水嶺算法運算速度快,因此適合處理序列圖像。
虛影現象的產生主要由于以下原因:首先,高斯混合模型的初始化參量大多源于經驗值,不同圖像取值相同;其次,圖像內容劇烈變化時,需建立新的初始模型代替原有模型中排序最低的模型,當前模型就不再可靠;最后,高斯混合模型的學習率過大時,速度緩慢的目標融入背景時,背景更新相對加快,需不斷建立新模型代替舊模型。上述現象都會產生虛影現象,無法獲取完整的運動目標。
為了消除虛影現象,首先需要選定虛影區域位置,作者利用PCNN能夠通過同步脈發放行為獲取圖像空間特征分布信息的特點,通過計算圖像的局部能量,將其作為PCNN的外部刺激,通過脈沖獲取圖像的點火映射圖,點火映射圖中不同的點火次數對應不同的灰度范圍,灰度值越大,點火往往次數越高,記錄像素點的點火次數可以得到灰度值較高的目標區域[11],但由于PCNN有時會過度分割出同樣具有較高灰度值的背景區域。將2.1節中得到的運動目標區域與PCNN算法得到的分割目標進行與操作,可以檢測出準確的運動目標。
PCNN模型的數學描述可以分為以下步驟。
(1)神經網中各神經元都處于熄火狀態:

(2)將分解系數輸入網絡,通過接收域、調制域和脈沖產生域,逐點計算Uxy(n)和Txy(n-1),并比較兩者大小以決定是否產生點火事件。
PCNN在迭代操作過程中的神經元由接收域、調制域和脈沖產生域組成:

式中,x和y表示圖像各像素點橫縱坐標值,n代表迭代次數,Sxy代表輸入激勵,Fxy表示反饋通道輸入,Wxy為突觸聯接權,Uxy表示神經元的內部活動項,Yxy表示神經元的脈沖輸出,它的值為0或者1,Txy是動態閾值,V1和V2為歸一化常數,α1和α2為調節對應式子的常量,β表示鏈接強度。如果Uxy(n)>Txy(n),則神經元激發產生脈沖,否則神經元不激發,不產生脈沖輸出。
本算法具體步驟如下:(1)通過高斯混合模型獲得代表運動目標的像素點,并將其二值化;(2)計算二值化圖像的空間頻率,得到目標邊緣信息;(3)根據邊緣信息,通過分水嶺算法,得到閉合的運動目標區域;(4)計算每一幀圖像的局部能量,通過PCNN進行分割,獲得潛在的目標區域;(5)將高斯混合檢測出目標區域同PCNN分割目標區域進行與運算得到當前幀的最終運動目標。圖2為本算法的流程圖。

Fig.2 Algorithm flowchart
首先,計算當前幀圖像(infrared image sequences)的局部能量圖(local energy map),并將局部能量圖作為PCNN的激發源獲取的每個像素點的點火次數(firing times),根據點火次數可以分割出紅外目標區域。同時,再將當前幀圖像經過GMM后獲取離散的運動運動目標(discrete objects)。然后根據離散目標的空間頻率(spatial frequency),獲取目標邊緣,采用對于邊緣信息敏感的分水嶺算法(watershed algorithm)實現離散目標的填補,得到閉合目標(closed target)。最后,將PCNN獲取的紅外目標區域和GMM獲取的運動目標進行與計算獲取當前幀圖像完整的運動目標(mov
ing object)。
為了驗證算法的有效性,通過2組對比實驗來證明本算法的效果,實驗數據來源于Oklahoma大學Visual Computing and Image Processing實驗室。第1組實驗如圖3所示,序列圖像共有300幀,每幀圖像大小320pixel×240pixel,圖3a為序列圖像的第12幀、第17幀、第23幀;圖中人物處于運動狀態,高斯模型的初始化過程產生了虛影,如圖3b所示;通過PCNN對3a進行分割,得到二值化的運動目標區域,如圖3c所示,由于背景中部分區域的灰度值和目標灰度值接近,出現欠分割現象。將高斯混合模型獲取的運動目標與PCNN分割得到的目標區域進行與運算,得到的二值化圖像映射到原始圖像圖3a中,獲得完整的運動目標,如圖3d所示,圖3f和圖3g分別為采用背景差分法和幀間差分法檢測到的運動目標,比較圖3d~圖3f,可看到圖3d與原圖目標最接近。

Fig.3 The first set of experimental resultsa—original image b—ghosting target c—closed target d—PCNN segmentation target e—the method in this paper f—background subtraction g—fame difference method
第2組實驗如圖4所示,序列圖像共有258幀,每幀圖像大小320pixel×240pixel。圖4a為序列圖像中的第43幀、第78幀和第112幀,人物從交匯到離開。通過高斯混合模型得到的運動目標如圖4b所示,運動目標不是閉合的,伴隨著虛影現象。通過分水嶺變換,填補目標內部的孔洞如圖4c所示,再經過PCNN獲取目標區域,如圖4d所示,通過與計算得到完整的運動目標,如圖4e所示,圖4f和圖4g分別為采用背景差分法和幀間差分法檢測到的運動目標。上述實驗中,背景差分法通過比較序列圖像與背景圖像的灰度差判斷運動目標,但是由于背景圖像無法實時更新,會產生較大誤差。幀間差分法根據相鄰兩幀圖像的灰度差來判斷運動目標,對于紅外圖像而言,由于目標的灰度值近似相等,所以不能準確判斷運動目標。通過比較,本文中的方法檢測到的運動目標比上述兩種方法更加精確。

Fig.4 The second set of experimental resultsa—original image b—ghosting target c—closed target d—PCNN segmentation target e—the method in this paper f—background subtraction g—fame difference method

Table 1 SSIM of target region
作者根據客觀評價指標對算法進一步做了定量分析。結構相似度(structural similarity,SSIM)表示兩幅圖像的結構相似度,越大說明越相似。通過將傳同方法檢測出的紅外運動目標和原始圖像中紅外運動目標分別求取結構相似度,如表1所示,可以看到用作者的方法得到的SSIM高于其它方法,說明了本文中算法的有效性。
紅外圖像受噪聲干擾嚴重,傳統的基于高斯混合模型的檢測方法效果不理想,作者提出了改進算法,將分水嶺算法引入區域檢測中,實現對紅外目標的定位;再利用PCNN的脈沖激發點火特性消除虛影,實現對紅外運動目標的精確檢測。實驗結果表明,算法能夠克服模型初始化參量設置、模型轉換等對目標檢測產生的不利影響,效果好于傳統方法。
[1] LI J F,GONG W G,LI W H,et al.Robust pedestrian detection in thermal infrared imagery using the wavelet transform [J].Infrared Physics& Technology,2010,53(4):267-273.
[2] ZIN T T,TIN P,HIROMITSU H.Pedestrian detection based on hybrid features using near infrared images[J].International Journal of Innovative Computing Information and Control,2011,7(8):5015-5025.
[3] GENIN L,CHAMPAGNAT F,BESNERAIS G L.Single frame IR point target detection based on a Gaussian mixture model classification[C]//Electro-Optical and Infrared Systems:Technology and ApplicationsⅨ.Edinburgh,United Kingdom:SPIE,2012:854111.
[4] ELGUEBALY T, BOUGUILA N.Finiteasymmetricgeneralized Gaussian mixture models learning for infrared object detection[J].Computer Vision and Image Understanding,2013,117(12):1659-1671.
[5] LI Y,WANG J B,LU J J,et al.Single frame infrared image targets detection based on multi-mixture filters model[J].Advanced Materials Research,2012,486(3):1389-1392(in Chinese).
[6] WANG Y Y,ZHANG Y Sh,HE P.Research on IR target-detecting method based on morphology and entropy[J].Laser & Infrared,2012,42(5):513-517(in Chinese).
[7] WANG Y Zh,LIANG Y,PAN Q,et al.Spatiotemporal background modeling based on adaptive mixture of Gaussians[J].Acta Automatica Sinica,2009,35(4):371-378(in Chinese).
[8] WEI Zh Q,JI Y P,FENG Y W.A moving object detection method based on self-adaptive updating of background [J].Acta Electronica Sinica,2005,33(12):2261-2264(in Chinese).
[9] STAUFFER C,GRIMSON W E L.Adaptive background mixture models for real-time tracking[C]//Computer Society Conference on Computer Vision and Pattern Recognition.New York,USA:IEEE,1999:252.
[10] VINCENT L,SOILLE P.Watersheds in digital spaces:an efficient algorithm based on immersion simulations[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,3(6):583-598.
[11] ZHANG B H,LIU H,ZHANG Ch T.Medical image fusion algorithm based on texture extraction by means of bidimensional empirical mode decomposition[J].Laser Technology,2014,38(4):463-468(in Chinese).