摘要:提出一種基于動態閾值對稱差分和背景差法的運動對象檢測算法。首先通過建立一個基于統計的可靠背景更新模型,由背景差法得到基本準確的前景圖像;然后與用對稱差分法得到的差分圖像綜合;最后得到完整可靠的運動目標圖像。中間采用了一種動態的最優閾值獲取方法,然后用形態學濾波和連通區域面積檢測進行后處理,以消除噪聲和背景擾動帶來的影響,并用區域填充算法來填補目標區域的小孔,從而將視頻序列中的運動目標比較可靠地檢測出來。實驗結果表明,該方法快速#65380;準確,有一定的實際應用價值。
關鍵詞:背景差; 對稱差分; 背景模型; 運動檢測
中圖分類號:TP391文獻標志碼:A
文章編號:1001-3695(2008)02-0488-03
0引言
在計算機視覺系統中,運動對象的檢測與分割有著非常重要的應用,如視頻監控[1,2]#65380;圖像壓縮[3]#65380;多媒體索引[4]和對象的識別跟蹤[5]等。精確的運動對象分割可以極大地提高運動對象跟蹤#65380;識別和分類的性能。在進行運動對象檢測時,通常有三種方法,即光流法#65380;時間差法和背景差法。
光流法[6]是在不需要背景區域的任何先驗知識條件下就能夠實現對運動目標的檢測和跟蹤。但是,光流法的計算量非常大,對噪聲比較敏感且對硬件要求比較高。時間差法[7]是對連續圖像序列中的兩個或三個相鄰幀計算基于像素的時間差分,并進行閾值化處理來提取出圖像中的運動區域。該方法能夠適應環境的動態變化,實現實時的運動檢測。但如果運動目標上像素的紋理#65380;灰度等信息相近,通常只能得到部分運動信息。文獻[8]對時間差法進行了改進,利用相鄰三幀圖像先差分再求和,獲得比時間差法更好的運動分割結果。但運動目標在很多情況下仍不完整。背景差法[9~15]是目前運動分割中最常用的一種方法。它是利用當前圖像與背景圖像的差分來檢測出運動區域的一種技術。該方法基本克服了時間差法的缺點,但對于動態場景的變化(如光照和外來無關事件的干擾等)比較敏感。當在運動目標部分位置灰度和背景差異不大的情況下使用該法檢測時,相應位置可能會被漏檢。
背景差法的關鍵在于背景圖像的初始化和更新。一種經典的背景圖像獲取方法是時間平均法,即對一段時間內的圖像序列求和再平均,獲得一幀近似的背景圖像。但這種方法容易將前景運動目標混入到背景圖像中,這種現象叫混影現象(blending)。另外,通過建立背景模型法[9,10]并采用自適應方法對模型參數進行調整,從而可以獲得背景圖像。C.Stauffer等人[9]采用k個混合高斯(mixture of Gauss,MOG)模型(k取3~5)表示背景像素的分布規律。每個像素灰度用k個混合加權的高斯分布表示。這種多高斯的分布模型能夠在一定程度上表示樹枝的抖動或背景的微小變化,但該算法需要大量的運算時間和不能檢測運動陰影。為了克服MOG模型的缺點,A.Elgammal等人[10]提出非參數方法來估計背景的概率密度函數,采用核密度估計來表示圖像序列上一個像素的鄰近樣本顏色的概率密度。由于不是采用少數幾個高斯分布表示背景分布,而是針對鄰近的幾十個樣本都建立一個高斯核函數,該方法具有更高的魯棒性。但其缺點是計算效率較低。
另外還有一種不同的構建背景的方法,就是從過去的一組觀測圖像中按照一定的假設選擇像素灰度構成當前的背景圖像。W.Long等人[11]提出了一種自適應平滑算法。他們認為在一段圖像序列中,像素點處于穩定狀態最長的灰度值是背景像素灰度值。但如果前景運動目標運動較慢或者在一段時間內暫時處于靜止狀態時,穩定狀態最長的灰度值往往是前景目標,此時就會產生錯誤結果。B.Gloyer等人[12]假設在訓練階段背景至少在50%的時間內可以被觀測到。由此提出了中值法(median),即將圖像序列中處于某個像素點中間的灰度值認為是該點的背景像素灰度值。侯志強等人[13]提出了一種基于像素灰度歸類的背景重構算法(pixel intensity classification algorithm,PICA)。該算法連續求解相鄰兩幀圖像對應像素點的灰度差,利用該灰度差對該像素點灰度進行歸類,最后選擇頻率最高的灰度值作為該點背景像素的灰度值。Tao Yang等人[14]提出了一個基于統計的方法來構建背景,其利用運動對象像素值的變化比背景像素值快的特點,通過像素級和幀級一起來初始化背景以及背景的更新。
針對以上問題,本文提出了一種基于動態閾值對稱差分和背景差法的運動對象檢測算法。它首先通過對稱差分,能較好地提取出中間幀運動目標的形狀輪廓;然后采用文獻[14]中提出的運動對象像素值的變化比背景像素值快的特點,并結合對稱差分來初始化背景以及背景的更新;最后利用背景差法來提取運動對象。此外,本文還采用一種動態最優閾值的算法[16]和形態學梯度算法來抑制陰影,進一步提高了運動目標檢測的準確性。
1動態閾值對稱差分和背景差分的運動對象檢測算法
1.1算法概述及流程圖
圖1為基于動態閾值對稱差分和背景差法的運動對象檢測算法的算法流程圖。算法主要由對稱差分#65380;背景差法#65380;運動檢測#65380;背景模型更新和后處理等部分組成。首先,對圖像進行噪聲濾波處理和形態學梯度運算(抑制陰影);接著進行對稱差分#65380;背景差分和背景更新運算;然后將這兩種方法得到的二值化模板圖像通過一個算法來生成最終的運動對象的模板圖;最后對該模板進行必要的后處理,包括連通組元分析和形態學濾波(如開#65380;閉運算)以去除模板中的噪聲和一些面積很小的像素區域,并平滑運動對象的邊界。其中:背景初始化#65380;背景更新和運動檢測是本算法的核心和關鍵。
1.2對稱差分
對稱差分能夠去除因運動而顯露背景的影響,從而準確得到運動目標的輪廓,算法如下:
其中:Ii, j(k)#65380;Ii, j(k-1)#65380;Ii, j(k+1)分別表示相鄰的三幀。但在實際的處理過程中,為了去除運動對象緩慢運動帶來的分割影響,采用每隔三幀取一幀的方法。該方法比用逐幀取更能有效地消除對象緩慢運動帶來的影響。式(1)(2)中W是一個抑制噪聲的窗口函數。由于均值濾波會使圖像模糊化,從而失去邊緣信息。本文選用窗口為3×3的高斯濾波來抑制噪聲。Tf(閾值)采用一種動態最優閾值算法來獲取(參見1.4節)。FM(k)和FM(k+1)分別表示幀差二值化后的圖像。然后利用式(3)對每一個像素進行與操作,最后得到對稱差分結果二值圖像FDM。
1.3背景差法
背景差法是通過當前幀減去背景參考幀,然后對所得圖像選擇合適的閾值二值化后,即得到完整的運動目標。該算法是一種最為簡單和有效的方法,完全克服了相鄰幀差法的缺點。該方法適用于對前景緩慢運動時的目標檢測。通過比較當前源圖像Ii, j(k)和背景圖像BGi, j(k)灰度值的差異,通過閾值分割就可以得到二值化的前景圖像BDMi, j(k)。
本文算法首先對背景進行初始化,并實時地對背景進行更新。由于運動對象位置的像素灰度值的變化一般比真正的背景像素值變化得快,筆者利用這個特點作為判斷像素是不是前景像素或背景像素的主要依據。依據FDM,如果像素在一定時間段內不移動,就認為它是背景像素。背景初始化和更新的算法如下:
其中:λ記錄像素運動狀態的時間長度,該值由用戶指定;BG(k)表示k時刻的背景;BG#65380;BI初始值均為0。矩陣D表示像素屬于背景的概率。如果D的值越趨近于0,那么它是背景的概率越高;反之就越低。當Di, j(k)=0時,該像素將通過式(5)更新到背景BG中。BI是一個二值模板圖像,它表示當前位置的背景像素是否存在,如果BI=1則存在。
在本文中利用式(4)(5)更新背景之前,先通過式(7)作判斷,以提高背景更新的效率。在實驗中,如果v<0.001,就認為該幀無對象在運動,直接通過式(5)來更新背景,則此時α的值可適當增大。利用式(7),可有效地避免“鬼影”的發生。
1.4動態最優閾值
在本文的對稱差分算法中采用了文獻[16]中提出的一種動態的最佳閾值獲取算法。該算法在閾值處理技術上,從圖像的灰度級特征出發,定義了前景和背景的類內中心以及類內像素的分散度;根據類內中心以及分散度,引入了類間距判別函數;以前景和背景最大程度地分開為判據,建立了一種能給出最優的動態閾值的算法。
假設以灰度級t為閾值把全部像素分成兩類:S1(背景類)包含了小于t的像素;S2(前景類)包含了大于t的像素。用D表示兩個類之間的距離,D越大表示兩個類的類間距越大,S1和S2分得越開。用以下公式表示:
式(9)中Tf是一個固定的值;式(10)中的λ為抑制系數,它可以根據實際應用的需求設置為某個值,其參考值取2;M×N表示所處理每幅圖像的尺寸大小,其數值結果表示檢測區域的像素個數;ΔT反映了環境的整體變化情況。如果圖像光照變化較小,動態閾值ΔT 是一個很小的值,在假定檢測區域的像素足夠多的前提下,將趨近于0;如果圖像光照變化明顯,則動態閾值ΔT 將明顯增大,這就有效地抑制了光線變化帶來的影響。
1.5運動對象的檢測
利用Chen Shao-yi等人[15]提出的觀點,采用式(11)提取運動對象掩模OM。該方法充分利用了對稱差分和背景差的特點,并有效結合起來,可有效地去除靜止的運動對象和被覆蓋的背景對運動對象的精確檢測帶來的影響。
1.6后處理
由于相機的噪聲以及對象不規則運動帶來的噪聲,提取的運動對象掩模OM可能會有一些噪聲出現;另外也有可能邊界不平滑。這就需要通過噪聲去除和邊界平滑對提取的對象掩模作后處理。首先可以通過連通檢測和形態學運算來對圖像進行噪聲處理。先進行形態學濾波,OM先膨脹再腐蝕(即閉運算),得到運動目標的完整區域;利用連通分量算法來計算OM前景圖像中每個獨立的前景區域的大小,把像素個數少于15的區域視為噪聲區域,然后去除它;利用區域填充算法來填補目標區域中的小孔,直到只剩下含有運動目標的二值運動目標圖像;最后通過形態學的開閉運算來平滑OM圖像。
2陰影的抑制算法
在HSV 模式下, 當一個像素點被陰影覆蓋時, 它的亮度變化較大, 而色度信號變化不大, 可以使用如下方法進行判別[17]。
但該算法的突出問題是:在彩色空間中處理,算法復雜#65380;運算量大#65380;抗干擾能力差#65380;不太適合實時檢測。在此筆者采用一種簡單的方法(梯度濾波)來減小陰影給對象分割帶來的影響。首先輸入的幀經過噪聲濾波后,再采用形態學梯度的方法去除陰影,算法為GRA=(IB)-(IΘB)。其中:I是輸入的原始圖像;B是形態學運算的3×3結構元素;GRA是梯度圖像;是形態學膨脹運算符;Θ是形態學腐蝕運算符。經過梯度運算后陰影的影響將會減少。但是經過梯度運算后,邊界將會變寬,這時還需要對GRA做進一步的形態學腐蝕操作,以便減小梯度圖像邊界的寬度。
3試驗結果與分析
利用本文中的方法在普通PC機(CPU為Intel Pentium 4 2.4 GHz,內存為512 MB)上,利用VC 6.0+OpenCV(Intel open source computer vision library)實現對hall視頻圖像的處理,并與OpenCV提供的算法作對比,結果如圖2#65380;3所示。
可以看出本文算法可以很好地提取運動對象,并且對背景進行不斷的更新。例如在141幀時,背景中沒有皮包,而在237幀時,皮包已經被更新到背景中,這時皮包已經不是運動的對象,因此沒有被檢測出來,而且本文算法的復雜度是O(n2)。
4結束語
本文提出了一種基于動態閾值對稱差分和背景差分的運動對象檢測算法。該算法有以下特點:第一,基于對稱差分且穩定而有效的背景注冊;第二,有效的動態閾值分割圖像;第三,采用了一種有效而簡單的陰影抑制方法來削弱陰影帶來的影響。該方法的優點在于存在運動目標的情況下,準確地提取并更新背景模型,利用背景差法得到基本準確的運動區域,并且和對稱差分法結合起來,將運動區域完整準確地檢測出來。另外,該方法也很好地解決了動態最優閾值選取問題。實驗結果表明,該方法快速#65380;準確,有一定的實用價值。但該方法中陰影抑制在背景紋理比較豐富和強光源的情況下,會發生誤分割,這需要在下一步的工作中加以改進。
參考文獻:
[1]JABRI S, DURIC Z, WECHSLER H, et al. Detection and location of people in video images using adaptive fusion of color and edge information[C]//Proc of International Conference on Pattern Recognition. Barcelona:[s.n.], 2000:627-630.
[2]HARITAOGLU I, HARWOOD D, DAVIS L S. W4: real-time surveillance of people and their activities[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2000,22(8):809-830.
[3]CAVALLARO A, EBRAHIMI T. Video object extraction based on adaptive background and statistical change detection[C]//Proc of SPIE Visual Communications and Image Processing. San Jose:[s.n.], 2001:465-475.
[4]CUCCHIARA R, GRANA C, PICCARDI M, et al. Detecting moving objects, ghosts, and shadows in video streams[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2003,25(10):1337-1342.
[5]STAUFFER C, GRIMSON W. Adaptive background mixture models for real-time tracking[C]//Proc of International Conference on Computer Vision and Pattern Recognition. Fort Colins:[s.n.], 1999:246-252.
[6]BARRON J, FLEET D, BEAUCHEMIN S. Performance of optical flow techniques[J]. International Journal of Computer Vision, 1994,12(1):42-77.
[7]NERI A, COLONNESE S, RUSSO G, et al. Automatic moving object and background separation[J]. Signal Processing, 1998,66(2):219-232.
[8]JOLLY M P D, LAKSHMANAN S, JAIN A K. Vehicle segmentation and classification using deformable templates[J]. IEEE Trans, 1996,18(3):293-308.
[9]STAUFFER C, GRIMSON W. Adaptive background mixture models for real-timetracking[C]//Proc of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 1999:248-252.
[10]ELGAMMAL A, HARWOOD D, DAVIS L. Non-parametric model for background subtraction[C]//Proc of the 6th European Conference on Computer Vision. Dublin:[s.n.], 2000:751-767.
[11]LONG W, YANG Y. Stationary background generation: an alternative to the difference of two images[J]. Pattern Recognition, 1990,23(12):1351-1359.
[12]GLOYER B, AGHAJAN H K, SIU K Y, et al. Video-based freeway monitoring system using recursive vehicle tracking[C]//Proc of SPIE Symposium on Electronic Imaging: Image and Video Processing. San Jose:[s.n.], 1995:173-178.
[13]HOU Zhi-qiang, HAN Chong-zhao. A background reconstruction algorithm based on pixel intensity classification[J]. Journal of Software, 2005,16(9):1568-1576.
[14]TAO Yang, STAN Z. Real-time and accurate segmentation of moving objects in dynamic scene[C]//Proc of the 2nd International Workshop on Video Surveillance Sensor Networks. 2004:136-143.
[15]CHEN Shao-yi, HUANG Yu-wen, HSIEH B Y. Fast video segmentation algorithm with shadow cancellation, global motion compensation, and adaptive threshold techniques[J]. IEEE Trans on Multimedia, 2004,6(5):732-748.
[16]CHEN Min. An automatic recognition of the best threshod for image[J]. Computer Applications and Software, 2006,23(4):85-86.
[17]CUCCHIARA R,GRANA C,PICCARDI M,et al.Improving shadow suppression in moving object detection with HSV color information[C]//Proc of IEEE Int’l Conference on Intelligent Transportation Systems. Oakland:[s.n.], 2001:334-339.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”