張澤斌,袁嘵兵
(1.中國科學院上海微系統與信息技術研究所 上海200050;2.中國科學院上海微系統與信息技術研究所微系統技術國防科技重點實驗室,上海200050;3.上海科技大學 上海20000)
一種改進反饋機制的PBAS運動目標檢測算法
張澤斌1,3,袁嘵兵1,2
(1.中國科學院上海微系統與信息技術研究所 上海200050;2.中國科學院上海微系統與信息技術研究所微系統技術國防科技重點實驗室,上海200050;3.上海科技大學 上海20000)
為了提高PBAS算法在不同動態背景場景時的適應能力,本文在原始PBAS算法的基礎上提出了一種自適應多通道建模與分割閃爍點反饋的運動目標檢測方法。該算法綜合考慮多通道的信息,自適應調節各個通道的判別閾值以及權重;在不增加新特征的情況下,利用分割閃爍點統計信息反饋調整算法參數,減少錯誤判別結果。實驗結果表明,該算法在動態背景場景下具有原PBAS更好的適應能力,在大多數應用場景能提高更好的分割結果。
運動目標檢測;背景建模;PBAS;動態背景
分析和理解視頻序列是當前計算機視覺的重點研究鄰域。通常,運動目標檢測在自動視覺監控系統中起著基石的作用,同時它也是運動捕獲、活動分析等應用的基礎。運動目標檢測的基本操作就是將稱為前景的運動目標與稱為背景的穩定信息分離開來。理想狀況下,簡單的運動目標檢測算法可以從靜態穩定的背景中提取出運動的物體,然而絕大多數運動目標檢測的應用場景并不局限在室內靜態的環境,復雜多變的室外場景成為運動目標檢測算法的最大挑戰。
近年來,隨著計算機處理能力的提高,各種在動態背景下運動目標檢測的算法相繼提出。僅以背景建模為中心的算法就可以分類為:高級混合模型、模糊模型、判決與混合子空間學習模型、魯棒子空間模型和稀疏模型等。文獻[1]使用Student-t混合模型來替代高斯混合模型,而Student-t混合模型因為有比GMM更多的重尾屬性,所以對噪聲更具有魯棒性。文獻[2]提出了一種非參數區域模型(KDE)和參數化逐像素模型(GMM)的混合模型來近似背景顏色分布。文獻[3]提出一種低秩表達下異常值檢測的方式,同時估計了異常值支持和低秩矩陣。ViBe算法[4]是非參數模型算法中較為成功的一種算法,它使用隨機策略來保證模型樣本具有平滑指數衰減生命周期。PBAS算法[5]在ViBe算法的基礎上,為每個像素點分布設立單獨的判別閾值和學習率,且利用反饋機制提高模型的適應能力。然而PBAS算法在應對高度動態背景時,原有的策略并不能產生較好的前景分割結果。
文中針對動態背景條件下運動目標檢測存在的問題,提出了一種改進反饋機制的PBAS目標檢測算法。通過為不同顏色通道設立不同的判別閾值,在閾值更新時獨立更新各個通道,提高了算法對背景環境的建模能力;通過引入分割閃爍反饋機制,將提取前景的閃爍程度直接作用于判別閾值的調節過程中,增強了PBAS算法在復雜動態背景下的適應能力。
PBAS算法使用了與Vibe算法等相類似的非參數背景建模機制,將一系列最近觀察到的像素值集作為背景模型。將用于前景判別的閾值和背景更新的學習參數作為每個像素點的狀態變量,并且根據背景變化動態地控制這兩個狀態值。
如圖1所示,PBAS算法有幾個基本部件組成,包括前背景決策、背景模型更新、決策閾值更新和背景學習率更新等模塊。根據每個像素位置對應的判決閾值R(xi),決策模塊通過比較當前幀I(xi)與背景模型B(xi)來判別前背景。學習率T(xi)控制著背景模型的更新速度,學習率以及判決閾值在背景更新的過程中,不斷進行反饋調整。

圖1 PBAS算法總體結構
1.1 分割決策
背景分割的最終目的是得到一個二分類決策,將輸入圖像與背景模型比較,判斷像素點是否屬于前景。在PBAS算法中,背景模型是由N個最近觀察到的像素值組成:

如果像素點xi的像素值I(xi)與在背景模型B(xi)的N個值中有至少#min個距離在R(xi)內,則該像素點被判斷為背景點,否則為前景點。因此前景分割掩模計算式為:

在式(2)中,F=1表示前景。整個判決過程涉及到兩個參數:1)判決閾值R(xi),每個像素單獨擁有一個且會動態更新;和2)最小數量要求#min,是全局固定值。
1.2 背景模型更新
考慮到背景環境的變化,目標檢測算法中更新背景模型部分十分重要。PBAS算法采用了選擇性更新的策略,即只有被判別為背景的像素點才能用來更新背景模型。背景模型更新的過程為:隨機均勻選擇一個索引k∈1…N,相對應的背景模型值Bk(xi)被當前像素值I(xi)替換。在學習率參數T(xi)的控制下,即使當前像素點被判決為背景點,仍然只有1/T(xi)的概率會進行更新操作。
PBAS算法以1/T(xi)的概率用同樣的方式對鄰域像素點進行背景更新,即用當前鄰域像素值V(yi)更新鄰域像素點的背景模型中的Bk(yi)。參數T(xi)決定了背景更新的快慢,T(xi)越大,存在背景模型中的值保留的時間越長,T(xi)越小,背景模型中的值被替換的速度越快。
1.3 決策閾值更新
在視頻序列中,可能會存在高度動態的背景區域,也有可能存在幾乎不變的區域。理想情況下,對于高度動態的區域,門限R(xi)應該增大到不將背景判別為前景;對于靜態區域,門限R(xi)應該足夠小,提高前景檢測的靈敏度。PBAS算法引入了一個對背景動態進行量化估計的一個指標,從而可以根據這個指標進行動態調整門限R(xi)。
首先,在保留背景模型的同時,PBAS算法還創建了用來保存最小決策距離一個序列D(xi)={D1(xi),…,DN(xi)}。每當背景模型中Bk(xi)更新,當前觀察到的最小距離 dmin(xi)=minkdist(I(xi),Bk(xi))就被寫入這個序列中:Dk(xi)←dmin(xi)。最小決策距離的歷史記錄就可以通過這樣創建。取這些值的平均作為衡量背景動態程度的指標。
PBAS算法采取的判決閾值動態調整方式為:

其中,Rinc/dec,Rscale是固定參數。
1.4 學習率更新
無論像素點被判斷為前景還是背景,隨著時間推移,都會被判決為背景。而融入背景模型的速度由參數T(xi)決定。為了緩解這個問題,PBAS算法為T(xi)引入了動態調制機制,使得當像素點屬于背景時,背景學習概率增加;當像素點屬于前景時,背景學習概率減小。
PBAS算法假設處于高度動態區域的像素點很容易被判決為前景,所以T(xi)調整的力度可以根據動態程度估計值自適應。T(xi)的更新式為:

其中Tinc,Tdec是固定參數。PBAS算法規定Tlower<T<Tupper,從而使得背景學習率保持在一個合理范圍內。
2.1 多通道判別閾值的自適應機制
對于有RGB三通道的彩色視頻,原始PBAS算法的操作是:分離多個通道,對各個通道做獨立的前景提取算法,得到各個通道的前景分割圖后,再使用邏輯或組合3個通道的結果,即。這種處理方式雖然能夠在最終分割前景時融合多個通道的信息,但是這些信息無法為分割決策、背景更新和參數更新提供幫助。
在彩色視頻中,綜合考慮多通道的信息往往能更容易區分運動目標和動態的背景,使用多通道的背景模型也具有更好的背景建模能力。
文中結合彩色視頻特點和PBAS的算法結構,提出了一種多通道判別閾值的自適應機制。

圖2 改進的PBAS算法總體結構
如圖2所示,改進的多通道判決閾值方法為RGB3個通道皆設立了和狀態量,其中RX(xi)是通道X的判別閾值,是通道X當前最小決策距離,為通道X最小決策距離的平均值。
RX(xi)的更新方式為:


前景分割決策方式更改為:

該改進點的一個重要優勢在于它在一定程度上可以自適應地調整不同通道在判別前景時占有的決策權重。如式(5)所示,每個通道的閾值會隨著這個通道的背景擬合程度改變,若X通道背景情況復雜,則對于X通道的判別閾值就會擴大,X通道上鑒別前景的能力就會相應地減弱。
2.2 利用分割閃爍的判別閾值反饋機制
分割閃爍指的是算法得到的前景分割圖中,同一像素點頻繁地改變它的判別結果。
通常情況下,使用更好的特征表示和更合理的背景模型可以顯著提高運動目標檢測的效果,但是對于復雜的動態場景,再好的方法也難以避免提取前景的閃爍情況。
文獻[6]提出了一種利用分割閃爍情況反饋調節決策閾值以及背景模型更新率的方法,但是它針對的是由LBSP特征帶來的分割決策閃爍。PBAS使用的梯度幅度特征在抗噪聲方面比LBSP特征效果要差,因此更容易帶來閃爍情況。閃爍情況和最小決策距離一樣具有反映背景復雜程度的作用,但是它比后者更能反映背景的動態變化程度。將分割閃爍情況加入PBAS算法的反饋,有助于了提高算法在復雜運動背景環境下的適應能力。
定義分割閃爍因子為:

其中 Xt(xi)=Ft(xi)xor Ft-1(xi),vincr和 vdect為固定參數,Ft(xi)和Ft-1(xi)是本次與上次像素點xi的判別結果。限制v的最小值為0.1。由式8可知,若像素點xi的分割結果經常處于閃爍狀態,則其對應的v(xi)就會增長,反之,v(xi)會減少。
改變決策閾值更新方式為:

由式9可知,分割閃爍因子v(xi)越大,決策閾值增大的幅度越大,減小的幅度越小,有助于算法對復雜動態背景的快速適應。
分割閃爍點也經常發生在運動目標的邊界,將這些點考慮在閃爍因子內,容易將運動目標的邊界埋沒在背景中。因此實際處理時,先去掉經過后處理后得到的前景及其邊界鄰近區域內的閃爍點,再計算閃爍因子。
為了合理評估對PBAS算法改進帶來的性能上的改變,文中使用CDW-2014[16]提供的一組動態背景環境下拍攝的視頻集作為測試集,如圖3所示,場景涉及河面、行道樹、人工噴泉等常見的動態背景元素,運動目標包括快艇、帆船、獨木舟、汽車和行人等。

圖3 CDW-2014動態背景測試集
原PBAS算法完全依據文獻[5]實現,且所有參數與文獻中保持一致。改進版PBAS算法參數設置如下:

算法性能的定量評估使用CDW所使用的方法,指標包括:Recall,FPR,FNR,Precision,FMeasure,其中以FMeasure為主要評價指標。其計算方式為:

所有代碼均使用OpenCV實現,實驗結果如下:
通過比對實驗結果,可以發現本文算法在大多數場景下優于原PBAS算法,且在這個數據集上,總體Fmeasure得分比原PBAS算法提升了26%。文中算法在保持不錯的召回率的同時,還能有相對較高的準確率,這主要得益于多通道判別閾值的引入,使得背景模型能夠被有限的背景樣本擬合。由于測試集中存在較多的動態背景元素,原PBAS整體上有較大的誤真率,文中算法加入分割閃爍點的反饋處理,自動地削弱動態背景的影響,顯著地減少了誤真率。
如圖4所示,fall序列中存在的主要干擾是風引起的劇烈的樹葉晃動。自然風很少具有穩定的周期性,這給背景建模帶來很大的挑戰。能否快速的抑制突然產生的干擾,是考驗一個算法性能的重要標準。原PBAS算法依靠背景樣本更新和閾值逐漸擴大的方法,來應對這一干擾,然而每次閾值的擴大幅度只能是原閾值的一個相對量,所以無法快速地抑制這一類型的干擾。改進的PBAS算法每次閾值更新的幅度取決于當前分割點的閃爍情況,所以能快速的抑制干擾區域。圖4中,本文算法分割結果與原PBAS算法相比,減少了背景樹葉的干擾,效果較為明顯。

表1 動態背景視頻序列實驗結果對比

圖4 fall序列第1 512幀分割結果對比

圖5 overpass序列第2 438幀分割結果對比
圖5中展示的場景同時包括水波、樹葉這些干擾,本文算法分割結果能有效地處理去除干擾和保持運動目標分割完整性兩者的權衡。
文中針對PBAS算法在處理動態背景場景時的不足,對原始PBAS算法做出了兩點改進。改變原始PBAS單通道背景建模為具有獨立閾值的多通道背景建模,自適應調整不同通道在分割決策中起的權重,提高了背景模型對實際場景的建模能力。在判別閾值反饋中加入分割閃爍點信息,利用統計的閃爍點信息調整判別閾值,加快算法對動態背景的適應速度。通過實驗對比,改進的PBAS比原始PBAS算法在應對動態背景場景時更具有適應性,更能有效地得到較好的分割結果。
[1]Mukherjee D,JonathanWu Q M.Real-time video segmentation using student'st nixture model[J]. Procedia Computer Science,2012,10:153-160.
[2]Ding J,Li M,Huang K,et al.Modeling complex scenes for accurate moving objects segmentation[C] //Computer Vision-ACCV 2010.Springer Berlin Heidelberg,2010:82-94.
[3]Zhou X,Yang C,Yu W.Moving object detection by detecting contiguous outliers in the low-rank representation[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2013,35(3): 597-610.
[4]Barnich O,Van Droogenbroeck M.ViBe:a powerful random technique to estimate the background in video sequences[C]//Acoustics,Speechand Signal Processing,2009.ICASSP 2009.IEEE International Conference on.IEEE,2009:945-948.
[5]Hofmann M,Tiefenbacher P,Rigoll G.Background segmentation with feedback:The pixel-based adaptive segmenter[C]//Computer Vision and Pattern Recognition Workshops (CVPRW),2012 IEEE Computer Society Conference on.IEEE,2012:38-43.
[6]St-Charles P L,Bilodeau G A,Bergevin R.Subsense:A universal change detection method with local adaptive sensitivity [J].Image Processing, IEEE Transactions on,2015,24(1):359-373.
[7]Elgammal A.Background subtraction:Theory and practice [J].Synthesis Lectures on Computer Vision,2014,5(1):1-83.
[8]Bouwmans T.Traditional and recent approaches in background modeling for foreground detection:An overview [J].Computer Science Review 2014 11: 31-66.
[9]Juan L,Dengbiao J,Bo L,et al.A nonparametric approach to foreground detection in dynamic backgrounds[J].Communications,China,2015,12(2):32-39.
[10]Elgammal A,Harwood D,Davis L.Non-parametric model for background subtraction[M]//Computer Vision-ECCV 2000.Springer Berlin Heidelberg, 2000:751-767.
[11]Sobral A,Bouwmans T.BGS Library:a library framework for algorithm’s evaluation in foreground/background segmentation [J].handbook on" Background Modeling and Foreground Detection for Video Surveillance",Chapter 23,2014.
[12]Bilodeau G A,Jodoin J P,Saunier N.Change detection in feature space using localbinary similarity patterns[C]//Computer and Robot Vision(CRV),2013 International Conference on.IEEE, 2013:106-112.
[13]Chan K L.Detection of foreground in dynamic scene via two-step background subtraction[J].MachineVisionandApplications,2015,26(6):723-740.
[14]Matsuyama T,Ohya T,Habe H.Background subtraction for nonstationary scenes [C]//4th Asian Conference on Computer Vision,2000:622-667.
[15]Elgammal A,Duraiswami R,Davis L S.Efficient non-parametric adaptive color modeling using fast gauss transform[C]//Computer Vision and Pattern Recognition,2001.CVPR 2001.Proceedings of the 2001 IEEE ComputerSocietyConferenceon. IEEE,2001,2:563-570.
[16]Goyette N,Jodoin P M,Porikli F,et al.Changedetection.net:A new change detection benchmark dataset[C]//Computer Vision and Pattern Recognition Workshops(CVPRW),2012 IEEE Computer Society Conference on.IEEE,2012:1-8.
An improved PBAS algorithm for dynamic background
ZHANG Ze-bin1,3,YUAN Xiao-bing1,2
(1.Shanghai Institute of Microsystem and Information Technology,CAS,Shanghai 200050,China;2.Key Laboratory of National Defense for Science and Technology on Microsystem,Shanghai Institute of Microsystem And Information Technology,CAS,Shanghai 200050,China;3.Shanghai Tech University,Shanghai 200000,China)
To improve the adaptability of PBAS algorithm to various dynamic background,this paper proposed a variant which uses adaptive multi-channel background modeling and feedback of local segmentation noise levels.The proposed algorithm takes information of multi-channel into consideration and adjust each channel's decision threshold and weight adaptively.The proposed algorithm uses statistical information of segmentation noise to adjust parameters without addition of new features,which made error rate further less.Experimental results showed that the proposed algorithm has a much better adaptability when used in dynamic backgrounds and it can provide a more accurate segmentation.
motion detection;background modeling;PBAS;dynamic background
TN391.4
:A
:1674-6236(2017)03-0035-06
2016-01-23稿件編號:201601216
張澤斌(1990—),男,浙江新昌人,碩士。研究方向:無線傳感器網絡。