史東承, 李雪燕, 石小丁
(1.長春工業大學 計算機科學與工程學院, 吉林 長春 130012;2.吉林省長春市高新技術產業開發區管理委員會, 吉林 長春 130012)
?
ViBe背景減除步態檢測
史東承1,李雪燕1,石小丁2
(1.長春工業大學 計算機科學與工程學院, 吉林 長春130012;2.吉林省長春市高新技術產業開發區管理委員會, 吉林 長春130012)
摘要:在步態檢測過程中,ViBe算法利用單幀進行像素建模以及背景突然變化的處理。與混合高斯模型進行了對比分析,結果表明,該ViBe算法在建模、識別率等方面具有優勢。
關鍵詞:步態檢測; 背景消除; 背景建模;ViBe; 混合高斯模型
0引言
步態檢測是從視頻序列中提取出人體輪廓,是步態識別過程的第一步,也是至關重要的一步,步態特征的提取及識別與步態檢測息息相關。從國內外的文獻來看,步態檢測的算法包括光流法、背景減除法以及幀間差分法。
背景減除法是目前檢測中最常用的方法,它利用含有運動目標的當前圖像減除背景圖像得到運動區域的輪廓。背景減除法最重要的是建立合適的背景模型,中值濾波法、均值濾波法以及混合高斯模型是背景減除法常用的建模方法[1-2],前兩者適合背景不變或者緩慢變化的場景,自動更新效果不好,后者通過多個高斯分布混合模型對像素進行建模,在背景發生變化時能夠取得良好的結果,但其依賴于概率密度函數或統計學,這就要求我們對數學知識有非常好的掌握。文中提出一種不依賴概率密度函數基于像素建模的算法,即ViBe算法[3]。該算法簡單,可以有效地完成人體輪廓的提取,并且提取的結果比較理想。
1ViBe算法描述
在實時應用中,要想取得理想的結果,背景減除方法要處理好3個問題:
1)背景建模;
2)模型初始化;
3)模型隨時更新。
大多數論文描述了背景建模和更新機制,只有少數討論了初始化,而當期望獲得快速響應時,初始化是至關重要的。另外,省略模型初始化過程會使得模型和更新機制之間缺少連貫性。
1.1像素模型和分類過程
ViBe算法是基于像素的模型,該方法為每個像素點存儲了一個樣本集,像素點過去的像素值和其鄰居點的像素值就是樣本集中采樣值,然后通過比較每一個新的像素值和樣本集相似的程度來判斷是否屬于背景點。
ViBe背景建模如圖1所示。

圖1 ViBe背景建模
為每個像素點建立一個背景模型,此背景模型包含N個樣本
(1)
式中:p(x)----x處的像素值;
M(x)----x處的背景建模值;
N----樣本集大小。
然后比較像素p(x)與背景模型M(x)的相似度,如果不相似,分類為前景,否則為背景。數學上相似度可表示為:
(2)
式中:SR(p(x))----x處以R為半徑;
p(x)----中心的球體;
U----球體與背景模型的交集。
當給定的閾值Umin大于U時,待分類像素p(x)與背景模型不相似;否則為相似。
1.2單幀初始化背景模型
文獻[4-6]中很多主流的方法都需要多幀初始化模型,但是人們更希望從比傳統背景減除算法初始化序列需要的更短序列中獲得前景。針對這種情況,文中提出了一種新的方法,背景模型可以僅從單幀中獲得。在應對突發光照變化時這種方法很簡單,丟棄現有的背景模型,并且瞬時初始化一個新的模型。
由于單幀中無法體現時間信息,假設鄰居點像素有相似的時空分布,用每個鄰居點的值填充像素模型。準確來說,我們是用第一幀中隨機選取的鄰居點的值進行填充。需要鄰域的大小可以選擇,以使得它大到足以包括不同樣本的足夠數量,同時牢記在不同的位置值之間的統計相關性隨鄰域的尺寸變大而減小。
形式上,我們假設t=0時為第一幀,NG(x)為像素x的鄰居點。因此
(3)
式中:y----隨機選擇的鄰居點。
這種策略很好,但是也存在一些問題,就是會出現“鬼影”[7],即運動物體在第一幀時是以運動形式存在的,而在后續檢測中卻不運動了。這是由于在背景抽樣過程中,把運動目標作為抽樣得到的初始化結果,這種錯誤的初始化結果出現了“鬼影”。為了消除“鬼影”,提出了以下更新方案。
1.3背景模型更新策略型
背景模型能夠適應比如光照的變化,背景物體的變更等背景的變化,這就是背景模型的更新。
嚴格意義上來說,時間信息對于比較模糊的背景是沒有作用的。但是背景減除是一個時空過程,為了優化這個方法,我們可以假設該相鄰點像素的時間分布與該像素點是相似的。根據這個假設,為了能夠把隱藏在前景當中的背景像素更新到背景模型中,最好的方法就是在采用保守更新策略的基礎上同時擴展空間信息。文中提供了一種利用空間信息的簡單而有效的方法,這使得我們能夠克服大多數純保守更新方案的缺點。
更新策略包含3個重要部分:
1)無記憶更新策略,背景像素模型中樣本的平滑生命周期得以保證;
2)隨機時間二次采樣,擴展時間窗口的背景像素模型;
3)空間上傳播背景像素樣本機制,空間連續性得以保證。
為使“百條禁令”落地生根,宿州公司不斷創新管理的方法和手段,強約束、硬考核,聚力“兩個融合”,深化“三個結合”,努力塑造安全型員工,打造安全型企業,形成安全管理新常態。新措施帶來新成效,“百條禁令”頒布實施以來,該公司共下發通報20期,考核約8萬余元,有效遏制了現場違章,2013年-2015年,該公司呈現了不安全事件逐年下降的良好態勢,為該公司順利完成五星級三連冠、全國安全文化示范企業等年度安全目標任務提供了堅實的保障
2更新策略
2.1無記憶更新策略
采用先進先出的策略更新模型是很多基于樣本方法經常使用的方法[8-9]。為了合理處理背景場景各種事件,文獻[5]提出了包含大量樣本的像素模型,但是這對于高幀率視頻來說是不適用的。文中提出了一種指數單調衰減剩余樣本周期的方法,這種方法為了提高估計的時間相關性,允許像素模型中仍然保留一些較早的樣本。最終使得模型中不會包含前景值,是這種方法和保守更新策略相結合的結果。
這種方法簡單而有效:在均勻概率密度函數前提下,不是死板的把最早的樣本從樣本中移除,而是隨機地選擇舍棄的樣本,然后移除的樣本被新值代替。這種隨機策略不能算是真正意義上的保守更新策略,因為它與原來的思想相矛盾。原來的思想是最先替換的應該是越早出現的像素樣本,并且更新過程的穩定性對于保守更新策略來說是至關重要的。實際上,一種不確定性的背景減除算法在保守更新策略中出現,模型不會隨著時間產生偏離在保守更新策略中得以保證。盡管這樣,不同時間的同一序列在此背景減除算法下的處理結果也可能產生細微的差別。
從數學上來說,假設時間是連續的,一個樣本值在時刻t不被更新的概率是(N-1)/N,那么樣本值在dt時間之后仍然保留的概率是
(4)
也可寫作
(5)
這個表達式表明模型中的這個樣本值被替換與否和時間t無關。這種性能被稱作無記憶性能,對指數密度是可用的,在背景減除領域有顯著、獨特的性能。它完全可以讓我們定義一個時間段的歷史像素樣本,從某種程度上來說,允許更新機制適應任意的幀速。
2.2時間二次采樣
采取隨機時間二次采樣可以進一步擴展時間窗口大小,這個時間窗口是由固定大小像素模型覆蓋的。其思想是在很多實際情況中,每一新幀的每個背景像素模型沒有必要全部更新,通過讓背景更新不頻繁,背景樣本的預期壽命可以人為的延長。但是固定的二次采樣間隔在周期或偽周期背景運動存在時,可能會阻止背景模型正確的適應這些運動。當該點像素值已經屬于背景時,隨機過程決定這個值是否隨像素模型相應地更新,所以采用隨機的二次采樣策略成為當務之急。實際上,當該像素值已經屬于背景時,隨機過程決定這個值是否用于更新相應的像素模型。
2.3背景樣本傳播空間一致性
由于使用了保守更新方案,當務之急就是解決如何把前景當中隱藏的背景像素模型進行更新。W4的算法[10]是現在流行的方法,該方法通過計算該像素連續被檢測為前景的次數來確定是否更新為背景點。即要想將一個像素點更新為背景,就要使得該像素點連續N次檢測為前景。背景像素模型中永遠不會存在前景的像素值,這是保守更新策略的優勢,為了方便,在前景像素融入背景模型過程中,這些方法起到了一定的延緩作用。此外,由于這些方法取決于二元判決,從一個夾雜真實前景物體的背景模型中恢復出來需要時間,因此,提出了不同的方法。
鄰域像素模型可以把一個新的背景樣本更新進來,因為鄰居點背景像素擁有相同的時空分布。根據這個策略,在背景樣本更新時,被前景遮擋的背景模型也會隨著更新,依賴抽樣的背景模型中出現空間信息的擴散是可以的。背景模型因此能夠適應不斷變化的照明和背景變化(添加或移除背景物體),同時依靠嚴格保守的更新方案。更精確來說,考慮像素x的4或8鄰域的空間鄰域,即NG(x),并且假設它已經決定更新樣本集M(x)。然后根據統一的規則,隨機選擇v(x)值從鄰居點一個像素更新樣本集M(y∈NG(x))。
3步態描述及實驗
3.1步態描述
流程圖如圖2所示。

圖2 流程圖
3.2試驗及分析
實驗中,選取室外的場景拍攝了一段步態視頻,并用OpenCV進行了仿真,參數設置如下:選取半徑R=20,每個像素的樣本模型個數N=20,隨機時間二次采樣因數φ=16,這樣每一個背景像素值被選擇更新,其像素模型的幾率為1/16。從圖2可知,當Umin=2或Umin=3時,PCC達到最高。但是實驗中發現,由于Umin很小的一個增大就會增加計算的復雜程度,最后確定在穩定背景場景下設置Umin=1,即可取得良好的實驗結果。實驗中,在每個像素的8鄰域連接處隨機選擇樣本的方法可以取得令人滿意的640*480分辨率的圖像。
文中采用正確分類比例(PCC)對實驗進行性能分析,公式如下:
(6)
式中:TP----正確分類為前景像素的個數;
TN----正確分類為背景的像素個數;
FP----被錯誤分類為前景像素的背景像素個數;
FN----錯誤分類為背景像素的前景像素個數。
Umin在1~20范圍時的PCC值如圖3所示。

圖3 Umin在1~20范圍時的PCC值
同時,文中把ViBe背景減除算法與混合高斯過程進行對比,步態檢測結果顯示ViBe算法比混合高斯取得的效果好很多。對比效果如圖4所示。
這兩種算法正確率情況比較見表1。

表1 正確率比較 %

4結語
針對傳統建模算法存在的問題,提出一種基于ViBe算法的步態檢測。該算法實現簡單,檢測速度快,和混合高斯模型相比有一定的優勢。但是此算法檢測過程中會出現“鬼影”,雖然“鬼影”會隨之慢慢的消失,但是“鬼影”在一定時間內對步態檢測還是有影響的。因此,要想獲得更好的步態檢測結果,如何有效的去除“鬼影”是接下來需要解決的至關重要的問題。
參考文獻:
[1]DRMagee.Trackingmultiplevehicleusingforeground,backgroundandmotionmodel[J].ImageandVisionComputing,2004,22(2):143-155.
[2]王亮,胡衛明,譚鐵牛.基于步態的身份識別[J].計算機學報,2003,26(3):353-360.
[3]OBarnich,MVanDroogenbroeck.ViBe:Apowerfulrandomtechniquetoestimatethebackgroundinvideosequences[C]//Proc.Int.Conf.Acoust.,SpeechSignalProcess.,2009:945-948.
[4]KKim,TChalidabhongse,DHarwood,etal.Real-timeforeground-backgroundsegmentationusingcodebookmodel[J].RealTimeImaging,2005:172-185.
[5]HWang,DSuter.Aconsensus-basedmethodfortracking:Modellingbackgroundscenarioandforegroundappearance[J].PatternRecognition,2007:1091-1105.
[6]AElgammal,DHarwood,LDavis.Non-parametricmodelforbackgroundsubtraction[C]//Proceedingsofthe6thEuropeanConferenceonComputerVision-PartII,2000:751-767.
[7]RCucchiara,MPiccardi,APrati.Detectingmovingobjects,ghosts,andshadowsinvideostreams[J].IEEETransactiononPatternAnalysisandMachineIntelligence,2003:1337-1342.
[8]CCChiu,MYKu,LWLiang.Arobustobjectsegmentationsystemusingaprobability-basedbackgroundextractionalgorithm[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010:518-528.
[9]BWhite,MShah.Automaticallytuningbackgroundsubtractionparametersusingparticleswarmoptimization[C]//IEEEInternationalConferenceonMultimediaandExpo,Beijing:[s.n.],2007:1826-1829.
[10]HaritaogluDHarwood,LDavis.W4:Real-timesurveillanceofpeopleandtheiractivities[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2000,22(8):809-830.
GaitdetectionbasedonViBebackgroundsubtraction
SHIDongcheng1,LIXueyan1,SHIXiaoding2
(1.SchoolofComputerScienceandEngineering,ChangchunUniversityofTechnology,Changchun130012,China;2.TheCommitteeofManagement,ChangchunNationalHi-TechIndustrialDevelopmentZone,Changchun130012,China)
Abstract:Duringtheprocessofgaittesting,ViBealgorithmisusedtoestablishthesingle-framepixelmodel,anddealthesuddenchangesinbackground.ItiscomparedwiththeGaussianmixturemodelandtheresultsshowthattheVibealgorithmissuperiorinmodelingandrecognitionrate.
Keywords:gaitdetection;backgroundsubtraction;backgroundmodeling;ViBe(VisualBackgroundExtractor);Gaussianmixturemodel.
收稿日期:2015-11-10
基金項目:吉林省教育廳基金資助項目(吉教科合字[2016]第 349號)
作者簡介:史東承(1960-),男,漢族,吉林長春人,長春工業大學教授,碩士,主要從事圖像處理方向研究,E-mail:dcshi@ccut.edu.cn.
DOI:10.15923/j.cnki.cn22-1382/t.2016.3.07
中圖分類號:TP391
文獻標志碼:A
文章編號:1674-1374(2016)03-0241-05