李艷紅
(西安外事學院 工學院, 西安 710077)
錳礦開采安全環境的構建直接關系著企業的正常運營,利用高科技手段解決傳統意義上各種瓶頸問題已經成為相關研究人員的主要方式,利用視頻監控技術,實現對動態目標檢測來解決對礦藏生產過程中人員管理、安全預警等問題。
自動視覺檢測、追蹤和計算可變數量的物體是礦藏開采過程中的關鍵安全和管理手段,構建滿足該技術條件的系統架構,需要專用切昂貴的硬件設備、復雜的安裝流程以及專業化人員的實時監督。國內外相關的研究人員開發了基于各種條件的自動檢測和跟蹤算法,以盡量減少監督的必要性。文獻[1]中采用基于背景減法技術的移動物體檢測器,該手段通常不需要訓練階段,也不需要復雜的系統參數設置;然而,文獻[2]中提出由于虛警,噪聲檢測,缺失檢測以及分裂和合并檢測等缺點使跟蹤階段變得復雜。另外,檢測和跟蹤對象之間的對應關系是未知的,為了解決這些問題,已經提出了不同的數據關聯技術。在文獻[3]中采用了使用重疊標準來簡化虛擬檢測生成的策略。在文獻[4]中,引入了一個模擬分裂和合并檢測的概率模型,該模型使用馬爾科夫鏈蒙特卡羅方法(Markov Chain Monte Carlo Method ,MCMC)來計算批處理過程中的關聯假設。以上所提出的解決策略的主要問題在于它們的計算成本很高,因此需要專用且昂貴的硬件才能實時工作。文獻[5]使用關于場景幾何的先驗信息,例如地板位置和攝像機校準來限制數據關聯和跟蹤問題,然而,該方法使系統安裝和設置變得更加復雜。
本文提出了一種自動視覺對象檢測和跟蹤框架,以可靠地將視頻監視和基于計數的應用引入到實際的企業管理中。該框架基于現成的設備,如IP網絡、網絡攝像機和PC,不需要特殊的安裝和配置要求;檢測階段基于參數背景減法技術,該技術檢測輸入視頻流中的移動區域;后處理階段通過估計和擬合代表移動物體到上一組移動區域的一組橢圓來改進檢測。跟蹤階段使用貝葉斯模型來模擬對象軌跡,為了得到改目的,使用粒子濾波技術來預測表示最可能的對象位置的一組假設。使用似然函數來驗證這些假設,從而完成對目標真實值得評估,因此,可以大大節省計算成本。此外,似然函數的設計也是為了解決嘈雜、錯誤和遺漏的檢測問題,為該算法的框圖如圖1所示。

圖1 算法執行框圖
移動物體的檢測是基于混合的高斯背景減法技術,該技術執行場景背景的在線學習;學習的背景被用于通過檢測與背景模型不兼容的圖像區域來估計移動對象。背景使用高斯混合來逐個像素建模,這種移動物體探測方法具有檢測和去除陰影的能力[6-8]。
移動目標探測技術的輸出是一組獨立的圖像區域,理想情況下與移動物體具有一一對應關系。然而,采用同樣任何其他背景減法技術,所得到的移動物體檢測可以包含兩個或更多區域,而實際的目標檢測僅對應于一個物體,該類方式被稱為是分裂檢測;此外,可包含與兩個或更多對象相對應的區域,稱為合并檢測。對于分裂和合并檢測,是的軌跡估計和對象計數在實際應用中具有較大的技術挑戰,井上目標視頻監控圖像分析結果圖如圖2所示。
本文所提的方法通過將一組橢圓擬合到背景減法算法的輸出來解決之前的分裂和合并檢測的問題,定義使得每個橢圓表示獨立的對象。一個橢圓可以包含前景檢測的一個或多個獨立移動區域,用于診斷分割檢測;另一方面,前景的移動區域可以與兩個或更多個橢圓相關聯,用于解決合并檢測和對象遮擋等問題。
將橢圓擬合到前景檢測的過程通過結合期望最大化算法來估計橢圓及其參數的數量。通過該算法可實現兩個目標:第一個是將每個對象的橢圓數量限制為1,因為原始算法使用連接橢圓的分層集合來表示對象輪廓;第二個是根據可能的物體尺寸和方向的預定范圍來幫助估計限制它們的值的橢圓參數。此外,前兩次適應降低了擬合過程的復雜性,使算法更適合實現實時限制。采用該方式進行的先前運動區域檢測的橢圓擬合過程圖如圖3所示。


圖2 區域檢測圖

圖3 區域檢測的橢圓擬合過程圖
采用向量狀態符號表示有關移動對象的跟蹤信息,如式(1)。
xt=[xt,n|n=1,…,N0]
(1)
其中N0表示在時間t內移動對象的數量,xt,n表示第n個移動對象的目標信息,其定義如式(2)。
xt,n=[r,v,e]t,n
(2)
其中r,v,e分別包含對象的位置,速度和橢圓邊界。對象的位置和速度通過相對于圖像平面進行表示。如物體占據的圖像區域近似為橢圓,其橢圓集合中心為rt,n,其余參數(長軸、短軸及方向)存儲在et,n中。
使用貝葉斯方法定義狀態向量xt,該方法通過后驗概率密度函數(Probability Density Function,PDF)計算狀態向量,定義如式(3)。
z1,t=[z1,zt]
(3)
在每個時間步中,zt代表移動物體檢測階段獲得的一組物體測量值。后驗PDF可以使用貝葉斯定理遞歸表示。如式(4)。
(4)
其中p(xt|z1:t-1)是先驗概率,p(zt|xt)為概率,p(zt|z1:t-1)只是一個歸一化因子。先驗概率根據動態模型將運動物體進行時空演化,它可以被認為是對移動物體當前狀態的預測,用式(5)。
(5)
其中p(xt-1|z1:t-1)是前一時間戳的后驗概率,p(xt|xt-1)是將物體動力學模擬為具有高斯不確定性的恒定速度模型的轉移概率,其定義如式(6)所示。
p(xt|xt-1)=N(xt;Axt-1,∑x)
(6)
其中N(x;μ,σ)為多元高斯函數,A是對恒速模型進行編碼的矩陣,∑x是表示物體動力學不確定性的協方差矩陣。
似然項使用當前時間步zt處的測量來估計最可能的對象配置。目標可能性的計算需要估計對象與測量之間的關聯,以正確更新每個對象的跟蹤信息。為了有效地完成這項任務,基于計算物體和測量之間的最佳區域重疊,本文提出了一種新穎的數據關聯:即對象相對應的橢圓集合與對應于測量的橢圓集合之間的重疊越大,潛在狀態向量的可能性即越高,其中重疊區域由測量和檢測的所有橢圓區域的并集表示,如式(7)。

(7)
其中Nd是測量對象的數量,Im是通過與該測量關聯的橢圓內的1到第m個像素轉換成的二進制數,并且In是通過將與第n個對象相關聯的橢圓內的那些像素設置為1而形成的二進制。
使用這種重疊測量,通過高斯函數表示目標識別可能性,該高斯函數比較重疊和所有測量的總面積之間的面積如式(8)。
(8)
其中Cd是用于計算組成圖像區域的像素數量的基數函數,∑z是協方差矩陣,用來表示與區域重疊過程有關的不確定性。
由于場景中物體的輸入和輸出,狀態矢量xt的大小可能隨時間而變化。新物體的入口與不與任何現有的被跟蹤物體重疊的測量相關聯,這種模糊性由二項式分布建模,該分布估計在給定不與任何對象重疊的一組測量值的情況下,在N個新對象已進入場景中的概率。二項式分布的參數根據預期的假警報的數量來設置,通常是取決于場景特征和對象檢測器的系統參數。
離開場景的對象的估計與任何現有測量重疊的對象的數量有關。然而該情況下,檢測系統可能只是無法檢測到這些物體,通過Gamma分布用于模擬這種模糊性。
本文使用數據集PETS2006和PETS2010的序列對移動物體的視覺檢測進行了測試。這兩個數據集的序列通過多個相機采用不同的角度進行獲取,其中PETS2006的序列為井下探測情況,而PETS2010的序列為井上情況。
在實驗的第一階段通過井下人數的識別評估了所提出框架的性能;第二階段對所提出的框架和文獻[9]中所提出的方法獲得的跟蹤結果進行了比較,與文獻[9]中所提出的方法的相關點是:移動物體的檢測單元不包括用于去除陰影的階段,也不包括用于將橢圓(表示真實物體)擬合到獲得的移動區域的后處理階段;跟蹤是基于確定性方法達到更接近模式,不能管理對應于不同模式的不同假設。
如圖4所示。

圖4 計數誤差隨時間的分布圖
為PETS2006數據集序列“S1-T1-C”(攝像機編號3)的前1000幀的計數誤差隨時間的分布圖,順序上錯誤的數量仍然很低。
如表1所示。

表1 對象計數性能表
為使用數據集PETS2006的幾個序列提供了全局對象計數結果,結果表示為整個序列中計數錯誤的百分比。 正如可以觀察到的那樣,盡管使用的物體檢測器與文獻中可用的其他物體相比較簡單,但所提出的算法具有很高的準確性。
如表2所示。
為采用文獻[9]中所提出的檢測方法進行檢測的結果記錄表,兩種檢測方法均運行在四核2.53 GHz CPU計算機上,結果表明本文所提出的算法相比文獻[9]中的算法在移動對象識別率上有較大的優勢。

表2 對象計數性能表
本文提出了一種基于礦藏開發過程中使用的監視和計數應用的視覺檢測和追蹤框架,通過應用現有的硬件設備,采用較為簡單的安裝配置手段,以及無監督的運行環境。通過該手段將處理分裂和合并檢測的移動檢測算法和可以處理多模式分布(錯誤檢測和缺失檢測)的新貝葉斯跟蹤模型相結合,通過實驗證明該方法與文獻[9]中所提出的一種典型的移動目標識別手段由較高的性能優勢。