李文


摘要:運動目標檢測是指在圖像序列中檢測出變化區(qū)域并將運動目標從背景圖像中提取出來。通常情況下,目標分類、跟蹤和行為理解等后處理過程僅僅考慮圖像中對應于運動目標的像素區(qū)域,因此運動目標的正確檢測與分割對于后期處理非常重要,本文主要介紹幾種經(jīng)常使用的目標檢測算法的原理。
關鍵詞:目標檢測 光流法背景減除法十貞差法
引言
運動目標檢測技術是計算機視覺領域研究的熱點和難點,算法多種多樣。其主要原理是實現(xiàn)圖像的分割,將目標和背景的分離,將視頻監(jiān)控圖像幀中運動變化部分分離出來,然后實現(xiàn)對運動目標的跟蹤、分類、識別。目標檢測算法主要有光流法、背景減除法、幀差法等,每種方法均有利有弊,下面對目標檢測算法做一個簡單介紹。
1目標檢測方法介紹
1.1光流法
光流法的主要任務就是計算光流場,即在適當?shù)钠交约s束條件下,根據(jù)圖像序列的時空梯度估算運動場,通過分析運動場的變化對運動目標和場景進行檢測與分割,包括全局光流場和特征點光流場兩種方法。最經(jīng)典的全局光流場法主要有L-K (Lueas&Kanada)法和H-S (Hom&Schunck)法。全局光流場法是通過比較運動目標與背景之間的運動差異對運動目標進行光流分割,但是計算量很大。特征點光流法通過特征匹配計算特征點位置的流速,完成背景和人體的分離,計算量小、快速靈活,但稀疏的光流場很難精確的提取運動目標的形狀。光流法對場景的信息不需要提前知道,主要是通過計算場景內(nèi)的光流場來檢測目標。但是,光流場對環(huán)境非常敏感,場景內(nèi)的噪聲多光源人體陰影和遮擋都會嚴重的影響光流場的分布計算,降低計算精度。
人體的運動在空間和時間上具有連續(xù)性,在較短的時間間隔里,人體在圖像中的灰度值幾乎不會發(fā)生變化,根據(jù)這個原理,檢測人體區(qū)域的光流方程式如下:
灰度在較短時間間隔內(nèi)保持不變,可得:
I(x,y,t)=I(x+dt,y+dt,t+dt)式(2)
將公式(2)的右邊用泰勒展開,將二階以上無窮小項去除,則可以獲得基本光流方程如下:
其中,I(x,y,t)為圖像中點k在(x,y)處t時刻的灰度,該點的光 流為p=(u,v),u(x,y)和v(x,y)分別為點k的水平光流分量和垂直光流分量。
光流法對實驗的環(huán)境和硬件要求都很高,并且計算量很大,實時性差,所以在圖像檢測中使用比較少。
1.2背景減除法
背景減除法是一種利用待測圖像和已存儲的無目標存在的背景圖像進行簡單的計算機減法運算,這種方法在目標提取技術里是一種比較簡單和廣泛的方法。但是對使用的場景有一定的要求,首先,兩幅圖像針對的場景需要固定不變,即攝像頭保持不動,將兩幅圖像做差后存在差異的地方就被認定是目標區(qū)域。這種方法的優(yōu)點是處理速度快,運算簡單易懂,但是缺點是適用場合有限,檢測的誤差大,因為現(xiàn)實使用中,經(jīng)常會受到外界因素像燈光、外部擾動等的影響,同時對原始背景的選取也存在難度。背景減除法的原理如圖1所示。
背景減除法的原理比較簡單,攝像頭采集圖像后,首先要存儲一個原始的背景圖像,該背景中不存在待測的目標,然后將背景圖像與當前待檢測圖像幀進行做差得到差分圖像,再對差分圖像進行二值化、連通性處理最終就可以獲得待測目標這是基本的背景減除法的原理,也是其它背景建模、更新算法的基礎。數(shù)學公式表示如下:
在公式(4)中,4(x,y)是差分結果,g,(x,y)是待檢測圖像幀,9ag(ty)是原始的背景圖像。做差得到差分圖像4(x,y)后,設定閾值M,使用公式(5)對其進行二值化處理,可得到目標區(qū)域。將差分圖像4(x,y)中大于閥值M的部分設置為255,在圖像上用白色表示,白色區(qū)域就認定為是人體部分。小于M的部分定義為O,在圖像上用黑色表示這部分認定是背景部分。背景減除法的原理就是兩幅圖像做減法,設定一個合理的閾值,二值化處理后就可以得到目標圖像。所以閾值的選取十分重要,閾值設定太小,會將背景點誤判人人體;閾值太大,會使部分人體點誤判為背景。閾值設置的準確與否直接決定目標的檢測精度,同時,要固定背景,使背景不會隨著時間的推移而變化,這樣可以減少檢測誤差。
背景減除法在目標檢測中常被作為基礎檢測方法,經(jīng)常和其他方法結合使用。許多研究都在它的基礎上進行改進,不斷優(yōu)化和更新背景模型,讓計算機根據(jù)實際情況自適應建立背景模型。
1.3幀差法
幀差法是目標檢測常用的一種方法基本原理和背景減除法相似,它是通過攝像頭采集連續(xù)的圖像幀.將當前圖像幀與相鄰若干幀的圖像逐一做差,對做差后的圖像進行二值化處理,從而檢測出運動目標的區(qū)域。其原理如圖2所示。
首先,攝像頭采集連續(xù)的圖像幀,用當前圖像幀與相鄰n幀的圖像進行作差運算,對差分圖像做二值化處理,該需要自定義閾值。如果差分圖像的像素值小于閾值就認為沒有目標出現(xiàn)把圖像作為背景。如果做差后的對應的像素值有了顯著變化,就認為圖像序列中有人體目標的出現(xiàn),可以確定為目標幀,進而使用圖像做差分離出人體目標,二值化處理后得到檢測結果。
在視頻圖像序列中,相鄰幀圖像之間內(nèi)容變化不會太大,具有較好的相關性,利用相鄰圖像幀做背景更新模型更具有實時性,從算法復雜度、更新速度來說,都是一種比較有效的方法。但是,該算法仍然有缺陷,就是對環(huán)境噪聲很敏感,在更新背景幀時,閾值的選擇也很重要,閾值太小不能去掉圖像中的噪聲,太大會丟失人體目標,無法提取完整的人體目標。
定義第t幀和第t-n幀圖像的幀差為,即:
上式中的n是兩幅圖像之間間隔的圖像幀,可以自己設定也可以根據(jù)經(jīng)驗來設置。M是二值化處理設定的閾值,兩幀圖像差分后的結果如果大于閾值M,則把該點處的像素點置為255,圖像顯示白色,為檢測的目標區(qū)域。當n=l,即表示是前后連續(xù)的兩幀圖像,n=2,表示間隔一幀圖像的兩幅圖像,當n增大時,則兩幅圖像的間隔比較大,這樣的處理方法可以放大邊緣的部分,減小誤差,提取到更好的運動目標。不過也有不當之處,就是邊緣會變大,精度會降低。在兩幅圖像相對應的像素點上,對兩個像素點做差處理,場景中相同的地方,Dt(x,y)=0,存在差異的地方Dt(x,y)≠0。當視頻中的運動目標運動緩慢時,即視頻場景相對穩(wěn)定,兩個圖像之間的差異會比較小,這樣的情況下經(jīng)常把人體目標誤判為背景。
幀差法相對于背景減除法,不需要預先設立背景,它是一種在檢測過程中自適應建立背景模型,根據(jù)圖像幀之間的不同來確定背景。實時性比較好,也易實現(xiàn)。幀差法對圖像的識別效果非常差,識別結果由兩幀圖像里運動目標的重合度決定,重合的地方越多,則背景區(qū)域越大,重合地方越小,檢測的目標越準確。所以幀差法識別人體姿態(tài)在實際應用中有很大限制。
2總結
本文對運動目標檢測的幾種方法進行分析對比, 考慮現(xiàn)實生活中場景的動態(tài)變化,如天氣、光照、陰影及雜亂背景干擾等的影響,每一種目標檢測算法在實際應用中還有不足之處,還需要結合具體場景進行改進。
參考文獻
[1]張國云,郭龍源.計算機視覺與圖像識別[M].北京:科學出版社,2012.
[2]景麗.圖像處理與計算機視覺算法及應用[M],北京:清華大學出版社.2012.
[3]楊高波,計算機視覺特征提取與圖像處理[M].北京:電子工業(yè)出版社.2014.
[4]岡薩雷斯,數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2004.
[5]郝菲,智能監(jiān)控系統(tǒng)中運動目標檢測跟蹤的研究[D].北京交通大學碩士論文,2009.