(東北電子技術研究所 錦州 121000)
對于地面紅外識別技術,紅外背景是比較復雜的地物背景。在這樣的背景環境中,存在各種自然紅外輻射源及紅外背景干擾。在復雜的紅外背景圖像中識別特定目標,是目標識別技術的難點。有效的圖像識別算法,是系統提高探測概率、降低錯誤識別的有效手段。本文對紅外運動目標圖像處理、目標檢測和識別算法、運動目標跟蹤算法等,作進一步的研究和探討[1]。
紅外運動目標圖像處理涉及圖像濾波、圖像增強、目標提取、圖像分割,圖像識別、圖像跟蹤等處理技術。每種處理技術的方法千差萬別,既有時域方法,又有頻域方法,處理結果滿足實時性要求是解決問題的關鍵[2~3]。
紅外成像原理是通過感知紅外輻射能產生光信號(即紅外圖像中的灰度),目標的表面溫度與灰度成正比。目標應具有相對較強的紅外輻射,比如以人體目標為例,相對于可見光圖像,人體的紅外圖像應具有以下特征:
1)相比背景中的房屋、道路、樹木等,人體通常會輻射更多的熱量,因此,紅外圖像中的人體以及其他的“熱”物體的灰度會比背景環境的灰度更強(通常背景環境是“冷”的)。
2)紅外圖像中的灰度是與目標物體的體表溫度成正比的,所以,盡管每個人的打扮穿著都不同,但是,在紅外圖像中所顯現的樣子幾乎是一樣的。即紅外圖像自動過濾了復雜背景,簡化了圖像處理的復雜度。
3)因為每個正常人的體溫近乎相同(37℃),所以紅外圖像中凡是有人的區域灰度近似,并保持不變。
雖然紅外圖像有著上述優點,但仍然存在如下一些問題:
(1)由于紅外圖像的成像原理和不是非常清晰的成像效果,所以想要從紅外圖像中提取出個體的某些獨特的特征是很難的(比如,膚色,眼部位置,嘴巴,眉毛,等等)。
(2)紅外圖像缺少清晰的圖像結構,且圖像的對比度低,降低了拐角特征點的可信度。
針對上述兩個問題,使用Haar小波[5~8]的矩形特征來表達目標從而進行目標識別,避開了這些細節特征問題。
圖像信息處理總體框架如圖1所示。首先對圖像進行背景剔除,得到前景目標,然后根據目標在圖像中的位置、尺寸估計其在監控區域中所處方位、距離,并通過提取目標的形態特征判斷其是否為真目標,如果是真目標且滿足系統相應的判定準則,則選定目標,給出識別提示。
當前背景剔除方法主要有三種:光流法、幀間差法和背景差法。其中光流法運算量大,實時處理有困難;幀間差法有時只能檢測出目標輪廓,中間內容空洞,不利于后續處理,而且對于慢目標和靜止目標很難檢測出來;背景差法兼有實時性和有效性,因此采取背景差法進行背景剔除。而由于晝夜溫差的關系,白天和晚上的紅外圖像背景差別比較大,因此必須做自適應背景估計,否則檢測出來的目標噪聲比較多,不利于后續處理。

圖1 圖像信息處理總體框架圖
背景差分法是運動目標檢測最常用的方法之一,它的基本思想是獲取一個參考背景圖像,將當前圖像與參考背景進行比較,從中分割出前景運動目標。設B(x,y)為背景圖像。C(x,y)表示當前圖像,則:
S(x,y)表示背景差分所得圖像。我們可以從中獲得運動目標,即感興趣區域(Regions of Interest,ROIs)。
由于應用環境的不同背景也有很大差異,在處理過程中有必要知道這種應用所針對的背景的類型以采取不同的實現算法。在背景差分法中為保證運動目標檢測隨環境變化的魯棒性,常常需要適時地更新背景模型。背景的變化有兩種可能:一種是由于環境光照引起的全局較少像素值的改變;另一種是原來背景圖像中增加或減少物體引起的局部的較大改變(比如背景中移走了一個靜止物體,或者一個運動物體長時間滯留在背景中)。背景模型應能夠很快的響應背景變化,避免移走的物體和滯留物體長時間地出現在檢測結果中。在背景模型更新時需要注意兩方面問題:一方面是背景模型對背景變化的響應速度要足夠快;另一方面是背景對運動目標要有較強的抗干擾性。在背景更新模型設計時總是趨向于采用新的背景更新舊背景,而不希望用待檢測的運動目標更新背景。因此,在背景更新模型的設計中應該與目標檢測算法相結合,使用背景與目標分割的結果來決定是否進行背景更新。
背景差方法在提取運動目標時假設圖像序列的背景是相對固定不變的,應用該方法能十分有效地檢測出快速和緩慢運動、甚至是靜止的非背景的目標。但是這種方法對背景的變化比較敏感,當背景光照發生變化時,如果不能及時地更新背景圖像將產生錯誤的檢測結果,因此對于長時間的目標檢測來說,背景的光照必然是隨時間起伏變化的,必須采用自適應的背景更新方法。
簡單的自適應背景更新算法如下式所示:
其中

(i)表示前景圖像,Tb表示目標與背景的分割閾值,引入α決定背景更新速率。
也可采用單高斯分布背景模型或混合高斯分布背景模型來進行自適應背景更新。單高斯分布背景模型假設每個像素的亮度值服從高斯分布N(μ,σ2)噪聲為白噪聲。利用初始不含前景的連續N幀構造背景模型,然后采用IIR 濾波器來遞推更新參數值μ和σ2使它能夠適應緩慢的光照變化。這種背景模型具有較強的適用性。
初始化背景圖像為

單高斯分布背景模型的更新即指各圖像點高斯分布參數的更新。同樣引入更新率α(定義同上),則高斯分布參數的更新可表示為

對于更為復雜的背景還可采用混合高斯分布背景模型來進行自適應背景更新。可對每個像素的亮度值用K個高斯分布的混合來建模,各高斯分布分別具有不同的權值和優先級,它們總是按照優先級從高到低的次序排序。混合高斯模型可以描述多模態背景,具有很好的自適應性。該算法的基本思想是:使用混合高斯分布模型來表征圖像中每一個像素點的特征,當獲得新的圖像幀時,更新混合高斯分布模型,在檢測前景點時,按照權值從高到低的次序將像素值與各高斯分布逐一匹配,若沒有表示背景分布的高斯分布與像素值匹配,則判定該點為前景點,否則為背景點。而之所以能夠把前景和背景分開,是基于一個前提條件:在一個長期觀測的場景中,背景占大多數時間,更多的數據是支持背景分布的。
綜合上述討論,算法設計可結合實際應用選擇一種或多種方法來實現運動目標檢測過程中的背景剔除。下面以簡單算法為例介紹背景剔除算法的處理過程。
假設紅外成像單元第k次在監視區域拍得圖像記為,背景剔除步驟如下:
2)fork=2,3,…
(1)將(i)與(i)進行配準;
(3)對前景進行形態學濾波,利用連通域檢測算法劃分各運動區域得到目標;
(4)用下式更新背景:

其中

說明:
1)式中(i)為當前背景中像素i的值,(i)為當前圖像中像素i的值,Bk+1(i)為更新后背景中像素i的值。
3)一般情況下,利用背景差法提取前景會受到噪聲的影響,需對這些前景像素進行去噪處理,可采用數學形態學方法消除小型的、孤立的前景像素,并填補目標中小的孔洞。

圖2 模板匹配示意圖
4)配準方法使用模板匹配法,從背景中選取一個區域作為模板w(x,y),然后在當前圖像f(x,y)中尋找最相似的圖像區域,這樣就可以通過模板匹配技術來完成兩幅圖像重合區域的對齊。如圖2所示
w(x,y)和f(x,y)的相關函數可寫為

式中的求和是對w(x,y)和f(x,y)相重疊的圖像區域進行的。當(s,t)變化時,w(x,y)在圖像f(x,y)中移動并給出ρ(s,t)的所有的值。而ρ(s,t)的最大值則表明了w(x,y)在f(x,y)中的最佳位置。實際上前后兩幀圖像不會偏移不會太大,因此s,t可以取得很小,且模板w(x,y)也可以取得小一點,減少運算量。
采用Viola方法進行目標識別,這是一種基于模式分類的方法,利用統計學習的方法從樣本中自動學習目標模型的知識,把目標識別看作是一個模式分類的問題。該方法總體框架如圖3所示[4~5]。

圖3 Viola方法框架圖
該方法使用Haar小波的矩形特征來表達目標,提取目標的外形信息和運動信息,形成豐富的特征集,然后使用Ada-Boost算法從這些特征集中選擇很好分類的關鍵特征組合成強的分類器,并使用級聯的思想減少檢測的運行時間。
AdaBoost級聯分類器的構成如4所示,因為在圖像和視頻中出現目標的區域相對背景很少,因此大部分被檢測出來的子窗口前面幾級的分類器就被否定,不必通過整個分類器,節省了時間。
圖4中的各分類器都是強分類器,這是相對弱分類器來說的,一個強分類器由若干個弱分類器組成,而弱分類器是通過從特征集中選擇一個特征訓練得到的。每一個強分類器都是由AdaBoost算法訓練得到。

圖4 AdaBoost級聯分類器結構
AdaBoost級聯分類器訓練過程如下:
1)由系統要求最小檢測率和最大誤檢率推斷級聯分類器需由多少個強分類器組成;
2)確定訓練中的正負樣本數量,假設正樣本p個,負樣本q個;
3)fort=1:n
(1)訓練一個強訓練器Ht(x);
(2)組合前t個強分類器H1(x),…,Ht(x),對人體樣本集進行驗證,淘汰被錯誤判斷的目標樣本(漏判),并修改目標樣本p的值;
(3)組合前t個強分類器H1(x),…,Ht(x),對非真目標樣本集進行驗證,淘汰被正確判斷的非真目標樣本,并重新獲取非目標樣本,以補充非目標真樣本集。使其數量重新達到q個。在重新獲取非真目標樣本過程中,也是組合前t個強分類器對候選非真目標樣本進行驗證,只有被誤判的候選非真目標樣本才能被加入到非真目標樣本中。
4)保存訓練結果。
上述用于訓練的正負樣本可以從圖像或視頻中得到,通常需要上萬個樣本用于訓練。對于可見光圖像來說,各種角度的目標樣本比較好找一些,甚至于都能找到一些訓練好了的分類器。對于紅外圖像來說,樣本相對比較難找,需要自己拍攝得到,當系統對這些圖像特征進行了訓練之后,能對符合要求的目標進行識別。
目標跟蹤是指對拍攝的圖像序列進行分析,確定每幀圖像中目標位置[6~7]。
目標跟蹤是目標檢測和識別過程的延續,在相機連續拍攝的圖像序列中,每一幀都進行目標的檢測、識別和目標位置確定,即可實現對目標的連續跟蹤[4],跟蹤的處理流程如圖5所示。

圖5 目標連續跟蹤流程圖
在視場中如果只有一個運動目標,那么采取上述目標檢測、目標識別和目標定位過程可以實現對運動目標的連續跟蹤。實際情況中可能有多個運動目標,如同時多目標進入視場,另外運動的目標還可能被樹木、建筑物等短暫的遮擋,在這樣的條件下要連續跟蹤某個鎖定的目標,需要解決目標穩定跟蹤和快速處理的難題。
為解決穩定跟蹤問題,在所有真目標識別出來后,需要進行目標配對處理,即將當前幀檢測的目標與前一幀已跟蹤目標進行配對,確定當前幀內每個目標來自于上一幀哪個目標。目標的配對過程可以采用聯合概率目標識別方法,建立目標鏈,利用多目標、多幀圖像信息,提高配對準確率。
在準確實現目標配對后,即可更新鎖定目標在當前幀的位置,并進行下一幀目標位置預測。目標位置預測目的是當跟蹤目標被短暫遮擋期間,實現對目標的持續跟蹤,另外采用軌跡預測,在預測位置附近檢測目標,也可以減少下一幀所需要處理圖像區域的大小,提高處理速度。
運動軌跡的預測可采用平方預測器,假設目標運動軌跡點坐標表示為函數f(k),取連續三幀,則平方預測公式為

上式中(k+1)即為目標軌跡預測點。
也可采用基于卡爾曼濾波的區域匹配跟蹤算法來確定運動目標的運動軌跡。該算法的關鍵為:檢測所得的前景目標區域和跟蹤的動態運動目標區域之間建立對應關系。基其主要設計思想為:首先,從輸入圖像中檢測分割運動目標區域,并提取區域特征值,然后建立目標鏈表;其次,利用卡爾曼濾波對目標鏈表中的需要跟蹤區域的運動趨勢進行位置預測,以縮小目標區域搜索匹配的范圍,從而加速目標區域匹配的速度;然后,在預測位置范圍內對被跟蹤的目標區域進行匹配搜索,以建立目標的關聯關系,并且用最佳匹配的運動區域信息更新目標鏈表中相應的目標區域信息,同時對卡爾曼運動區域預測模型進行更新。
基于卡爾曼濾波區域跟蹤可分為五個模塊:
1)目標特征提取:從輸入圖像中檢測運動目標區域,通過一個矩形框對運動區域進行標定,并提取每個運動區域的中心位置和區域大小信息。
2)建立目標庫:建立了一個目標庫,用于存放被跟蹤目標區域特征參數。
3)卡爾曼運動區域預測模型:基于卡爾曼濾波的系統模型,定義狀態向量,預測下一幀 運動目標區域可能出現的位置。
4)目標區域匹配搜索:在預測位置范圍內進行目標區域匹配搜索。
5)模型更新:更新卡爾曼運動區域預測模型。采用上述跟蹤處理流程和處理方法,可以實現對紅外運動目標的快速有效穩定跟蹤。
對系統的識別概率影響的其它因素比較多,比如由于自然景觀的紅外背景輻射及系統內部電子噪聲影響,紅外圖像具有高亮度、低對比度特點,即圖像呈現灰白、模糊不清;另外,由于探測器經常不可避免地存在壞元,且各像元的輸出存在較大的非均勻性,導致紅外圖像質量進一步下降。在進行紅外圖像處理之前,首先需要進行探測器壞元自動替換和像元單點/兩點非均勻性校正來提高圖像質量。其次,為提高圖像信噪比,采用圖像濾波技術,濾除隨機噪聲,同時也可保留圖像細節。一個優秀的紅外識別系統,是系統硬件和軟件算法優化組合的產物,優化的軟件算法可以最大程度地發揮系統硬件的能力[10]。
[1]李俊山,楊威,張雄美.紅外圖像處理、分析與融合[M].北京:科學出版社,2009.
[2]劉文哲.光學相關紅外目標識別算法研究[J].儀器儀表學報,2011,32(4):850-855.
[3]劉洋.基于紅外熱成像多人體識別的智能監控系統[J].PLC&FA,2011(5):73-75.
[4]郭永彩,胡瑞光,高潮.基于圖像運動區域的紅外多行人跟蹤[J].激光與紅外,2009,39(8):891-894.
[5]陳方涵.基于多小波變換的紅外目標探測與識別[J].光子學報,2011,40(2):295-298.
[6]楊建國.小波分析及其工程應用[M].北京:機械工業出版社,2005.
[7]程正興.小波分析算法與應用[M].西安:西安交通大學出版社,1998.
[8]唐琳,蔡德榮,黃猛.一種基于遺傳算法的圖像分割算法[J].計算機與數字工程,2008,36(7).
[9]王學偉,李珂,王世立.紅外成像系統建模仿真方法研究[J].計算機與數字工程,2012,40(6).
[10]鐘華.多小波理論及其在邊緣檢測方面的應用[J].南昌:江西師范大學,2005.