袁 源,樊萬梅
(1.招商局重慶交通科研設計院有限公司,重慶 400067;2.重慶大學,重慶 400030)
圖像感興趣區域(region of Interest,ROI)提取技術用于提取出圖像中進一步目標識別的至關重要的區域,主要應用于視頻增強、理解和檢索,視頻/圖像壓縮等領域,是當前圖像處理領域的研究熱點之一[1-6]。
目前,ROI提取技術主要分為基于視覺特征的方法和基于運動變化的方法[5]?;谶\動變化的ROI提取技術是把運動對象作為感興趣區域,如文獻[1]使用膚色提取人臉進行視頻壓縮,文獻[2]訓練兩級神經網絡分類器區分感興趣的前景和不感興趣的背景,這類方法大多都是針對娛樂視頻和視頻會議的,不適用于靜態圖像的感興趣區域的提取。而基于視覺特征的ROI提取技術從人眼的視覺特征出發,通過對圖像視覺特征的分析來提取ROI,如文獻[4]利用顏色和信息熵提取ROI,雖然利用顏色和信息熵的互補作用,這種方法能提高感興趣區域檢測的準確率,但也存在不足之處:當噪聲與整幅圖像的灰度均值差值較大時,這種以引起視覺注意機制為理論基礎的ROI提取方法將不能抑制這些噪聲,導致提取出的感興趣區域包含了這些噪聲區域。
然而,在實際應用中ROI提取算法對實時性要求較高,上述算法不能較好滿足提取要求;此外,噪聲對感興趣區域的提取具有不可忽視的影響。為此,本文考慮噪聲對ROI提取的影響,并兼顧實際應用場景對實時性的要求。對于監控場景背景比較單一的情況,充分利用背景區域與前景感興趣區域的不同,提出了一種基于背景統計的靜態圖像ROI提取算法。同時,將該算法運用于室內監控場景中的ROI提取,驗證了其有效性。
通常情況下,在實際應用場景中ROI提取要求具有較好的實時性,這就要求ROI提取技術算法簡單、可靠。而在實際的應用場景中,需要考慮噪聲對ROI提取的影響。由于監控圖像中背景具有比較單一的特點,因此借鑒背景提取技術,根據基于圖像分塊的思想對其進行處理。
首先,通過幾何方法獲取圖像的重點監控區域。其次,對重點監控區域進行分塊,并對分塊后的每一塊圖像計算其特征值和標準方差。然后,根據高斯分布的特性,利用在線k均值近似算法對每一塊圖像進行匹配,以此判斷其是否為背景,從而實現監控區域圖像的前景和背景分離。最后,對所提取的前景目標感興趣區域,利用形態學方法對其進行處理,以減少細小的偽前景感興趣區域,從而提高整個ROI提取算法的精度。整體算法流程如圖1所示。

圖1 基于背景統計的ROI提取
背景模型是以單個像素形式建立的,具有準確、靈活、相對簡單等優點,但存在抗噪能力差、執行效率不高等問題。
針對上述不足,本文引入分塊統計的思想,基于圖像塊的特征建立背景模型[7]。設km(x,y)為一個m×m像素的圖像塊,(x,y)表示該圖像塊左上角的坐標。在2×2的情況下,圖像塊中前景像素的分布組合有5種,如圖2所示。圖2(a)表示完全背景,圖2(b)有1個前景,圖2(c)有2個前景,圖2(d)有3個前景,圖2(e)為完全前景的情況。

圖2 2×2圖像塊的5種情況
為了建立基于圖像分塊的背景模型,有必要對圖像分塊數目以及所分塊后圖像的特征選擇進行闡述。圖像分塊往往具有如下特點:圖像塊越大(圖像分塊的參數越小),需要處理的圖像塊數就越少,算法的執行效率就越高,但是也降低了對局部目標的敏感度,導致目標提取的精確度變差,這是因為目標區域所占比例小的圖像塊的個數會增加,如圖2中(b)和(c)所示的情況,因此,在選擇m時,應從目標提取的敏感性、準確度以及算法的執行效率等方面綜合考慮。
為了選擇圖像塊中的特征,本文引入幾種提取圖像塊特征λ的方法:
1)以圖像塊中心點作為圖像塊的特征,即λ=中心點像素;
2)選取若干點的組合作為圖像塊的特征;
3)圖像塊的均值作為圖像塊的特征,即

4)圖像塊的行均值或圖像塊的列均值作為圖像塊的特征;

5)圖像塊的幅度值作為圖像塊的特征,即

上述特征都是圖像塊中像素的線性運算,因此,當圖像中坐標為(i,j)點的像素值Xij服從正態分布時,上述特征λ也將服從正態分布。
在上文提出的圖像特征中,選擇其中的1個或幾個特征 λ1,λ2,…,λs構成特征向量,令 Λ ={λ1,λ2,…,λs}。
采用單高斯分布的形式,給出其高斯分布聯合概率密度函數

其中:Λ(i,j)表示對應于圖像中坐標為(i,j)圖像塊灰度值所形成的隨機變量;W代表了這一類像素;u為均值向量;Σ為灰度信息的協方差矩陣,均為高斯分布參數,有訓練樣本估計

基于像素間相互獨立的假設,可以得出特征之間也是相互獨立的,為了簡化計算,可以進一步假設它們具有相同方差。式(6)和(7)表明圖像塊特征向量Λ的概率分布可由一個單高斯函數來描述,也就是說圖像塊的某種狀態可由單高斯模型的某個分量進行刻畫。
基于上述假設,將所有圖像塊的特征向量值與高斯分布的特征向量進行匹配,若特征向量值落在高斯分布的標準方差的某一倍數范圍內,就認為匹配成功,具體計算方法為

若式(8)成立,則認為匹配成功,為監控區域的背景區域,反之,則認為監控區域的前景區域,即為目標感興趣區域。實驗表明,對于2×2的圖像塊,τ取3比較合適。
為了驗證本文提出的基于背景統計的ROI提取算法的有效性,將其應用于某室內監控場景,實驗平臺為Matlab7.0,實驗數據來源于某大樓室內監控場景中的圖像。實驗結果如圖3所示。

圖3 基于背景統計的處理結果

圖4 基于視覺注意機制的處理結果
由圖3可以看出,基于背景概率分布統計的ROI提取算法能夠提取出前景目標的感興趣區域,處理結果較為滿意。圖4為不同k值下的感興趣區域,當k較小時,提取出的感興趣區域(圖中小框標記的區域)并不是我們需要監控的目標。隨著k取值的增大,能夠獲得監控目標的感興趣區域,但是當監控目標的灰度值與整幅圖像均值之差小于噪聲灰度值與整幅圖像均值之差時,提取出的目標感興趣區域將包含噪聲區域,即引起我們視覺注意的首先是這些噪聲,其次才是監控目標,降低了感興趣區域提取精度。通過對比實驗可以發現,本文提出的ROI提取算法可以準確地對圖像中的目標感興趣區域實施提取,同時有效抑制了由噪聲導致感興趣區域的出現,降低了誤檢率。
考慮場景中噪聲對ROI區域的影響和視覺注意機制特性,借鑒圖像分塊的思想,提出了一種基于背景統計的感興趣區域的提取算法。實驗結果表明:該算法不僅能夠克服基于視覺注意機制的ROI提取方法的不足,還能完成ROI提取,且提取算法相對簡單,適用于背景較單一、噪聲比ROI區域顯著情況下的感興趣區域提取。
[1]Chen M,Chi M,Hsu C,et al.ROI video coding based on H.263+with robust skin-color detection techniques[J].IEEE Transactions on Consumer Electronics,2003,49(3):724-730.
[2]Doulamis N,Doulamis A,Kalogeras D,et al.Low bit-rate coding of image sequence using adaptive regions of interest[J].IEEE Transactions on Circuits and Systems for Video Technology,1998,8(8):928-934.
[3]吳琦穎,李翠華.用于海上感興趣區域實時分割的近似算法[J].廈門大學學報,2007,46(1):33-37.
[4]陸偉,倪林.利用顏色和熵提取感興趣區域的感性圖像檢索[J].中國圖象圖形學報,2006,11(4):492-497.
[5]鄭錦,李波.面向室外視頻監視的感興趣區域提取[J].中國圖象圖形學報,2010,15(9):1363-1369.
[6]何毅,陸淑娟,梅雪.基于ROI提取的多目標圖像水平集分割[J].計算機工程,2009,35(23):214-216.
[7]楊廣林,孔令富.基于圖像分塊的背景模型構建方法[J].機器人,2007,29(1):29-34.
[8]金濤,賈宏志.運動的目標圓盤的輪廓和圓心提取方法研究[J].激光雜志,2010(4):24-26.
[9]范巧艷,艾斯卡爾·艾木都拉.遺傳算法優化RBF網絡的圖像雜波抑制技術研究[J].激光雜志,2010(2):11-13.