魏海永 羅 航
(海裝武漢局駐景德鎮軍事代表室 景德鎮 333002)
?
基于二維最大熵法的圖像感興趣區自動提取研究*
魏海永 羅 航
(海裝武漢局駐景德鎮軍事代表室 景德鎮 333002)
論文在傳統的二維最大熵圖像感興趣區提取方法的基礎上,提出并推導了逐次逼近二維最大熵遞推搜索算法,并經實驗驗證該算法具有較好的實時性,具有一定的工程實踐價值。
感興趣區; 雷達; 作戰仿真
Class Number TN911.73
為了解決巡邏攻擊導彈末制導圖像在有限帶寬進行傳輸的問題,需將圖像數據(常見的類型包括紅外圖像、視頻圖像、雷達圖像等)壓縮后在有限帶寬信道上傳輸。然而對于此類的圖像信息,可能存在目標的區域,是軍事應用研究的重點,即圖像感興趣區域(region of inertest,ROI)。如何從復雜戰場圖像中自動提取感興趣區,對目標的自動識別及跟蹤研究具有重要的實際意義,具有很強的軍事研究價值。由于我軍數據鏈建設還只是基本上實現了“互連互通”,帶寬窄,還無法實時或近實時地傳輸末制導序列圖像,因此針對單幀圖像開展目標感興趣區自動提取研究具有很強的現實意義。
傳統的圖像的全局二維熵可以定義[1]為
H(s,t)=H(A)+H(B)
(1)
通過求最大化H(s,t),可以找到最佳的門限(s,t)。由于對于每個(s,t),都要從頭開始計算PA和HA,整個運算過程是一個四重循環,算法效率不高。
常用的圖像分割方法存在的主要問題是不能對不同大小的目標進行有效分割,或者難以實現分割實時性和分割有效性的統一。Prewitt眾數法、OTSU方法等傳統閾值方法要求目標大小在30%以上[2],且隨著目標相對面積的減小性能隨之迅速下降,會產生較為嚴重的誤分割。二維最大熵法雖然能對不同大小目標進行準確分割,但該方法只是簡單地將一維尋優推廣至二維尋優,導致運算量按指數增長,耗時太長,難以滿足實時要求。針對這個現狀,人們研究了一些快速算法[3~4],加快了二維最大熵圖像分割的速度。本文將在二維最大熵遞推優化公式的基礎上,提出逐步逼近二維最大熵閾值遞推搜索算法,以提升二維最大熵分割的實時性。
2.1 二維最大熵遞推優化公式
通過求取圖像全局二維熵H(s,t)的最大值,就可以找到圖像分割的最佳門限(s,t)。然而由式(1)可知,對應每個(s,t),都要從頭開始計算PA和HA,運算過程是一個四重循環,計算非常耗時,難以滿足應用中的實時需求,因此必須對其進行優化。遞推優化公式如下所示:
(2)
=PA(s,t)+PA(s-1,t+1)
-PA(s-1,t)+ps,t+1
(3)
(4)
=HA(s,t)+HA(s-1,t+1)
-HA(s-1,t)-ps-1,tlnps-1,t
(5)
顯然,在計算H(s,t+1)時,必須計算PA(s,t+1)和HA(s,t+1),從而就可以遞推計算PA(s,t+1)和HA(s,t+1)了。經過遞推優化,將二維最大熵的圖像閾值分割算法復雜度從O(L4)降到了O(L2)。若想進一步減少運行時間,減少不必要的對數運算和循環次數是提高運行效率的關鍵。
2.2 逐步逼近二維最大熵遞推搜索算法的思想及原理分析
逐步逼近二維最大熵遞推搜索算法的基本思想來源于圖像多尺度分析的思想,首先在圖像粗尺度的二維直方圖上搜索出粗略的閾值,然后在這個粗略閾值領域內搜索精確閾值。該算法避免了在不可能存在分割閾值的灰度范圍內進行循環和對數運算,提高了該算法的運行效率。
所謂粗尺度的二維直方圖,是將原二維直方圖一定范圍內的元素合并,生成一個尺度更小的二維直方圖。
設f(x,y)為一幅二維灰度圖像,大小為M*N,其總灰度級為L,G(s,t)為其二維直方圖,其定義域為
D={(s,t)|1≤s≤L,1≤t≤L}
(6)

(7)
定義域為
(8)


(9)
由于s=2m*s′,t=2m*t′,進行變量代換,G′可用G表示為
G′(s′,t′)=2m*2m*G(2ms′,2mt′)
(10)
可見G′是G經過尺度變換的形式,二者的二維直方圖是相似的。在二維直方圖中,理論上只有某個點對應的灰度值作為分割閾值時圖像的二維熵最大,離該點越遠二維熵越小,因此,從G′中能得到閾值的粗略值。

(11)
(12)
(13)
這樣就把G′上式(10)~(13)的遞推運算轉化為PS′、HS′、H′三個矩陣元素的遞推計算,找出H′中的最大元素位置就找到了粗略閾值。同樣,可以計算出定義在G上的PS,HS和H,設定義域D為
(14)
搜索出粗略閾值后,再在上面的定義域內計算H,這樣就可以根據D內H的最大元素位置找到精確閾值,具體流程如圖1所示。

圖1 分割閾值搜索流程
使用粗尺度二維直方圖進行粗略閾值搜索,可以使用兩級搜索,也可以使用多級搜索。與兩級搜索相比,使用多級搜索需要更少的循環次數和對數計算次數,但經過對不同圖像反復試驗得出,由于多級搜索需要更多輔助性的附加運算,兩級搜索需要的時間和多級搜索相比差距不是很明顯甚至更少,實際上采用了兩級搜索,第一次粗搜索的搜索步長為2m=16,若第一次搜索閾值為T,第二次再在[T*16-15,T*16+15]內搜索,達到了較好的效果。
相對于背景,感興趣區域具有相對較多的像素聚集點和相對較好的區域連通性。采用閾值方法對紅外目標圖像進行分割后得到的是一幅含有目標及離散噪點的二值圖像。圖像感興趣區的提取需要綜合運用各種技術去除虛警點,恢復目標區域的連通性,增強二值圖像的可視效果,最大限度地提取出目標可能存在的區域。主要步驟包括順序統計濾波、數學形態濾波、矩形感興趣區域提取。
1) 順序統計濾波
順序統計濾波是一種非線性的信號處理方法,m*n鄰域內d階順序濾波就是取圖像中某點的m*n鄰域內的點,把它們的灰度值從大到小按順序排序,選取第d個灰度值作為該點的灰度。m*n鄰域內d階順序濾波可以表示如式(15):

(15)
其中m=2k+1,n=2h+1。將該順序濾波原理運用于二值圖像時,圖像只存在兩級灰度0和1。當用該像素鄰域的灰度中值代替該像素灰度值時,順序濾波就成為了中值濾波。
在進行圖像分割前,可以利用中值濾波對圖像進行預處理,它將在一定程度上抑制噪聲的影響;分割后得到的二值圖像中同時存在著目標點和噪點,這兩部分像素點的區別在于其聚集密度不同,可以運用順序濾波濾除部分離散的噪點,使得在不損失目標信息的同時增強目標像素之間的連通性,減小噪聲對目標區域的影響。
2) 數學形態學濾波
數學形態學最早由G.Matheron等在1964年提出,是一種非線性圖像處理方法,它建立在幾何代數基礎上,用集合論方法來定量描述幾何結構。數學形態學有四種基本運算:腐蝕(Erosion)、膨脹(Dilation)、開(Open)運算和閉(Close)運算。設f(x,y)是輸入的數字圖像,定義域為F;g(s,t)是結構元素,定義域為G,則腐蝕和膨脹分別定義為

(16)

(17)
對結構元素g(s,t)來說,f(x,y)的開運算和閉運算分別定義為
(f°g)(x,y)=[(fΘg)⊕g](x,y)
(18)
(f·g)(x,y)=[(f⊕g)Θg](x,y)
(19)
順序濾波后得到的二值圖像前景區域同時包含目標區域和聚合噪點區域,采用開-閉的級聯操作就可以濾除聚合噪點區域。
3) 矩形區域的提取
由于感興趣區域的提取主要用于目標人工輔助識別,因此不宜將目標形狀直接作為感興趣區域,因為一旦產生分割錯誤就會進一步嚴重影響人的識別效果。在本文中,目標定義為像素數目大于或等于N的連通區域,感興趣區域定義為包含目標的擴展外接矩形。設B(x,y)為二值圖,如圖2所示,其寬為W,高為H,建立如圖所示的坐標系,設坐標(x,y)是目標target中的點,則xmin≤x≤xmax,ymin≤y≤ymax,則可以定義矩形感興趣區域為:
ROI={(x,y)|max(xmin,0)≤x≤min(xmax,W),
max(ymin,0)≤y≤min(ymax,H)}
(20)
將上述感興趣區域的邊界向外擴充8個像素得到的矩形感興趣區為
ROI={(x,y)|max(xmin-8,0)≤x≤min(xmax+8,W),
max(ymin-8,0)≤y≤min(ymax+8,H)}
(21)

圖2 感興趣區域的矩形擴展
在非邊界位置時,ROI的最小尺寸為16×16,在邊界位置時,以圖像的邊界為ROI的邊界。
在Pentium Ⅳ 2.4GHz CPU,1GB RAM的計算機上,針對由軟件生成的三幅紅外圖像(大小768*576,如圖3所示)進行了圖像感興趣區自動提取實驗。其中第一幅紅外圖像為100m處的坦克,圖像中不含噪聲,第二幅和第三幅分別為距離3500m和1000m處的艦艇,含有噪聲。運用OTSU方法分割效果如圖4所示;運用矩不變法分割效果如圖5所示;運用逐步逼近二維最大熵遞推算法的分割效果如圖6所示;經過順序濾波、數學形態濾波,矩形區域提取之后,感興趣區自動提取Mask如圖7所示。顯然,由實驗效果來看,OTSU方法能對較大目標進行有效分割,對小目標和或信噪比低的目標分割效果很不理想;矩不變的分割方法對目標大小也非常敏感;本節所提出的逐次逼近二位最大熵遞推搜索算法能夠對包含不同大小目標且含噪聲的紅外圖像進行有效分割。

圖3 紅外目標圖像
各種方法的圖像分割時間如表1所示。逐步逼近二維最大熵閾值遞推搜索算法在閾值搜索時間上有了一定的改善,與沒有采用任何優化措施的普通算法相比,閾值搜索時間減少了三個數量級,和文獻[56]提出的遞推方法相比,本文方法的搜索效率也平均提高了17.8%左右。

圖4 運用OTSU方法分割效果

圖5 運用矩不變方法分割效果

圖6 基于逐次逼近二維最大熵搜索算法的分割效果

圖7 ROI自動提取的Mask

執行時間(s)普通方法二維最大熵遞推法逐次逼近二維最大熵法100m坦克260.830.73900.59343500m艦艇305.660.72330.56301000m艦艇324.640.67690.6090
本文在傳統的二維最大熵圖像感興趣區提取方法的基礎上,提出并推導了逐次逼近二維最大熵遞推搜索算法,并經實驗驗證該算法具有較好的實時性,可用于感興趣區的自動提取,具有一定的工程實踐價值。
[1] Brink A.D.Thresholding of Digital Image Using Two-dimensional Entropics[J].Pattern Recognition,1992,25(8):803-808.
[2] LEE S.U.,CHUANG S.Y.A comparative performance study of several global thresholding techniques for segmentation[J].Computer Vision Graphics and Image Processing,1990,52(3):171-190.
[3] 龔堅,李立源,陳維南.二維熵閾值分割的快速算法[J].東南大學學報,1996,25(4):31-36.
[4] Chen W.T,Wen C.H.A Fast Two-dimensional Entropic Thresholding Algorithm[J].Pattern Recognition,1994,27(7):885-893.
[5] 張純學.巡邏攻擊導彈(LAM)的末制導技術[J].飛航導彈,2006(5):44-47.
[6] 姜百匯,游志成.數據鏈技術在國外飛航導彈上的應用[C]//發展戰略技術創新論文集,2008,5:358-362.
[7] 陳穎,成曉嵐.數據鏈在外軍裝備中的應用及關鍵技術[J].航空電子技術,2004,35(4):43-48.
[8] 姜錦鋒.紅外圖像目標檢測、識別及跟蹤技術研究[D].西安:西北工業大學學位論文,2004:5-10.
[9] 黃柯棣.系統仿真技術[M].長沙:國防科技大學出版社,2004:23-27.
[10] [美]D.K.巴頓.雷達系統分析[M].北京:電子工業出版社,2007:56-58.
Automatic Extaction Based on Recurring Algorithm of Two-dimensional Maximum Entropy Threshold
WEI Haiyong LUO Hang
(Navy Representative Office of Jingdezhen,Jingdezhen 333000)
In this paper,based on the traditional 2-D maximum entropy image interested region extraction method,the approximation 2-D maximum entropy recursive search algorithm is proposed and deduced.Besides,the experiment verifies that the algorithm has good real-time performance and certain value for engineering practice.
region of interest,radar,combat simulation
2014年8月5日,
2014年9月27日
魏海永,男,助理工程師,研究方向:航空機械。羅航,男,助理工程師,研究方向:航空機械。
TN911.73
10.3969/j.issn1672-9730.2015.02.014