摘 要:針對SAR圖像目標檢測效率低、虛警概率高及SAR圖像的特點,改進了Mean Shift聚類算法,并與雙參數CFAR檢測技術相結合,提出了一種能夠快速而準確的SAR圖像目標檢測算法。通過聚類預處理SAR圖像,降低了背景雜波對目標檢測的影響及檢測的虛警率,并且聚類后的SAR圖像具有一定的結構,將圖像結構的概念引入到目標檢測中,避免了對圖像逐點檢測,大大提高了檢測速度。實驗結果表明,該方法具有檢測速度快、虛警概率低的特點。
關鍵詞:合成孔徑雷達圖像; 目標檢測; 恒虛警率檢測; Mean Shift聚類
中圖分類號:TP751 文獻標志碼:A 文章編號:1001-3695(2008)08-2416-04
Clustering-based target fast detection for SAR imagery
PAN Zhuo1,2, GAO Xin1, WANG Yan-fei1, Fan Li-jie1,2
(1.Institute of Electronics, Chinese Academy of Sciences, Beijing 100080, China;2.Graduate School, Chinese Academy of Sciences, Beijing 100039, China)
Abstract:To solve the inefficient and high 1 alarm probability problem of the target detection in SAR images, this paper proposed a fast target-detection scheme for SAR images, which combined improved Mean Shift clustering and two-parameter CFAR detection technique. According to the SAR image character, the Mean Shift clustering algorithm was improved. Clustering SAR images for preprocessing, which reduced the effect of clutter and eliminated many 1 target detections from background. Furthermore, performed an initial clustering incorporates the concept of image structure into the target detection process, which the pixel-by-pixel detection was avoided. Numerical experiments show that the novel method performs better accurately and faster speed.
Key words:synthetic aperture radar(SAR) imagery; target detection; constant 1 alarm rate(CFAR) detection; Mean Shift clustering
合成孔徑雷達(SAR)是一種能產生高分辨率遙感圖像的相干系統,以其全天候、全天時、多波段、多極化、可變側視角、穿透能力強等特點,受到世界各國普遍重視,在民用和軍事等眾多領域都有十分廣泛的應用[1~3]。隨著機載和星載SAR圖像資源的不斷增加、圖像分辨率的不斷提高,SAR圖像的自動目標識別(automatic target recognition, ATR),已成為國內外學者競相研究的熱點。ATR系統通常分為檢測(detection)、辨別(discrimination)、分類(classification)三個階段[3~5]。檢測階段要首先篩選出可能存在目標的圖像區域——感興趣區域(region of interest, ROI),辨別和分類等后續處理將在ROI區域內進行。因此,檢測階段的性能將直接影響到后續處理的精度和速度。
一般的SAR圖像目標檢測方法,為了保證較高的檢測率,虛警率(將背景雜波等干擾物誤判為目標的概率)也較高,需要在辨識階段對檢測結果進行面積判別、峰值能量判別[3,6]等判別處理來消除虛警,并且檢測都是逐點進行的,計算量大,效率較低。本文提出的方法利用改進的Mean Shift聚類方法對SAR圖像進行聚類,由于SAR圖像中大部分是背景像素,大量的背景像素聚合成一個區域。當對聚合后的圖像進行檢測時,就可以不檢測背景區域,這樣不僅能夠降低虛警,還大大提高了檢測效率。
1 Mean Shift原理分析及其算法改進
1.1 Mean Shift密度梯度估計原理
Mean Shift方法最早由Fukunaga和Hostetler在1975年提出來的,但是直到1995年 Cheng Yi-zong才證明了此方法的收斂性[7]并深入研究了收斂速率、核的類型及核的大小等各方面的相應性質后,才將此方法引入到圖像分析領域中。后來,Comaniciu等人將其應用到圖像濾波、邊緣提取等圖像處理及實時目標跟蹤上[8]。
Mean Shift是一種非參數的核密度梯度估計方法。其優點在于無須估計特征空間概率密度函數,而通過定位密度函數的梯度零值點來確定密度的局部最大值點,此過程即聚類處理中的眾數(mode)尋找過程。
特征空間分析的關鍵是要尋找密度函數的模式點即局部密度最大點。模式點是位于密度梯度函數的零值處(f(x)=0),這樣尋找密度的模式點,轉換為定位密度梯度函數的零值點。密度梯度的估計應等于密度估計的梯度,密度梯度估計表示為
^fh,K(x)≡f^h,K(x)=1/nhd∑ni=1k((x-xi)/h)=
2ck,d/nhd+2∑ni=1(x-xi)k′(‖(x-xi)/h‖2)(4)
其中:k′(·)表示為k(·)的導數。
假設函數k(x)除了有限點外,在x∈[0,∞)上導數存在。那么,定義函數:
g(x)=-k′(x)(5)
將式(5)代入(4),得
^fh,K(x)=2ck,d/nhd+2∑ni=1(xi-x)g(‖(x-xi)/h‖2)=
2ck,d/nhd+2[∑ni=1g(‖(x-xi)/h‖2)](a)
[∑ni=1xig(‖(x-xi)/h‖2)/∑ni=1g(‖(x-xi)/h‖2)-x](b)(6)
若以g(x)為輪廓函數的核函數G(x)為
G(x)=cg,dg(‖x‖2)(7)
其中:cg,d是與ck,d相對應的歸一化常數。
那么,在點x處使用核函數G(x)的密度估計表達式為
f^h,G(x)=cg,d/nhd∑ni=1g(‖(x-xi)/h‖2)(8)
可見,式(6)中(a)(b)兩項分別有著特殊的含義:(a)項正比于在點x處使用核函數G(x)的密度估計f^h,G(x); (b)項就是Mean Shift矢量mh,G(x)。Mean Shift矢量表示的是以核函數G(x)為加權的均值矢量與窗口中心點x的差矢量。
由上可得
mh,G(x)=1/2h2c^fh,K(x)/f^h,G(x)(9)
其中:c=cg,d/ck,d是一個常數。
由式(9)可見,點x處以K核的密度梯度函數的估計^fh,K(x)與G核的Mean Shift矢量mk,G(x)成正比,筆者要尋找的^h,K(x)的零值點,可以通過mk,g(x)迭代得到,這也說明Mean Shift矢量總是指向密度增長最快的方向,Mean Shift矢量的運動方向就是一個自適應的梯度上升方向,其收斂點就是密度梯度的零值點,也是要尋找的密度的模式點。文獻[8]給出了有關收斂性的證明。
1.2 Mean Shift方法在SAR圖像聚類中的應用
聚類也稱為非監督分類,是按照事物間的相似性進行區分和分類的過程,在這一過程中不施加任何的先驗知識,而僅憑數據本身特性進行分類。由于SAR圖像信息存在不確定性,缺乏先驗知識,當對SAR圖像進行分類處理時,多采用聚類方法。聚類過程中聚類中心的點的尋找是關鍵,聚類中心點既是特征空間中密度的局部最大值點,由1.1節對Mean Shift基本原理的分析可知,Mean Shift方法能夠在任何特征空間的數據中通過Mean Shift矢量的迭代來定位密度的模式點,并且在聚類過程中無須假設數據符合特定的分布,也無須預先設置聚類中心的個數,并且Mean Shift聚類結果不依賴于初始點集的選取,結果具有一定的確定性。這些特點使得Mean Shift方法適應于SAR圖像數據的聚類。
一幅SAR圖像可以看成二維的標量矩陣,矩陣中的元素是SAR圖像中相應位置像素的灰度值。如果將像素的空間位置信息與灰度值域信息相結合,形成“空—值”聯合特征空間,那么在聯合特征空間中,SAR圖像的每一個像素都是一個三維矢量,其分量分別為橫坐標、縱坐標和灰度值。這樣,多元核可定義為空間域與灰度值域的兩個核的乘積:
Khs,hr(x)=C/h2shrk(‖xs/hs‖2)k(‖xr/hr‖2)(10)
其中:k(x)表示在兩個域中所使用的核的輪廓函數;xs表示空間域中的二維矢量,即像素點的橫、縱坐標;xr表示值域中的標量,即SAR圖像像素的灰度值;hs、hr分別表示空間域與值域的核的帶寬;C是歸一化常數。
在對SAR圖像進行聚類時,以每一像素點為窗口中心位置的初始點,計算Mean Shift矢量,平移窗口直到收斂到局部密度最大處,得到密度模式點的位置和灰度值,并將此密度模式點的灰度值賦予初始的窗口中心點。遍歷整個圖像的像素點,得到所有的模式點的分布信息,將空間距離上小于hs、灰度域值小于hr的模式點聚合為一個模式點,再將收斂到同一模式點的像素歸為同一類,從而對整幅圖像進行聚類處理。
1.3 改進Mean Shift聚類算法
由1.2節可知,Mean Shift方法對SAR圖像進行聚類時,迭代計算每一個像素點的Mean Shift矢量,來確定相應的密度模式點,這樣會準確地將像素點歸到對應的區域內。由于SAR圖像的數據量較大,并且大部分為背景像素,僅有少量的目標像素點。如果對圖像中每一個像素點都進行迭代計算,則計算量較大,處理的實時性難以保證,為提高處理的效率,本文對Mean Shift聚類過程進行了改進。在尋找模式點時,窗口覆蓋的像素點打上標記,不再重復計算這些點處的Mean Shift矢量,將窗口所覆蓋的像素點都賦予此窗口收斂到的密度模式點的灰度值,這樣可以減少大量的背景像素點的Mean Shift矢量的計算,減少計算時間。算法實現過程如下:
記{x}i=1…n為SAR圖像對應的聯合特征空間中的像素點;{zi}i=1…n為聚類后的輸出圖像在聯合空間中的像素點,Li為聚類后像素點的灰度值,yi,j為以xi為初始窗口中心的第j次迭代的窗口的中心位置矢量點,Fi為每個像素點的標記,{Gp}p=1…m為模式點聚合后的集合,M為聚類后區域內像素個數的閾值。
改進Mean Shift聚類算法步驟如下:
a)初始化每個像素的標記為0,初始化窗口中心點,j-1,yi,1=xi,初始化參數hs、hr。
b)計算下一次迭代的窗口中心位置yi,j+1=∑ni=1xig(‖(x-xi)/h‖2)/∑ni=1g(‖(x-xi)/h‖2),并計算Mean Shift矢量m(x)=yi,j+1-xi,直到m(x)<ε(ε表示一個較小的數),得到收斂點zi=yi,c,并將搜索窗口所經歷的所有像素點的標記Fi置為1,其灰度值都設置為收斂點的灰度值;
c)檢查xi+1的標記是否為0。如果是0,則對xi+1點執行b);否則,不執行b),檢查下一個像素點的標記,以此遍歷所有的像素點。
d)將得到的所有收斂點zi中,空域小于hs、灰度值域小于hr的聚為一類,那么zi被映射到{Cp}p=1…m。
e)對圖像像素灰度值重新賦值,即i=1,…,n,置Li={p|zi∈Cp}。
f)將像素個數小于M的區域合并到空間最近的區域。
通常SAR圖像中存在大量灰度值接近的背景像素,通過改進的Mean Shift算法對這類像素點聚類,計算復雜度大大降低,效率提高,能夠保證處理SAR圖像的時效性。雖然聚類的精度有所降低,大量的實驗結果表明,聚類的結果圖像能夠保證后續圖像處理的要求。
2 基于聚類的快速目標檢測
2.1 基于Rayleigh分布的雙參數CFAR檢測
一般的軍事目標(如坦克、飛機)等強散射體在SAR圖像上都是由較亮的像素組成,因此采用基于灰度閾值的檢測方法能夠實現此類目標的檢測。恒虛警率(CFAR)檢測就是一種利用檢測點的強度值與閾值比較,來實現目標檢測的技術。CFAR檢測能夠提供相對來說不受噪聲、背景雜波和干擾變化影響的檢測閾值,同時與樣本進行比較時,使目標檢測具有恒定的虛警概率。自從林肯實驗室的Novak等人[3]提出了基于Gauss分布的雙參數CFAR算法之后,雙參數CFAR檢測技術便被應用到SAR圖像的目標檢測中。
雙參數CFAR檢測如圖 1所示[3]。
圖 1為CFAR檢測的參考窗口模板,模板邊界是雜波統計區,邊長一般要大于最大目標尺寸的兩倍,厚度通常為一個像素點,用來估計雜波的一階和二階統計量。警戒區是防止目標像素點泄漏到雜波統計區,以保證雜波的估計不受到目標像素點的干擾。
雙參數CFAR的檢測規則[3]為
(Xt-μ^c)/σ^c>Th, Xt為目標像素點
(Xt-μ^c)/σ^c<Th,Xt為雜波像素點(11)
其中:Xt為測試像素的灰度值;μ^c為雜波灰度均值的估計;σ^c為雜波灰度標準偏差的估計;Th為與虛警率有關的檢測閾值。
雙參數CFAR檢測算法非常簡單,就是根據式(11)的檢測規則對圖像中的每一個點進行逐點檢測,從而實現整幅圖像的目標檢測。
假設SAR圖像雜波符合Rayleigh分布[10],即
fc(x)=x/b2sex2/2b2s,x>0(12)
其中:fc(x)表示SAR圖像雜波像素灰度的概率密度函數;bs為形狀參數。
根據虛警概率的定義:
Pfa=∫∞xTfc(x)dx(13)
其中:xT為與檢測點灰度比較的閾值。
將式(12)代入式(13)得:
Pfa=exp(-x2T/2b2s)(14)
CFAR技術中,通常用雜波的均值和方差的估計值來計算閾值[10]:
xT=Th×σc+μc(15)
其中:Th為雙參數CFAR檢測門限(見式(11));μc和σc分別為雜波的均值和標準偏差。當雜波符合Rayleigh分布時:
μc=π/2bs,σc(4-π)/2bs(16)
將式(16)(15)代入式(14),得
Pfa=exp[-((Th×4-π+π)/2)2](17)
由式(17)可知,對于確定的虛警概率Pfa,Th是一個確定的常數。對于SAR圖像中的每一個像素點,求出其相應雜波統計區內雜波的均值和方差,再將閾值Th代入式(11),對其進行CFAR檢測。
2.2 基于改進的Mean Shift聚類的雙參數CFAR目標檢測
本文提出的目標檢測方法是在進行CFAR檢測前,先對SAR圖像進行改進的Mean Shift聚類處理。通常情況下,SAR圖像大部分是由背景雜波像素組成,由改進的Mean Shift聚類方法的原理可知,對SAR圖像進行了聚類處理后,背景雜波像素被聚合成同一類,圖像大體分成背景區(聚類后圖像灰度直方圖中像素個數最多的灰階所對應的像素組成的區域)和目標區。當對圖像進行檢測時,可以引入聚類后得到的圖像的結構信息,不對背景區像素進行檢測,此部分像素直接判斷為非目標像素點。而對于目標區像素,則進行雙參數的CFAR檢測,來判斷是否是目標像素。算法流程如圖 2所示。
在進行改進的Mean Shift聚類處理時,本文對空間域和灰度值域都采用具有最小積分均方誤差(minimum mean integra-ted square error, MISE)的Epanechnikov核函數[8,9]:
KE(x)=c(1-‖x‖2),‖x‖≤1
0 otherwise(18)
其中:c=1/2c-1d(d+2);cd是單位d維球體的體積,SAR圖像在聯合特征空間中d=3。
由1.1節的分析可知,Epanechnikov核函數所對應的G核為
G(x)=c‖x‖≤1
0otherwise(19)
核函數G(x)對窗口中像素點的加權為常量,所以利用G核可以方便地得到每次迭代的窗口中心位置yi,j,從而計算出Mean Shift矢量。
核函數帶寬的大小對聚類的精度和效率有著很大的影響,大帶寬可能會將兩個聚類中心點聚成一個,從而減少了聚類中心的個數;反之,可能會將一個聚類中心點分成多個子聚類中心,從而增加聚類中心的個數。對SAR圖像聚類時,需要分別設置空間域帶寬hs和灰度值域帶寬hr。hs對應著像素點鄰域的大小,決定著對于x點處密度梯度值的估計將在多大的范圍內進行,主要影響計算速度。hr決定灰度值在多大范圍內的收斂點聚合為一類。
3 實驗及其結果分析
選取Sandia實驗室(Sandia national laboratory)的SAR圖像數據,圖像大小為512×512,距離分辨率和方位分辨率均為0.1 m,如圖3(a)為實驗中一幅原始SAR圖像,其中含有8個坦克目標(圖 3中所有圖均以原圖的25%大小顯示)。
實驗是在P4 3.0GHz CPU 計算機,2 GB內存,Windows Server 2003操作系統上,采用VC6.0編碼完成。實驗從兩個角度進行了比較:
a) 將改進算法與原Mean Shift算法的聚類結果的性能相比較,兩種情況下設置相同的空間域帶寬hs和灰度值域帶寬hr(hs=7,hr=8),聚類結果如圖 3(b)和(c)所示。雖然圖 3(c)中SAR背景區域像素的灰度值沒有圖 3(b)均勻,出現了小塊的子區域,但是計算效率大大提高。圖 3(b)的生成時間為48.780 s,而圖 3(c)的生成時間為6.460 s,可見,其計算時間相差一個數量級。然后考察改進與原聚類結果圖在檢測階段的性能,對圖 3(b)和(c)進行基于聚類的CFAR檢測,結果如圖 3(e)和(f)所示。可見,圖 3(c)中的子區域并不影響檢測結果。
b) 將本文的算法與傳統的CFAR檢測相比較,設置設定的虛警概率為Pfa=1×10-4,檢測窗口大小為51×51,窗口厚度為1個像素。結果如圖 3(d)和(f)所示,本文算法的檢測結果明顯優于傳統的CFAR檢測方法。傳統的CFAR檢測方法的檢測結果圖中出現了大量的虛警點,需要對其進行后續處理將其消除。與傳統的CFAR逐點檢測相比,本文算法不僅大大提高了效率,虛警率也明顯降低,減少了后續處理的計算負擔。將傳統的CFAR檢測(算法1)以及基于未改進Mean Shift算法的檢測方法(算法2)與本文算法(算法3)的效率相比較,結果如表1所示。表1 三種算法效率的比較s算法聚類處理耗時CFAR檢測耗時總耗時1013.15113.151248.7800.55649.33636.4600.7037.1634 結束語
目標檢測是自動目標識別的關鍵技術之一,在保證實時性的情況下,準確地從SAR圖像中進行目標檢測是自動目標識別首先要解決的問題。本文深入分析了Mean Shift算法的原理,將其引入到SAR圖像聚類處理中,并根據圖像的特點進行了算法的改進。基于聚類的SAR圖像目標檢測方法,通過聚類大量的背景像素為同一均質區域,不僅消除了背景地物對檢測的影響,降低了檢測的虛警率,而且可不對背景區域進行CFAR檢測,化簡了檢測操作,減少了檢測的計算量,提高了效率。雖然實驗結果表明該算法具有較好的檢測性能,但是將此算法應用到實用系統中還有許多工作要做。此算法對于低分辨率或含有小目標(小于聚類空間帶寬的目標)圖像可能會在聚類時將目標歸為背景像素,產生漏警現象,同時還需要進一步利用SAR在各種不同的工作條件下獲取的圖像數據庫來評估此算法。
參考文獻:
[1]BRYANT T G, MORSE G B, NOVAK L M, et al. Tactical radars for ground surveillance[J]. The Lincon Laboratory Journal, 2000, 12(2):341-354.
[2]MARIVI T, CARLOS L M, JORDI J M. A novel algorithm for ship detection in SAR imagery based on the wavelet transform[J]. IEEE Geoscience and Remote Sensing Letters, 2005, 2(2):201-205.
[3]NOVAK L M,HALVERSEN S D,OWIRKA G J, et al. Effects of polarization and resolution on SAR ATR[J]. IEEE Trans on Aerospace and Electronic Systems, 1997, 33(1):102-115.
[4]NOVAK L M,OWIRKA G J,BROWER W S, et al. The automatic target-recognition system in SAIP[J]. The Lincon Laboratory Jour-nal, 1997, 10(2):187-202.
[5]NOVAK L M,OWIRKA G J,WEAVER A L,et al.Automatic target recognition using enhanced resolution SAR data[J]. IEEE Trans on Aerospace and Electronic Systems, 1999,35(1):157-175.
[6]ZHANG Cui, ZOU Tao, WANG Zheng-zhi. A target discrimination algorithm for high resolution SAR imagery[C]//Proc of IEEE International Conf on Robotics, Intelligent Systems and Signal Processing.2003: 863-867.
[7]CHENG Yi-zong. Mean Shift, mode seeking, and clustering [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1995,17(8): 790-799.
[8]COMANICIU D, MEER P. Mean Shift: a robust approach toward feature space analysis[J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2002,24(5):603-619.
[9]COMANICIU D, MEERP. Mean Shift analysis and application[C]//Proc of the 7th International Conference on Computer Vision.Kerkyra:[s.n.],1999:1197-1203.
[10]ZHANG Cui, ZOU Tao, WANG Zheng-zhi. A fast target detection algorithm for high resolution SAR imagery[J]. Journal of Remote Sensing,2005,9(1): 45-49.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文