水鵬朗 田 超 封 天
(西安電子科技大學雷達信號處理國家級重點實驗室 西安 710071)
IG-CG( Compound-Gaussian model with Inverse Gaussian texture)是復合高斯海雜波模型的重要類型之一[1–3],其能夠作為K-分布[4,5],廣義Pareto強度分布[6],對數正態紋理復合高斯模型(Compound-Gaussian model with LogNormal texture, LN-CG)[7]的重要補充刻畫中高距離分辨率的海雜波。而且IG-CG模型下的近最優計算可實現的相干檢測器的兩種形式已經在最近被發現[8,9]。因此,對于高分辨海用雷達,IG-CG模型在目標檢測中的使用的重要前提是在海雜波IG-CG模型參數的精確估計[10]。在CFAR (Constant False Alarm Rate)檢測中,參數估計精度決定了虛警率的控制精度,參數估計越準確,虛警率控制越精準[8,11]。而且使用匹配于雜波逆形狀參數的最優、近最優相干檢測器時,不精確的參數估計會導致最優或近最優檢驗統計量失配,帶來性能損失。由于雷達接收的數據中包含了高幅度的異常樣本,其主要來自海面目標、島礁等的強回波,傳統基于樣本矩和迭代最大似然(Iterative Maximum Likelihood, IML)估計的方法[12]由于其對異常樣本的敏感性難以使用。
文獻[12]基于數據樣本分位點對異常樣本的穩健性,提出了對異常樣本穩健的雙分位點(Bi-Percentile, BiP)估計方法。該方法能夠在存在異常樣本的情況下穩健估計海雜波IG-CG模型的尺度參數和逆形狀參數。仿真和實測數據處理結果表明:兩個分位點的位置明顯影響估計對異常樣本穩健性和精度。受K-分布下對異常樣本穩健的三分位點估計方法[13]的啟發,本文提出了估計IG-CG分布逆形狀參數和尺度參數對異常樣本穩健的三分位點(Tripercentile, Tri-per)估計方法。按照文獻[12]中的結果,兩個分位點的比率是逆形狀參數的單調函數,不同的分位點位置對應不同的逆形狀參數估計器。從大量的仿真實驗發現了達到逆形狀參數估計最小均方根誤差的雙分位點位置的經驗公式。在逆形狀參數估計中,上分位點的位置由其對異常樣本的穩健性要求確定,下分位點位置由經驗公式確定,從而得到了逆形狀參數估計的最優參數設置。基于估計的逆形狀參數,進一步確定具有最小均方根誤差的第三分位點位置得到尺度參數的估計。這樣得到了具有最優分位點位置設置的三分位點參數估計方法,其明顯改善了參數估計性能。
本文內容安排如下。第2節回顧了海雜波的IGCG幅度模型以及對異常樣本穩健的雙分位點估計方法。第3節提出了具有最優分位點位置設置的三分位點估計方法。第4節基于仿真和實測數據檢驗了提出方法的性能并與已有方法進行對比。第5節總結了全文的工作。
復合高斯模型是公認的描述海雜波的有效模型,該模型中海雜波表示為兩個獨立隨機變量的乘積,反映功率起伏的紋理分量和描述散斑的復高斯分量,海雜波表示為
其中,μ和υ分別是紋理分布的尺度(雜波功率)和逆形狀參數(傳統形狀參數的倒數),u是零均值單位方差的復高斯隨機變量。紋理的概率密度函數取不同分布類型對應于不同的復合高斯模型。典型的,Gamma分布紋理、逆Gamma分布紋理、逆Gaussian分布紋理和對數正態紋理分別對應于K-分布[4,5]、廣義Pareto強度分布[6]、IG-CG分布[1]和LN-CG分布[7]。IG-CG幅度分布的概率密度函數(Probability Density Function, PDF)和累積分布函數(Cumulative Density Function, CDF)的表達式分別為其中,r=|z|表 示幅度,μ表示尺度參數。逆形狀參數越大,幅度分布拖尾越重,海雜波的非高斯性越強。當υ=0時,式(2)退化為瑞利分布,雜波是高斯雜波。當樣本為純雜波數據時,矩估計方法(Method Of Moment, MOM)[1]和IML估計方法[12]能夠得到IG-CG模型參數的高精度估計。由于實際回波數據不可避免含異常樣本,MOM和IML估計方法由于對異常樣本敏感,估計值會嚴重偏離其真實值。文獻[12]提出的IG-CG分布參數的BiP估計方法,由于其使用數據的樣本分位點進行參數估計,其估計性能對異常樣本穩健[14]。
對于任意值0 <α<1 , 位置為α的分位點rα是方程
其中,W(x)是Lambert W-函數,y=xex函數的反函數。對于任意的0<α<β<1,可以得到兩個分位點的比是與尺度參數無關的逆形狀參數的單調函數[12],即
因此,函數Θ(υ;α,β)的反函數存在,記作Λα,β(?)。由于缺乏解析表達式,使用時對給定的0<α<β<1,函數Λα,β(?)可以通過查表法實現。當逆形狀參數已知,尺度參數可以從任意分位點估計,例如
當式(5)和式(6)中的分位點被樣本分位點代替后,就得到了異常樣本穩健的BiP估計方法[12]。設{ri,i=1,2,...,N}是 幅度樣本,{r(i),i=1,2,...,N}是把樣本從小到大排列得到的序列,IG-CG分布模型的雙分位點參數估計方法的表達式為
其中,[x]表示取最接近x的整數,r?α和r?β分別是下和上樣本分位點。顯然,不同的0<α<β<1對應于不同位置的BiP估計。上分位點位置β的選擇基于對異常樣本的穩健性,1–β必須小于數據中異常樣本可能的最大比例。下分位點位置α的選擇也明顯影響估計性能[12]。
BiP估計方法中, 分位點位置α和β會影響參數估計的性能。受K-分布三分位點估計方法[13]的啟發,本文通過3個分位點位置的優化設置改進參數估計的精度。首先,通過兩個分位點位置的優化設置改進逆形狀參數的估計精度,然后在逆形狀參數估計的基礎上尋找第三分位點的最優位置改進尺度參數的估計精度。
按照式(7)的估計,當數據樣本中不存在異常樣本時,對于給定的分位點位置α和β,逆形狀參數的估計性能可以用相對均方根誤差衡量,它是位置參數和樣本數目的函數,記為
其中,υ?是逆形狀參數的估計值。然而,很難得到上面相對均方根誤差的解析表達式,位置參數α和β的優選只能依賴于Monte-Carlo試驗得到的估計值。首先,α和β的優選不應該依賴于逆形狀參數本身的值,因為其估計之前是未知的。需要找出對所有逆形狀參數公用的最優的位置參數設置。不失一般性,假定海雜波逆形狀參數υ具有先驗分布pυ(υ),那么對于給定的樣本數N,分位點位置參數的優選歸結為優化問題
其中,η是控制估計對異常樣本穩健性的參數。一般來說,數據中異常樣本的比例要小于1–η。
本文通過Monte-Carlo試驗的方法驗證上面的近似結果,假設逆形狀參數γ服從區間[0,100]上的均勻分布。對給定的α,β和N,計算優化問題式(9)中的目標函數的值,計算積分時通過按照均勻分布隨機生成105個隨機的逆形狀參數的值取其相對均方根誤差的平均值實現。其中樣本數分別取做N=1000, 3000, 5000, 10000,下分位點位置α在區間[0.1,0.6]上均勻取值,其間隔為0.01,上分位點位置β在區間[α+0.1,0.99]上均勻取值,取值間隔為0.01。如圖1所示,本文畫出了4個樣本數情況下目標函數的等值線圖。在每條等值線上,總體的逆形狀參數估計相對均方根誤差是相等的。圖中紫色曲線由每個β值下總體相對均方根誤差達到最小的α的最優分位點位置(α,β)構成。可以看到:在N很大時,式(9)中逆形狀參數估計的相對均方根誤差與N無關。為了獲得最優參數設置的經驗公式,本文通過二次函數擬合最優參數設置中α和β的關系,得到了經驗公式
擬合曲線在圖中用黑色曲線表示,可以看到擬合曲線和紫色曲線很好吻合。
可以發現,從圖1中的經驗公式的曲線正好是綜合相對均方根誤差的等值線與β=常數的垂直線的共切點組成的曲線。由于所有等值線都是凸曲線,因此經驗公式曲線上的每個點都意味著:選擇的分位點位置是所有具有相同綜合相對均方根誤差的位置配置中具有最小β值的配置。而小的β值意味著逆形狀參數估計對異常樣本更穩健。換句話說,就是分位點最優位置選擇就是在估計性能固定的情況下選擇對異常樣本最穩健的配置,這能夠從優化問題式(9)的對偶規劃得到合理性解釋。下面研究當逆形狀參數估計得到情況下尺度參數估計性能的優化問題。不同于BiP估計中,尺度參數從下樣本分位點和估計的逆形狀參數進行估計,本文選擇第3個樣本分位點估計尺度參數。按照式(6),當逆形狀參數已知時,尺度參數的平方根正比于第3個分位點的值。按照樣本分位點的漸進公式,當尺度參數的平方根從第3個位置在γ的樣本分位點進行估計時,估計是漸進高斯的,即
圖1 實驗選取最佳分位點組合
按照式(11)夠大時,尺度參數的估計性能由正態分布的變差系數(CV)決定
于是,第3個分位點的最優位置就是給定逆形狀參數時函數h(υ,γ)的最小值點,即
可以證明式(15)中的函數γ(υ)滿足
按照式(16)函數在兩個極端情況下的情況以及圖2中數值計算得到的曲線式(15)的圖像,本文用下面形式的指數函數擬合曲線
通過最小二乘擬合得到參數a=0.06923,ρ1=0.4824,ρ2=0.03648。可以看到:圖2中的擬合曲線和從式(16)的數值計算得到的曲線擬合得很好。此外,由于第3分位點的位置γ(υ)≤0.797是遠離1的,尺度參數的估計對異常樣本是穩健的。
圖2 第3分位點相對誤差等高線圖
按照式(7)、式(10)和式(17),從一組含有異常樣本的數據中估計IG-CG幅度分布的參數時,首先按照數據中最大可能的異常樣本百分比,確定上分位點的位置β,然后按照式(10)確定下分位點位置α。形狀按照式(7)的BiP估計方法進行估計,最后尺度參數從式(17)確定的第3分位點位置進行估計,即
本節通過仿真和實測數據檢驗三分位點估計方法的性能并與已有的估計方法進行比較。主要比較方法是兩個參數的RRMSE和數據的CDF和CDF之間的K-S距離,它定義為
其中,FE(r)是從數據得到的經驗幅度累積分布,F(r;μ?,υ?)是估計參數得到的擬合分布。
仿真實驗中,海雜波數據中添加2%的異常樣本,異常樣本的功率是海雜波功率的[20,400]倍并且按照均勻分布隨機生成。參數估計的樣本數設置為N=5000,逆形狀參數取值0.1~15,間隔為0.1均勻取值,雜波數據的尺度參數固定為1。本文使用1-2階矩估計方法(1-2 order Method Of Moment, MOM12)[2],2-4階矩估計方法(2-4 order Method Of Moment, MOM24)[1], IML估計方法[12],具有α=0.5,β=0.95的BiP估計方法[12],和提出的三分位點估計方法到仿真數據上。為保持相同的穩健性,三分位點估計方法上分位點位置β=0.95,下分位點位置和第3分位點位置按照式(10)和式(17)設置。存在異常樣本的情況下,5個估計方法得到的逆形狀參數、尺度參數的相對均方根誤差和數據經驗CDF和擬合CDF的平均K-S距離如圖3所示。這里K-S距離對比橫坐標為0.1~5的逆形參范圍。由于MOM12,MOM24和IML估計對于異常樣本非常敏感,2%高功率異常樣本的存在使得參數估計性能急劇變差。這3個估計方法的相對均方根誤差、平均K-S距離與兩個基于分位點的對異常樣本穩健的估計方法相比就不在一個數量級上。為了演示這種性能差異,在3個子圖的右下角通過小圖顯示了兩類估計方法在性能上的巨大差異。從圖3可以看出:當異常樣本存在的條件下,基于樣本分位點的估計方法性能良好,這類方法對異常樣本的穩健性源于樣本分位點或序貫統計量對異常樣本的穩健性[14]。相對于采用固定分位點位置的BiP估計方法[12],提出的具有分位點位置優化的三分位點估計方法獲得了較為明顯的性能改善。
圖3 有異常樣本條件下5種估計方法逆形狀參數的估計性能對比
在實測數據實驗中選取了IPIX數據集[15]和CSIR數據庫[16]各一組X波段高分辨率海雜波數據。其中IPIX數據集的數據文件名為“19980223_184853_ANTSTEP”。
數據的距離分辨率3 m,HH極化模式,脈沖重復頻率1000 Hz,數據使用了27個相鄰距離門在9-34 s內的雷達回波。數據中配試目標是位于第21距離門的漂浮小船,平均信雜比22.4 dB。區域A為雜波參考(其用IML估計方法估計的參數作為真值),區域B為純雜波數據區域,區域C包含了2%的異常樣本。區域A, B, C的海雜波數據的參數估計樣本數分別為5000, 5600, 2857。由圖4和表1觀察可知,純雜波區域B內,IML估計誤差最小且5種估計誤差區分差別不大,意味著沒有異常樣本情況下,5種估計方法的性能都是可以接受的。而在含異常樣本的區域C內,傳統的IML, MOM24和MOM12估計方法由于對異常樣本敏感,估計值嚴重偏離真值,而提出的三分位點估計相比于BiP估計方法估計性能受影響更小并達到了最好的估計性能。
圖4 IPIX數據庫一組HH極化數據上5種參數估計方法的性能比較
表1 IPIX實測數據(19980223_184853_ANTSTEP)的估計結果
為了更全面地考察估計方法,另選了南非CSIR數據庫[16]的一組X-波段數據進行實驗。
實驗結果如圖5所示,對應的參數估計性能結果如表2所示。圖5(a)為實測數據幅度圖,該數據距離分辨率為15 m,數據的極化方式為VV,數據中配試小船的平均信雜比為19.3 dB,其雷達回波可作為異常樣本檢驗估計方法的穩健性。其中A,B, C區域各包含4600, 6000, 5201個樣本,C區域含約2%的異常樣本。由圖5和表2觀察可知,在純雜波區域B內,IML估計誤差最小且5種估計方法的性能差異不大。而在含異常樣本的區域C內,傳統的IML, MOM24和MOM12估計方法性能急劇下降,提出的三分位點估計在估計穩健性上要優于BiP估計方法并明顯好于傳統估計方法。
表2 南非CSIR實測數據(TFA10_001.01)的估計結果
圖5 CSIR數據庫一組VV極化數據上5種參數估計方法的性能比較
文獻[12]中IML方法在純海雜波下性能最好,但其易受異常樣本影響。而BiP估計方法屬穩健估計方法,但分位點位置的選擇沒有優化,遭受了一些性能損失。提出的方法通過前兩個分位點位置的優化改善逆形參的估計性能,通過第三分位點位置的優化改進尺度參數的性能。實測數據的實驗結果表明:兩個參數的估計性能都得到了改善。
海用雷達目標檢測面臨著復雜的海洋環境,海雜波建模和參數估計是有效目標檢測的基礎。由于不可避免的目標、島礁等雷達強回波對海雜波模型參數估計性能產生了嚴重的影響。本文提出了針對異常樣本存在情況下的海雜波IG-CG模型穩健的三分位點估計方法。該方法通過數值計算和曲線擬合優化分位點位置提高參數估計精度。基于仿真數據和實測數據的實驗結果表明提出的估計方法在存在異常樣本的條件下達到更好的參數估計性能。