(空軍工程大學信息與導航學院,陜西西安710077)
基于信息幾何理論的信號檢測方法
鄒 鯤,吳德偉,李 偉
(空軍工程大學信息與導航學院,陜西西安710077)
信息幾何理論將統計推斷問題轉換為幾何問題進行處理,從而能夠從幾何的角度分析進行統計推斷。以高斯噪聲下的信號檢測為研究對象,給出了基于信息幾何理論的信號檢測所需的理論基礎,分析了測地線距離與檢測器性能之間的關系。分別以簡單假設和復合假設兩種情況,分析了兩種距離檢測器的性能,并與Neyman-Pearson檢測器和廣義似然比檢測器進行了對比。計算機分析結果表明,測地線長度和方向共同決定了檢測性能,且距離檢測器性能與似然比檢測器性能相當。
信息幾何;測地線;距離檢測器;信號檢測
信號檢測問題是統計信號處理領域的重點問題[1],其本質是依據待檢測信號統計分布與備擇假設(H1)、零假設(H0)所指定的統計分布之間的差異,并進行判決。從信息幾何理論的觀點來看,將統計模型中的每一種分布看成統計流形上的一個點,其坐標與統計分布的參數一一對應。統計流形的幾何結構與相應的分布性質有關。在一定條件下,還可以在該流形上建立微分結構,從而通過微分流形來研究分布的統計性質。這種思路早在1945年Rao[2]就提出來了,并建議采用Fisher信息矩陣定義流形上的Riemann度量,但直到1975年Efron[3]提出了統計曲率的概念,特別是1982年Amari[4]定義了單參數族的聯絡之后,才使得微分流形的理論與方法逐步與統計領域相結合,即所謂的信息幾何(Information Geometry)理論[5]。信息幾何理論將微分幾何方法解決信息領域問題,并成功應用于統計推斷、神經網絡、信號處理、量子理論、控制理論等方面[6]。近年來提出的矩陣信息理論[7]則可以應用于雷達信號處理[8]、流形學習[9]、系統的穩定性和最優化[10]、圖像處理[11]。
噪聲中的信號檢測問題屬于數學上的統計推斷問題。從信息幾何的角度來看,信號的檢測問題可以轉換為統計流形上的距離問題[12],為此可以引入散度作為距離函數,用來測量流形上兩點之間的差異。其中Kullback-Leibler散度(KLD)經常被用來測量統計流形上兩點的差異[13],KLD計算簡單,但該散度僅僅滿足距離函數的非負性,不滿足對稱性和三角不等式。微分幾何理論指出,測地線是內蘊幾何量,流形上兩點之間的測地線長度表示了流形上兩點之間的最短距離。因此基于信息幾何的信號檢測的核心問題是在給定了Fisher度量和Levi-Civita聯絡的定義,計算統計流形上的測地線長度。若給定該統計流形上的一個點,以及該點處的切向量,可以得到一條測地線方程[14]。以多元正態分布為例,計算測地線長度并不容易,目前還沒有統一的計算公式,一種可行的辦法就是用Siegel距離替代[15],該距離長度是測地線長度的下限。
雖然測地線長度大小衡量了兩種分布之間的差異,但還需建立與檢測性能之間的關系。為此本文分析了檢測器性能與測地線長度之間的量化關系,分析結果表明檢測器性能不僅與測地線長度有關,還與測地線方向有關。對于二元假設檢驗問題,距離檢測器與似然比檢測器相當。
信息幾何理論中,對于參數化統計分布族:

如果在S與Θ之間存在一一對應關系,這種一一對應關系使得在S上誘導出與Θ同胚的拓撲結構。如果在S上任取一點P=p(x,θ)以及在P的一個鄰域U,定義U到的映射φ:φ(P)=θ。此時鄰域U是S的一個覆蓋,映射φ是一個微分同胚映射,這樣就可以在S上建立一個微分結構,因而S形成了一個n維微分流形,其坐標為θ。
在統計流形S上點P處的切空間T P(S)是一個n維向量空間,其本質上就是S在P點處的線性近似。流形上的度量張量有切空間T P(S)的內積決定,切空間內積的定義具有隨意性,但在統計流形上引入Riemann度量有利于統計問題的研究,即度量張量與Fisher信息矩陣一致。從某種意義上的不變性而言,Fisher信息矩陣是唯一適合的Riemann度量。Fisher信息矩陣定義為

式中,E[·]表示按照分布p(x,θ)取期望。考慮流形S上任意曲線c(t)=c(θ(t)),t∈[a,b],其中θ(a)=θ0,θ(b)=θ1。曲線的弧長可以表示為

那么刻畫p(x,θ0)和p(x,θ1)兩種分布的差異可以用連接S上θ0點和θ1點最短弧長表示:

其對應的曲線就是測地線,測地線應該滿足方程:


測地線具有良好的距離測度的性質,即滿足對稱性、非負性和三角不等式。但測地線的長度計算并不容易,為此常常采用KLD作為測量兩種分布的差異[16],其也稱為相對熵:

但需要指出的是,KLD并不滿足對稱性和三角不等式。為此可以考慮采用平均KLD來滿足距離測量的對稱性:

本文考慮高斯統計模型,那么對應的統計流形可以表示為

具有相同均值的測地線距離:

式中,λi為方程det(M0-λM1)=0的根。該公式可以用于雷達信號的CFAR檢測[16-17]。
具有相同方差的測地線距離:

該距離也稱之為Mahalonobis距離,該距離可以應用于多目標跟蹤問題。
對于一元高斯統計模型,測地線距離[14]可以表示為

利用式(7)可以得到KLD的表達式:

需要指出的是,KLD不具備對稱性,可以利用式(8)得到具有對稱性的KLD。
從前面的分析可以看出,可以用統計流形上兩個點之間的距離衡量兩種分布之間的差異。從檢測理論可知,對于二元假設檢驗,如果兩種假設下的統計分布差異越大,對應的檢測性能也就越好。因此有必要討論測地線距離與檢測性能的關系。本文以一元高斯下的檢測為例,考慮如下檢測問題:

即假定兩種假設分布都是一元高斯分布,均值和方差不相同。采用Neyman-Pearson準則,檢測器的性能可以表述為給定第一類錯誤概率Pf=P(H1|H0)條件下,使得檢測概率Pd=P(H1|H1)最大。由此可以得到似然比檢測器:

式中:

門限γ與指定的第一類錯誤概率Pf有關。可以看出,檢測概率Pd與兩種假設下的分布參數有關,一般情況下,可以采用計算機仿真計算得到。而利用式(12)可以得到兩種分布之間測地線距離,利用式(13)可以得到兩種分布的KLD距離。由此就可以建立統計流形上兩點的距離與檢測性能之間的關系。
圖1給出了參數空間(μ,σ)上的等測地線距離圓。在參考空間內取點A(0,1),給出了與該點距離為0.5,1,1.2三種等距離圓。從圖中可以看出,等距離圓在均值參數方向是對稱的,而在標準差參數方向是非對稱的。以距離A點測地線距離為1時,取B,C兩點,這兩點具有相同的均值參數,但方差不同,如圖1所示。可以看出,雖然在參數空間上,BA的距離小于AC的距離,但在測地線距離上卻相等。也就是說,從測地線距離的角度來看,B點處的分布與A點處的分布之間的差異等同于C點與A點分布之間的差異。

圖1 參數空間內的等測地線距離圓
接下來考慮在等測地線距離圓上的檢測性能。在這里考慮兩種距離,一種為Fisher測地線距離(FID),一種為平均KLD距離(KLDavg)。并考慮與點(0,1)相距D=3的等距離圓,如圖2(a)所示,可以看出KLD與FID在標準差小于1的區域較為接近,而在標準差大于1的區域,兩者差異較大。這是因為KLD并不是流形上兩點之間的真實距離。沿等距離圓,利用式(15)可以估算檢測器性能。這里取第一類錯誤概率Pf=10-3,仿真次數為105。在整個圓周上的檢測概率Pd如圖2(b)所示。可以看出,在不同方向上,檢測性能是不一樣的。這說明,統計流形上兩點之間的距離即便相同,對應的檢測性能可能存在顯著差異。因此流形上兩點之間的距離與檢測器性能之間不是一一對應的。

圖2 相同距離條件下的檢測性能
最后分析具有相同檢測性能時,對應的參數空間內均值和方差所滿足的條件。分析結果如圖3所示。仿真參數同前,分別考慮了檢測概率為0.1~0.5幾種情況下的參數分布情況。可以看出,距離A(0,1)點越遠,檢測概率越大,這種趨勢與測地線距離類似。但是對比圖1和圖3可知,具有相同檢測性能的參數顯然不屬于同一測地線距離圓上。由此可以得出,檢測性能雖然與測地線距離的大小有關系,但并不是一一對應的,而與測地線的方向有關系。
對于具有相同方差的簡單二元假設檢驗問題:

這是二元假設檢驗問題公式(14)的特例,由于所有參數均已知,似然比檢測性能可以表示為

式中,函數Q是正態累計密度函數:

圖3 具有相同檢測性能的參數分布

基于信息幾何理論,可以將簡單二元假設問題考慮為參數空間為(μ,σ)統計流形上的兩個點,分別對應P0=(μ0,σ)和P1=(μ1,σ)。利用觀測數據x可以得到流形上對應的估計值點P=(x,σ),距離檢測器就是判定P與P0和P1之間的距離差。為此構造如下的距離檢測器:

式中,d,d1,d0分別對應了P0與P1之間的距離、P與P1之間的距離、P與P0之間的距離。距離計算值采用FID或KLD計算。
利用式(18)和式(20)可以對比分析兩者檢測性能,分析結果如圖4所示,其中信噪比(SNR)的定義為

可以看出,兩者的檢測性能完全一致。由此可以得出,基于信息幾何理論得到的距離檢測器,其檢測性能與似然比檢測性能相當。這是因為在給定方向上,流形上的距離大小與檢測性能存在正比關系。
對于復合二元假設檢驗問題,假定式(17)中μ1參數是未知的,此時可以采用廣義Neyman-Pearson準則,即采用廣義似然比獲得似然比檢測器:


圖4 簡單二元假設的檢測性能對比
容易得到其檢測性能為

式中,函數f(·,δ)是自由度為1且非中心參數為δ的χ2累計概率密度函數。基于信息幾何理論,由于H1下的參數是未知的,因此距離檢測器退化為

即判定P與P0之間的距離大小,依據該距離的大小實現對假設檢驗問題的判決。
兩種檢測器性能分析結果如圖5所示。可以看出,兩種檢測器的檢測性能是相當的,說明采用基于信息幾何理論的距離檢測器也可以達到似然比檢測器的性能。

圖5 復合假設下的檢測性能對比
信息幾何理論的核心問題是將微分幾何方法應用于統計推斷,本文主要考慮基于信息幾何理論的假設檢驗問題,其關鍵在于確定統計流形上的兩點之間的距離,并建立距離測度與檢測性能之間的量化關系。通過分析表明,距離大小與檢測性能并不是一一對應的,但是在給定測地線方向時,距離的大小與檢測性能的高低是相關的,因此可以將距離測度應用于信號的檢測。最后給出了簡單假設和復合假設兩種情況,分別構造了距離檢測器,其檢測性能與似然比檢測性能相當。
[1]KAY S K.Fundamentals of Statistical Signal Processing:Volume II Detection Theory[M].Upper Saddle River,NJ:Prentice Hall,1998:125-196.
[2]RAO C R.Information and the Accuracy Attainable in the Estimation of Statistical Parameters[J].Bulletin of the Calcutta Mathematical Society,1945,37(3):81-91.
[3]EFRON B.Defining the Curvature of a Statistical Problem(with Applications to Second Order Efficiency)[J].The Annals of Statistics,1975,3(6):1189-1242.
[4]AMARI S.Geometrical Theory of Asymptotic Ancillarity and Conditional Inference[J].Biometrika,1982,69(1):1-17.
[5]AMARI S.Information Geometry and Its Application[M].Tokyo:Springer,2016:315-353.
[6]孫華飛,張真寧,彭林玉,等.信息幾何導引[M].北京:科學出版社,2016:1-8.
[7]NIELSEN F,BHATIA R.Matrix Information Geometry[M].Berlin:Springer,2013.
[8]FAN H,JIANG Y,KUANG G.Target Detection in Non-Stationary Clutter Background and Riemann Geometry[J].IET Radar,Sonar and Navigation,2014,8(4):376-381.
[9]RASKUTTI G,MUKHERJEE S.The Information Geometry of Mirror Descent[J].IEEE Trans on Information Theory,2015,61(3):1451-1457.
[10]LI W,JIA Y.Kullback-Leibler Divergence for Interacting Multiple Model Estimation with Random Matrices[J].IET Signal Processing,2016,10(1):12-18.
[11]PEREYRA M,BATATIA H,MCLAUGHLIN S.Exploiting Information Geometry to Improve the Convergence of Nonparametric Active Contours[J].IEEE Trans on Image Processing,2015,24(3):836-845.
[12]華小強,王平,高穎慧,等.基于信息幾何的圖像去噪[J].計算機工程與科學,2015,37(3):589-593.
[13]趙興剛,王首勇.雷達目標檢測的信息幾何方法[J].信號處理,2015,31(6):631-637.
[14]CALVO M,OLLER J M.An Explicit Solution of Information Geodesic Equations for the Multivariate Normal Model[J].Statistics and Risk Modeling,1991,9(1-2):119-138.
[15]CALVO M,OLLER J M.A Distance Between Multivariate Normal Distributions Based in an Embedding into the Siegel Group[J].Journal of Multivariate Analysis,1990,35(2):223-242.
[16]王剛,劉智,王番,等.基于KL距離的SAR影響變化檢測[J].雷達科學與技術,2012,10(1):59-63.WANG Gang,LIU Zhi,WANG Fan,et al.A Change Detection Method of SAR Image Based on Kullback Leibler Divergence and Morohology[J].Radar Science and Technology,2012,10(1):59-63.(in Chinese)
[17]BARBARESCO F,BRION V,JEANNIN N.Radar Wake-Vortices Cross-Section/Doppler Signature Characterisation Based on Simulation and Field Tests Trials[J].IET Radar,Sonar and Navigation,2016,10(1):82-96.
Signal Detection Method Based on Information Geometry Theory
ZOU Kun,WU Dewei,LI Wei
(School of Information and Navigation,Air Force Engineering University,Xi’an710077,China)
Based on the information geometry theory,the statistical inference can be transformed into the geometry problem,and hence,can be realized from a geometric perspective.In this paper,we consider the signal detection in Gaussian noise,and provide the fundamentals necessary for signal detection based on the information geometry theory.The relationship between the geodesic distance and the detection performance is analyzed.The two distance detectors are analyzed for simple hypothesis and compound hypothesis respectively.The computer analysis results indicate that the detection performance is determined by the geodesic distance and orientation,and the detection performance of the distance detector is comparative to the likelihood ratio detector.
information geometry;geodesic line;distance detector;signal detection
TN957.51
A
1672-2337(2017)02-0120-06
10.3969/j.issn.1672-2337.2017.02.002
2016-07-02;
2016-11-20
國家自然科學基金(No.61571456);陜西省自然科學基金(No.2016JM0644)

鄒 鯤男,1976年出生,湖北黃岡人,博士后,副教授,主要研究方向為統計信號處理、認知雷達信號檢測與估計。E-mail:wyyxzk@163.com

吳德偉男,1963年出生,吉林吉林人,教授、博士生導師,主要研究方向為導航信息技術。

李 偉男,1978年出生,山東濟寧人,博士,副教授,主要研究方向為MIMO雷達信號處理。