王 茜 王穎超 曹 菲
1(河北美術學院公共課部 河北 石家莊 050700)2(西安電子科技大學 陜西 西安 710077)
多傳感器系統的主要目標是通過一致和協同的方法將來自多種傳感器的信息結合起來得到一個特定變量在某種環境下更可靠、準確、一致的描述[1-3]。在數據融合的過程中主要涉及幾個關鍵問題,包括數據關聯、傳感器不確定性以及多源信息的管理。對于傳感器測量的不確定性問題,不僅來自于測量的不精確和噪聲,還包括在環境中出現的模糊性和不一致性引起的不確定性。數據融合技術能夠對這些不確定性進行建模,并將多種類型的信息進行融合,得到一個更加可靠、更加準確的結果。
國外對信息融合技術的研究起步較早,其中美國起步最早,發展也最快。20世紀70年代美國康涅狄格大學著名系統科學家Y.Bar-Shalom教授最先提出了概率數據互聯濾波器的概念,這就是信息融合的雛形。1973年,美國研究機構在國防部的資助下,開展了聲納信號理解系統的研究,推動了信息融合理論和方法的發展。自此,信息融合技術的應用引起了越來越多的重視,以軍事應用為主的信息融合技術研究在全世界范圍內迅速發展起來。20世紀70年代末,在公開出版的技術文獻中開始出現多傳感器信息融合的研究。1985年美國JDL下設的C3I技術委員會成立了信息融合專家組,專門組織和指導相關技術的研究。1988年,美國國防部把信息融合技術列為重點研究和開發的20項關鍵技術之一,且為最優先發展的A類。20世紀80年代以來,美國相繼研究開發了基于信息融合技術的各種軍用系統,這些系統后來不同程度地發揮了作用,特別是在海灣戰爭中對導彈攔截發揮了重要作用。迄今為止,世界上大多數國家都開展了信息融合技術的研究,并取得了大批的研究成果。
隨著系統論、控制論和信息論等基礎理論以及計算機技術、網絡技術、通信技術和高效傳感器技術等的快速發展,信息融合技術得到了前所未有的發展。1998年成立的國際信息融合學會每年都舉辦一次信息融合國際學術大會,系統地總結該領域的階段性研究成果以及介紹該領域的最新進展。美國三軍信息融合年會、SPIE傳感器融合年會、國際機器人和自動化會刊以及IEEE的相關會議和會刊等每年也都進行相關技術的專門討論。
國內關于信息融合技術的研究起步較晚,20世紀80年代初,國內開始從事多目標跟蹤技術的研究,到了20世紀80年代末才開始出現有關多傳感器信息融合技術的研究報道。進入20世紀90年代以來,這一領域在國內逐漸形成高潮。近年來信息融合技術在國內已發展成為多方關注的共性關鍵技術,在較為廣泛的理論及應用研究的基礎上,相繼出現了一批多目標跟蹤系統和具有初步綜合能力的多傳感器信息融合系統。
目前已有文獻中有許多可用的技術用于傳感器有效性的驗證和不一致數據的識別,它們中的大部分都是針對特定的故障模式進行建模,然而要對所有的故障模式都進行建模并不現實。為了檢測出數據的不一致,一般需要提供余度數據或者先驗信息。有學者已經成功地利用Nadaraya-Waston估計器[4]和先驗觀測來驗證傳感器測量的有效性。此外,一些學者還提出了基于模型的卡爾曼濾波方法[5-7]、基于協方差的方法[8]、基于概率的方法[9]、基于模糊邏輯的方法[10-11]以及基于神經網絡[12]的方法。這些方法有些依賴于模型,而另一些方法需要復雜的調參和訓練過程。
傳統的基于貝葉斯方法的信息融合技術,因其提供了一種將先驗信息和當前實驗得到的信息結合起來的良好的架構,因此被廣泛應用,但是該方法不能夠識別偽數據,因此在傳感器測量值存在偽測量時融合結果不理想。針對這個問題,文獻[13]結合了貝葉斯估計和熵理論,提出了一種基于后驗概率熵的偽數據識別和信息融合方法,并通過仿真實驗驗證了所提方法的有效性。
貝葉斯推理是一種基于貝葉斯理論的統計數據融合算法,得到測量或觀測值Z后,根據條件概率或者后驗概率估計n維狀態向量X。觀測值Z中包含的概率信息由概率密度函數p(Z|X)表示,即似然函數,也就是傳感器的模型。似然函數表征后驗概率密度可能發生變化的程度,一般通過離線試驗或者可用信息確定。如果在得到測量信息之前,能夠獨立得到關于狀態向量X的先驗概率P(X=x),那么似然函數能夠得到更準確的結果。根據貝葉斯理論,可以得到狀態向量X的后驗概率密度:
(1)
式中:P(Z=z)為傳感器測量值為z的概率,只與測量值有關。因此,通過最大化后驗概率密度(Maximum a posteriori,MAP),可以得到狀態向量X的最大化后驗概率估計:

(2)

(1) 在集中式融合方案中,所有傳感器的信息同時進行融合,可通過式(3)使用貝葉斯方法融合來自n個傳感器的數據:
p(Z=z1|X=x)p(Z=z2|X=x)…p(Z=zn|X=x)
(3)
(2) 分布式融合方案,采取分步逐級融合的策略,將上一次融合的結果作為下一次融合的先驗信息。同樣地,分布式貝葉斯方法可以通過下式實現信息的融合:
(4)
由于傳感器故障、受到外部干擾或者多徑效應,傳感器經常會輸出偽數據。上文描述的貝葉斯方法不能夠處理這些偽數據,因為該方法沒有能夠識別來自傳感器的數據是否可用的機制。如果融合了這些偽數據將會得到不準確的估計結果。下面將推導考慮測量值不一致的基于貝葉斯方法的多源信息融合策略。
在構建傳感器隨機模型時,通常這些偽數據都會事先被識別并剔除。因此,通過實驗得到的傳感器模型只表征由于噪聲引起的不確定性。假設事件si=0表示第i個傳感器的數據是非偽數據,si=1表示第i個傳感器的數據是偽數據,那么通過這個方法得到的傳感器模型實際上表示分布p(Z=zi,|X=x,si=0)。根據貝葉斯理論,在真實狀態x和測量值zi已知的條件下,傳感器的測量值為非偽數據的概率密度為:
p(si=0|X=x,Z=zi)=
(5)
式中:P(si=0)為傳感器i輸出非偽值的概率,可根據實驗確定。等式右部分母可通過遍歷si的取值{0,1},累加化簡,因此式(5)可重寫為:
(6)
或:
(7)
將式(7)代入式(3)可得到集中式融合方案的后驗概率分布:

(8)
比較式(8)和式(3)發現,分母中多出了p(si=0|X=x,Z=zi)這些項。這些項將改變相應傳感器測量值協方差的大小,如果來自第i傳感器的測量值具有較高的概率為偽數據,那么該傳感器測量值的協方差將會變大,從而在融合時給予較小的權值,反之成立。
同理可得到分布式融合方案的后驗概率分布:
(9)
式中:p(si=0|X=x,Z=zi)同樣會影響傳感器測量值的協方差。后驗概率的協方差表征了根據測量值估計狀態量的不確定度,方差越大表示估計不確定度越高,即估計的效果越不好;反之,估計方差越小不確定度越低,估計效果越好。而后驗概率方差的增減可通過信息熵來衡量,信息熵表示變量的不確定度,大的信息熵表明不確定較大,因而信息量少。當融合一個新的可靠的測量值時,熵應該是減少的,否則可能是偽數據。因此文獻[14]基于信息熵的增減提出了一種識別傳感器偽數據的方法。
變量X的信息熵計算公式為:
(10)
式中:P(x)表示變量X=x的概率;E(·)表示對變量求期望。
對于連續的隨機過程,將X的范圍平分成寬度為δx的離散線段,那么概率密度函數將會形成一系列的直方圖,x等于某個特定值的概率近似為p(x)δx,式(10)的離散化結果為:
(11)
對δx取極限δx→0,得到連續隨機過程的熵:
(12)
因此,式(9)后驗概率的熵為:
(13)
融合前后的熵增量為:
(14)


(15)
為了避免積分的運算,采用式(10)的離散化形式:
(16)
式中:p(x,z)為變量X、Z的聯合概率密度。
同理得到:
(17)
由式(16)和式(17)得到互信息I(X:Z):
I(X:Z)=H(X)-H(X|Z)=
(18)
該值表征了融合后熵的減少量,即信息的增加量。取極限δx→0、δz→0,得到:
(19)
假設變量X、Z滿足高斯分布,那么其聯合分布也滿足高斯分布。
(20)
(21)

(22)
根據式(22),如果融合后的方差大于融合前的方差,那么互信息I<0,表明融合后系統從測量值中得到關于狀態量的信息量是減少的,因此該測量值可能是偽數據。反之,如果融合后的方差小于融合前的方差,那么互信息I>0,表明融合后系統從測量值中得到關于狀態量的信息量是增加的,因此該測量值是正常值。
如果不考慮傳感器數據中的偽數據,N個模型由以下高斯似然函數給出:
(23)
式中:k=i表示第i個傳感器。由貝葉斯原理可得到融合的最大后驗估計為:
p(Z=z2|X=x)p(Z=z3|X=x)]
(24)
多個高斯分布進行融合,其后驗概率分布為聯合高斯分布,均值和方差分別為:
(25)
(26)
因此,如果沒有可用的關于變量X先驗信息用于估計,那么n個高斯分布的貝葉斯融合結果即為N個傳感器數據按照標準差的加權平均。由式(26)可知融合后的分布標準差要小于N個獨立分布任一分布的標準差,這表明通過融合估計結果的不確定性降低了。
如果考慮傳感器測量的偽數據,那么高斯傳感器模型為:
(27)
在真實狀態x和測量值zk給定的條件下,第k個傳感器測量值為非偽數據的概率按照文獻[13]給出:
(28)
選擇這一函數的依據是:當測量值zk等于真實狀態x時,該概率為1,隨著測量值遠離真實狀態,該概率逐漸減小。參數ak依賴于模型參數以及該傳感器的輸出與其他傳感器輸出的偏差。
3.2.1集中式融合方案(方法2)
根據式(8)得到考慮偽測量值的集中式融合方案的后驗分布為:
(29)
式(28)中的參數ak設為:
(30)
將式(30)代入式(29)得到:
(31)
參數bk滿足:
(32)
滿足式(32)可以確保式(31)仍然是高斯分布,因此只有一個峰值。由式(31)可知,如果某個測量值與其余測量值距離較大,就會增大該獨立分布(表征從該測量值得到的置信)的方差。因此,如果兩個測量值彼此很接近,那么分配給這些測量值的權值就會增加。
集中式融合方案的最大后驗估計的均值和方差分別為:
(33)
(34)
3.2.2分布式融合方案(方法3)
在分布式或者序貫融合方案中,先融合兩個傳感器的測量值,然后將融合結果與第三個傳感器的測量值進行融合,以此類推直到完成所有測量值的融合。根據式(35)融合第1個傳感器和第2個傳感器的信息:

(35)
將式(28)中的參數ak設為:
(36)
(37)
式中:m為測量偏差的最大期望值。代入式(35),得到:
(38)
根據第2節基于互信息的偽數據識別方法判斷這兩個測量值中是否存在偽數據。如果互信息大于0,表明這兩個測量值都是正常的,其融合結果將與第3個測量值進行融合,融合結果將作為下一步融合的先驗值。如果互信息小于0,則表明至少存在一個偽數據,進一步分別評估這兩個傳感器與第3個傳感器的融合結果,如果兩個組合中有一組的互信息是大于0而另一組小于0,則可確定只有一個偽數據且為互信息小于0那組中的測量值,正常測量值將和第3個測量值融合得到一個估計值;如果都小于0則表明至少存在兩個偽觀測值,且前兩個必定為偽觀測值,以此類推。

(39)
(40)
分布式融合方案的最大后驗估計的均值和方差分別為:
(41)
(42)
為了驗證本文所提出的方法能夠識別傳感器測量產生的隨機偽數據,本文在仿真實驗中首先比較了上述三種方法處理數據不一致問題的性能,其中方法1是簡單的貝葉斯融合方法,沒有考慮數據的不一致性,直接利用式(25)對三個測量值求加權平均。方法2和方法3都考慮了測量值的不一致性。其中:方法2采用集中式融合方案,利用式(33)根據測量值之間的差值動態調整各測量值的權重;而方法3采用分布式融合方案,根據互信息判斷測量值是否為偽數據,如果是偽數據就將該測量值剔除,利用式(41)進行融合。然后將3種方法與基于協方差和基于置信準則的多傳感器數據融合算法進行了比較。
仿真中模擬了三個高斯分布傳感器的情形,各傳感器性能參數如下:


真實狀態值為:x=20。
產生仿真數據時,傳感器1在98%時間工作正常,產生均值為20、方差為4的正態分布的數據,在2%的時間里產生均值為30、方差為4的正態分布的數據(偽測量值)。傳感器2在90%時間工作正常,產生均值為20、方差為6.25的正態分布的數據,在10%的時間里產生均值為35、方差為6.25的正態分布的數據。傳感器3在80%時間工作正常,產生均值為20、方差為9的正態分布的數據,在20%的時間里產生均值為38、方差為9的正態分布的數據。由于三個傳感器中期望測量的最大值最小值分別為38和20,因此傳感器測量值的最大期望偏差m=38-20=18。
圖1(a)展示了三種傳感器測量值基本一致的測試結果。由圖1(a)可知,根據三種方法得到的后驗概率分布得到相同的后驗概率分布。這說明三種方法對于沒有偽數據時的估計結果是相同。圖1(b)-(d)展示了三個傳感器中有一個傳感器的測量值明顯偏離其他兩個測量值時的測試結果。從這三幅圖中可以看出:方法1由于沒有考慮偽觀測值的影響,估計結果偏離真實值;方法2考慮了偽觀測值的影響,給偏差較大的測量值賦予了較小的權值,得到的結果稍優于方法1;方法3識別并剔除了偽測量值,因此融合結果更接近真實值。

(a) 三個傳感器數據一致的后驗概率分布

(b) 傳感器1的測量數據偏離真值的后驗概率分布

(c) 傳感器2的測量數據偏離真值的后驗概率分布

(d) 傳感器3的測量數據偏離真值的后驗概率分布圖1 多種數據點的實驗結果
此外,利用上述的方法產生了10 000個數據點,并分別利用三種方法和基于協方差和基于置信準則的多傳感器融合算法進行融合,實驗結果如表1所示。由表1可知,方法3的均值最接近真實值,方法2和方法1次之,基于協方差和基于置信準則的算法誤差較大。和方法1相比,方法3減少了均方根誤差約28%,方法2減少了均方根誤差約20%。

表1 算法的均值和均方誤差比較
圖2展示了上述10 000個數據點中的100個樣本點。可以看出,總體上,方法3的融合結果最接近真實值。這是因為方法3具有上文所述的識別和消除偽數據的內部機制,這是通過比較其中一個傳感器與其他兩個傳感器的差值來實現的。但是當3個傳感器中同時有兩個傳感器產生相近的偽數據時,該方法失效,因為其錯誤地將第三個傳感器的數據識別為偽數據。圖2還展示了該點的具體融合結果。傳感器2和傳感器3都同時產生偽數據,但是,由于它們相互接近,方法3反而將傳感器1的的測量值當成了偽數據,并從融合結果中剔除了該測量值,從而產生了錯誤的估計。同樣地,方法2對傳感器2和傳感器3的測量值賦予了較大的權值,同樣產生了不準確的結果。然而,在實際中同時發生兩個偽數據的可能性是很低的,因此可忽略這種情況,基于協方差算法和基于置信準則的方法,由于不能夠識別偽數據,因此獲得的融合結果不理想。

圖2 10 000個數據的實驗結果
為了避免求熵的積分計算,本文提出利用最大后驗概率的互信息作為檢測量的方法識別偽數據。比較三種方法:方法1基于簡單的貝葉斯融合;方法2增加了上述的置信因子并采用集中融合的方式;方法3分步地融合傳感器數據,并識別剔除偽數據。最后通過仿真實驗測試了上述三種方法,實驗結果表明:方法3識別偽數據的效果最好,因為偽觀測值的剔除保證了更準確的結果。方法2要優于方法1,因為該方法存在一種內部機制,該機制會給一致的數據賦予較大的權值而對于偽數據會賦予較小的權值。該方法可用于導航領域,將多個導航傳感器的信息進行融合得到更加可靠更加精確的導航參數。