周珍娟, 刁聯旺
(1.江蘇開放大學 信息與機電工程學院,南京 211135;2.中國電子科技集團第二十八研究所 信息系統工程重點實驗室,南京 210007)
多傳感器數據融合是將來自各個傳感器的測量數據進行綜合處理,以獲得更加精準、穩定和可靠的融合數據,從而盡可能地減少了多傳感器測量數據經過融合處理可能產生的融合算法誤差。為此在實施進行融合處理之前,需要對各傳感器測得數據的真實性和可信性進行判定,即通過建立不同傳感器測量數據間的一致性判定函數表達式,從而判明這些測量數據中的一致性并將允許它們參與融合處理過程。文獻[1]對多傳感器一致性數據融合算法的發展現狀及存在的主要不足進行深入探討。文獻[2]借鑒信息質量的概念,基于傳感器測量精度分級對一致性數據融合算法進行了一定的改進。文獻[3]首先運用模糊集理論構造了測量數據間的相關性隸屬度函數,用以度量各傳感器測量數據間的相互支持程度并據此對其這些測量數據進行排序,然后將其中支持度較低的測量數據判定為異常數據予以剔除,最后彩遞推最小二乘算法對保留下來的各個傳感器測量數據進行融合以獲得更精確的結果。文獻[4]基于截尾正態分布的統計性質定義了多傳感器測量數據間的不一致性,提出了一種基于統計加權算法平均的多傳感器數據融合算法。文獻[5]基于嶺回歸分析提出了一種度量多傳感器測量數據相對可靠性的新算法,然后運用改進的最小二乘無偏估計對可靠性較高的測量數據進行融合的統計方法。文獻[6]用傳感器的測量精度建立了一種新的模糊支撐函數,并用該函數表示傳感器測量數據的可靠性并用其確定測量數據的權重,最后采用線性加權方法融合多傳感器的測量數據。文獻[7]利用多元正態分布的統計特性以及其均值的假設檢驗,提出了一種度量多傳感器的測量數據之間距離的新方法,該方法具有明確的統計意義,十分便于判定測量數據的一致性。雖然國內外學者們對多傳感器一致性數據融合方法進行了大量理論和結合實際的應用研究,但總體上看,現有方法在判定多傳感器測量數據間的一致性時,往往都是把高精度的傳感器測量數據與精度 較低的傳感器測量數據通過建立的各種距離函數求取一致性矩陣,然后根據該矩陣判定各種傳感器測量數據的支持度,以確定哪些數據參與融合處理。這樣的處理方法客觀地講它從方法的原理上就減少了哪些測量精度相對較差的傳感器測量數據參與數據融合處理的可能性,自然喪失了多傳感器數據融合帶來的優勢。本文針對這一問題,運用在線迭代聚類的思想,這樣不僅可以發現不同傳感器測量數據之間的一致性,而且還可以找出“率先”局部融合而形成的“復合傳感器”數據間新的一致性,從而更好地揭示了多傳感器測量數據間存在的深層次一致性,更充分地利用了多傳感器測量數據,這對多傳感器融合系統的實際工程應用具有較高的參考價值。
本節簡單介紹對現有多傳感器一致性融合方法的基本步驟,重點分析了其存在的不足之處。

(1)
式中,i=1,2,…,n;xi是第i個傳感器的測量值,μ為待測量的某一物理特征(如溫度、長度、厚度等)的真值,而σi是第i個傳感器測量誤差的標準差。
多傳感器一致性數據融合研究的重點問題是,當采集到各傳感器的測量結果之后,如何判定這些傳感器的測量數據間是否存在異常數據,即測量數據間是否具有一致性,從而選擇具有一致性的傳感器的測量數據參與融合處理。
現有多傳感器一致性融合方法的基本流程如圖1所示[8-9]。

圖1 多傳感器一致性融合的基本框架
現有的多傳感器一致性數據融合方法的基本步驟是,首先根據距離矩陣求取一致性關系(支持)矩陣R=(rij)n×n,然后根據該矩陣求取各個傳感器的測量數據被其他傳感器測量數據支持的總支持度,從而確立最大傳感器連接組,最后可以采用貝葉斯統計方法、極大似然估計方法以及其它線性/非線性加權方法對最大連接組中的傳感器測量數據進行融合[1-5]。通過分析可以發現此處理方法主要存在以下不足:
1)在確立最大傳感器組時,主要依據的是各個傳感器組包含的傳感器數量,而對傳感器的精度未加考慮。顯然這種不重數量、不重質量的方式是不正確的,例如在3個傳感器測量同一對象時,盡管其中兩個較差的傳感器測量數據具有很高的一致性,但它們卻與三者中最好的傳感器測量數據一致性很低,無疑這兩個傳感器(數量多!)測量數據的融合結果未必比最好但不一致傳感器測量數據更接近于被測真值。
2)在判定多傳感器的測量數據一致性時,通常的做法是基于一致性矩陣進行一次解決問題的決斷,而對部分傳感器測量數據局部融合結果如何未加以分析,仿真試驗結果表明,這是現有多傳感器一致性數據融合方法存在的最大缺陷!比如,在各傳感器測量數據服從正態分布且相互獨立的假定下,可以證明用貝葉斯估計方法得到的融合結果也是服從正態分布的,且該分布的標準差要比參與融合處理的各個傳感器中任何一個傳感器的標準差都要小,實際應用中也發現,若對其中具有一致性的測量數據進行局部的融合,這些融合結果中極有可能與其余傳感器的測量數據通過一致性判定,因而會擴大參與融合處理的傳感器數量,從而能夠提升融合結果的精度,然而這種一致性則由于現有數據一致性一次性判定處理的思維方式所忽略!文獻[7]針對這一問題提出了一定的改進,但仍然未消除由于數據一致性判斷帶來的信息丟失問題。
本文利用在線迭代聚類的方法以判斷不同精度傳感器測量數據間是否具有一致性,該方法通過對多傳感器測量數據的在線迭代判定處理,可以有效地解決判定多傳感器測量數據一致性時發生信息丟失問題。下面首先定義一種度量傳感器測量數據間距離的新方法,該距離中有效地體現了傳感器測量精度的重要作用。
(2)
可見,只有在
(3)
成立時,才拒絕兩個正態分布的均值是不相等的原假設。式中,k1-α/2為標準正態隨機變量的雙側置信水平為α上門限值,通常可取0.05和0.01等。
在進行多傳感器數據融合之前,為了剔除測量數據中的野值,通常需要對獲得的測量數據進行一致性判斷以選擇合適的測量數據參與融合處理,這樣處理可以有效地避免異常數據帶來的融合誤差,因此已經成為工程實踐中的標準做法。在前述假定之下,本文提出如下距離函數dij,以度量傳感器i個和傳感器j的測量數據間的相互支持程度:
(4)
式中,xi,xj是傳感器i和傳感器j的測量值;σi,σj為兩個傳感器對應的標準差。Z表示隨機變量,它服從標準正態分布。
式(4)給出的dij表達式,是可以作為度量兩個傳感器測量數據間的距離的,因為可以證明它滿足距離函數的性質[8],稱之為概率距離。
根據式(4)可以定義判定任意兩個傳感器測量數據間的一致性關系rij,判斷方法如下:
(5)
式中,α為判斷門限值,通常可以取為0.01,0.05和0.1。其中,rij=1表示傳感器i和傳感器j的測量數據具有一致性,可以參與融合處理;否則rij=0表示傳感器i和傳感器j的測量數據是不一致的,因此,兩者的測量數據是不應同時參與融合處理的。
本文提出一種在線迭代聚類的多傳感器一致性數據融合方法,其主要步驟分為:
假定有n個傳感器參與對某一被測對象的測量過程,這n個傳感器的某一次測量獲得的數據分別記為x1,x2,…,xn,各個傳感器測量精度(即傳感器測量誤差的標準差)分別記為σi,i=1,2,…,n;
步驟1:將每一個傳感器的測量數據視為一個類對象,則此時每類中只有一個對象,按式(4)計算傳感器i和傳感器j的測量數據間的距離dij,此時類與類間的距離實際上就是它們各自所包含的類對象間的距離,計算結果可以表示為一致性判斷矩陣,記為D=(dij)n×n;i≠j,i,j=1,2,…,n;


(6)
(7)
將包含傳感器i和傳感器j的兩個類合并成一新的類,不妨稱之為“復合傳感器”(i,j),可以把x(i,j)視為該“復合傳感器”的一次測量結果,該傳感器相應的測量精度為σx(i,j)。并返回步驟1)進行迭代處理;

步驟3:此時將會出現兩種情況,
1)情況1:所有類都歸并到了一個類中,此時所獲得“復合傳感器”將是唯一的“復合傳感器”,因此它的測量結果即為該情形下多傳感器測量數據一致性融合的最終結果;
2)情形2:所有類歸并為m個類(n≥m≥2),此時由于各類中的數據間不再能通過一致性判斷檢驗了,因此最終對獲得的多傳感器測量數據的一致性數據融合結果將會在這m個類中產生,從中選擇融合精度最高者作為該次多傳感器測量數據的一致性融合結果。
從上述的算法描述中可以看出,本文提出的在線迭代聚類的一致性數據融合算法的最大優點是不再把不同測量精度的傳感器測量數據放在一起計算一致性矩陣,并據此作出一次性判斷或分層融合判斷[7],而是根據聚類分析的結果,對能通過一致性檢驗傳感器測量數據,依據數據間的距離大小先進行局部的一致性融合,然后再把局部融合結果作為一個虛擬的傳感器(稱之為“復合傳感器”)測量數據,將其與余下傳感器的測量數據再進行一致性判斷計算,若還有通過一致性檢驗者再進行融合處理,這一通過返復迭代,直至不再具有通過一致性檢驗的數據為止。顯然本文提出的算法對多傳感器測量數據間的一致性判定更符合一致性本質內涵,即不僅可以判斷出原始的n個傳感器測量數據間的顯在一致性,而且還可以發現經過某些局部一致性數據融合后與其它傳感器的測量數據間產生的新一致性,這種潛在一致性的發現可以更充分多傳感器測量數據的效用。另外,由于每次迭代聚類合并產生的新的類對象要與其他類進行一致性判定,還需要重新計算合并后的類間距離,顯然這樣的操作會增加一定的計算量。但好在實際應用系統中傳感器數量通常并不大(一般不超過10個),因此增加的計算量完全是可以接受的。
本節給出一個算例,用以說明本文提出的在線聚類一致性數據融合算法的基本步驟及其優越性。
假定某一多傳感器測量系統由10個傳感器構成,用以測量某一對象的物理特性參數(如距離、溫度等),該對象的真值為1.0,表1給出了此10個傳感器的標準差,用Matlab產生隨機正態分布的隨機數,獲得一次仿真數據結果如表1所示。

表1 10個傳感器的精度指標與測量數據
采用式(4)定義的概率距離可以得到矩陣D為:

可見,傳感器5和傳感器8之間的距離最小(0.050 7)且小于門限值(此例中取0.95),對這兩個傳感器的測量數據用式(6)和(7)進行融合:
x(5,8)=0.9972,σx(5,8)=0.0071
然后將上式結果看作一個傳感器(虛擬的復合傳感器記為S(5,8))的測量數據,此時變成了一個9傳感器的傳感器組,限于篇幅,這里不再給出詳細地計算的過程以及得到的概率距離矩陣,僅列出該距離矩陣中相應的最小概率距離和融合計算結果。
1)可以計算出此時的概率距離矩陣(此時有9個傳感器)中,傳感器4與傳感器6間的距離最小(0.062)且小于門限值0.95,因此傳感器4和傳感器6的測量數據可以進行局部融合:
x(4,6)=1.0108,σx(4,6)=0.0071
將上式計算結果看作是虛擬傳感器S(4,6)的一次測量數據;
2)此時還有8個傳感器,計算出距離矩陣,且可以計算出傳感器2和傳感器3間的距離最小(0.145 9)且小于門限值0.95,因此傳感器2和傳感器3的測量數據可以融合為:
x(2,3)=0.9991,σx(2,3)=0.0035
將上式計算結果看作是虛擬傳感器S(2,3)的一次測量數據;
3)此時還有7個傳感器,通過計算距離矩陣,可以看出傳感器S(2,3)和傳感器S(4,6)間的距離最小(0.265 7)且小于0.95,因此傳感器S(2,3)和傳感器S(4,5)的數據可以融合:
x(2,3,4,6)=1.0014,σx(2,3,4,6)=0.0031
并將其看作虛擬傳感器S(2,3,4,6)的測量值;
4)此時還有6個傳感器,通過計算距離矩陣可以看出傳感器S(2,3,4,6)和傳感器7間的距離最小(0.198 1)且小于門限值0.95,因此傳感器S(2,3,4,6)和傳感器7的測量數據可以融合為:
x(2,3,4,6,7)=1.0015,σx(2,3,4,6,7)=0.003
并將其看作為傳感器S(2,3,4,6,7)的一次測量值;
5)此時還剩下5個傳感器,通過計算距離矩陣可以發現傳感器S(2,3,4,6,7)與傳感器S(5,8)的距離最小(0.6892)且小于門限值0.95,因此傳感器S(2,3,4,6,7)與傳感器S(5,8)的測量數據可以融合為:
x(2,3,4,5,6,7,8)=1.0008,σx(2,3,4,5,6,7,8)=0.0028
并將其看作虛擬傳感器S(2,3,4,5,6,7,8)的一次測量數據;
6)此時還剩下4個傳感器,通過計算距離矩陣,可以發現傳感器1與復合傳感器S(2,3,4,5,6,7,8)間的距離最小(0.9186)且小于門限值0.95,因此傳感器1與復合傳感器S(2,3,4,5,6,7,8)的測量數據可以融合為:
x(1,2,3,4,5,6,7,8)=1.0031,σx(1,2,3,4,5,6,7,8)=0.0024
并將其看作是虛擬傳感器S(1,2,3,4,5,6,7,8)的一次測量值;
7)此時還有3個傳感器,通過計算距離矩陣可以發現傳感器9和傳感器10間的距離最小(0.9494)且小于門限值0.95,因此兩者的測量數據可以融合為:
x(9,10)=1.0038,σx(9,10)=0.0141
并將其看作是虛擬傳感器S(9,10)的一次測量值;
8)此時還有兩個傳感器,通過計算可以得到兩者間的距離為0.163 4小于門限值0.95,因此兩者的數據可以融合為:
x(1,2,3,4,5,6,7,8,9,10)=1.0027,σx(1,2,3,4,5,6,7,8,9,10)=0.0024
對于同樣的數據,若采用最大傳感器支持組的算法,可以得到最大一致傳感器組為:
{S1,S2,S3,S4,S5,S6,S7,S8}
因此可以計算出最終的融合結果為:
x(1,2,3,4,5,6,7,8)=1.0035,σx(1,2,3,4,5,6,7,8)=0.0028
可見其融合結果無論是均值還是標準差都較本文提出的算法獲得的結果要差一些。
用Matlab軟件對表1所示的多傳感器測量系統進行仿真試驗,仿真中一致性判定的門限分別取為0.80, 0.85, 0.90和0.95,對于不同的門限值各進行了100次仿真試驗,并將本文所提算法與文獻[1,4,9]的3種一致性融合算法進行比較,結果列入表2。

表2 三種算法的仿真結果比較
從表2可見,對不同閾值仿真計算結果表明:本文提出的算法可以獲得更好的融合結果。
本文討論了多傳感器測量系統數據融合問題,針對現有多傳感器一致性數據融合方法存在的不足,運用迭代的聚類算法,將具有一致性傳感器組融合結果視為虛擬的復合傳感器測量數據,進行迭代聚類運算,以發現更多的潛在數據一致性,既可避免異常測量數據參與融合處理,又可以提高了融合的準確度,而且也提高了融合結果的精度。本文提出的方法可以應用于多雷達測距系統,也可以應用于工業領域中的多傳感器測量管壁厚度等系統。需要指出的是本文提出的方法需要付出了一定的計算代價,但實際多傳感器測量系統中傳感器數量并不多,增加的計算量不會帶來很大的困擾,是可以接受的。