戰希臣,楊睿英
(中國人民解放軍海軍航空大學 航空基礎學院,山東 煙臺 264001)
目前,信息融合已經成為提升裝備質量信息可用性的關鍵環節。影響裝備質量的因素復雜多樣,其中基因要素對裝備質量特性的形成具有決定性作用。質量基因要素是指在裝備全壽命周期中,對裝備質量產生決定性作用且具有一定遺傳特性的一系列關鍵指標[1]。在裝備全壽命周期某階段提取的基因要素信息具有樣本多、來源復雜等特點,要充分且高效利用好這些信息,就需要用到信息融合的技術。
信息融合技術按融合層次可分為數據級融合(像素級融合)、特征級融合以及決策級融合三大類[2]。其中,特征級融合是從傳感器測得的原始數據中提取出特征信息,然后對這些特征信息進行分析與融合處理,最后將融合得到的信息送到決策層提供決策依據。特征級融合的優點在于實現了可觀的信息壓縮,有利于實時處理。它介于數據級融合與決策級融合之間,具有較大的靈活性,因而得到了廣泛應用[3]。本文的研究基于系統聚類的裝備質量基因要素信息融合方法,屬于特征級融合。
系統聚類法,又稱為分層聚類法。該方法是先將每個樣本單獨看成一類,在規定類間距離的條件下,選擇距離最小的兩個樣本(類)合并成一個新類。計算新類與其他類的距離后,繼續將距離最近的兩個類合并。不斷重復這個步驟,每次都會減少一個類,直到所有樣本合并為一個類為止。使用系統聚類法進行數據融合,即是在系統聚類的每個階段聚類中,將合并的類對應的樣本數據通過一定的算法進行融合,從而構建信息融合模型。
假設有m 個傳感器(樣本),收集n 個指標數據,則第i 個樣本的指標數據可表示為Xi=(xi1,xi2,…,xin)T,可將每一個樣本Xi看成一個類Gi(i=1,2,…,m)。對于各類的類間距離,可以用歐式距離dij來表示:

從而得出初始的距離矩陣D(0),該矩陣為對角線元素均為0 的對稱矩陣

首先,得到距離矩陣D(0)后,按照最小距離法,選擇其中最小的距離(除0 元素外),例如,其中dab為最小距離(a,b=1,2,…,m),它是Ga,Gb之間的歐式距離。則將Ga,Gb合成新類Gm+z,(z 表示并類次數,如第1 次并類z 取1)在原來的類Gi(i=1,2,…,m)中去掉Ga,Gb,并加入Gm+z。
其次,按照模型(1),計算新類之間的類間歐式距離。由于Gm+z是Ga,Gb合成的,計算該類與其他類的距離時,應分別計算Ga,Gb與其他類距離,并取較小值,作為Gm+z與其他類的距離,并得到新的距離矩陣D(1)。而后將D(1)中最小距離對應的兩個類合并,并計算新的距離矩陣D(2),不斷重復此合并類的步驟,直到最終所有類歸為一個類。
最后,將每一次合并步驟中選擇的最小距離,作為合并系數,形成每次合并的類。每一次類的合并可對應類中樣本數據的一次融合過程[4],如Ga,Gb合并成Gm+z,相對應可將Xa,Xb進行數據融合,得到新的樣本數據Xm+z,融合算法采用一致性融合算法[5],模型為:

其中,x(m+z)k是樣本Xa,Xb融合成的新樣本Xm+z的第k 個分量。σa,σb分別是傳感器a 和b 測量誤差的標準差。σm+z可以視為傳感器a 和b 融合以后形成的“融合傳感器”的測量誤差標準差。
以某型裝備使用階段的質量基因要素為例,說明用系統聚類方法進行質量基因要素信息融合的過程。以該裝備動力系統某模塊為例,該模塊測試參數一共有5 個,分別為燃油油針位置參數、高壓壓氣機出口總壓、高壓轉子轉速、組合信號、電點火裝置測試。收集6 個傳感器的測試記錄,如表1 所示。

表1 某裝備動力系統模塊質量測試參數
該例中的6 個傳感器測試樣本分布為:X1~X6,其中X1=(1.348,0.547,0.003,2.402,1.924)T,傳感器1 的精度σ1=0.05,其余樣本的數據也均可以從表1 得出。將這些樣本視為6 個類,即G1~G6,根據表1 的數據,按式(1)計算各類間歐氏距離,得到距離矩陣D(0):

由該矩陣,類間最小距離為d16=0.018 7,于是將G1與G6合成新類G7={G1,G6},在原來的類G1~G6中去掉G1,G6并加入G7,形成新的類G2,G3,G4,G5,G7,并計算類間歐氏距離得到距離矩陣D(1)。
繼續按照這個步驟計算,最終可以將所有類合并為一個大類。該計算過程可使用軟件SPSS 進行,該軟件是IBM 公司推出的一款集統計分析、數據挖掘、決策支持等功能于一身體的產品和服務的總稱,具有實用高效便利的特點。為了直觀地反映所構建模型的完備性,采用SPSS Statistics 26 版本進行系統聚類的仿真分析,如圖1 所示。
根據圖1,可知聚類過程發生了5 次類的合并。

圖1 聚類樹
第一次并類對應樣本X1,X6的融合,融合成為新樣本X7,根據式(3)、(4),有:

則X7=(1.344,0.548,0.004,2.402,1.929)T。
第二次并類對應X5,X7的融合,融合成為新樣本X8,有X8=(1.343,0.547,0.004,2.402,1.930)T,=0.001 6。
第三次并類對應X3,X4的融合,融合成為新樣本X9,有X9=(1.411,0.592,0.003,2.397,2.007)T,=0.002。
第四次并類對應X8,X9的融合,融合成為新樣本X10,有X10=(1.373,0.567,0.004,2.400,1.964)T,=0.000 9。
第五次并類對應X2,X10的融合,融合成為新樣本X11,有X11=(1.371,0.568,0.004,2.400,1.966)T,=0.000 8。
X11就是聚類信息融合最終得到的融合數據。分析融合過程可知,測量誤差標準差σ 隨著系統聚類的進程不斷下降,說明得到的數據精度不斷提高。因此,采用多傳感器得到的裝備質量信息融合數據比從單一傳感器得到的測量值更能夠反映裝備質量的現實情況,可以為裝備質量基因要素信息使用提供數據支撐。
在當前的裝備質量信息管理工作中,如何從多傳感器、多樣本、多指標的繁雜原始質量數據中分析提取有效的質量基因要素信息是重點也是難點。研究表明,多傳感器信息融合方法是解決這一問題的有效手段。基于系統聚類的裝備質量基因要素信息融合方法,能有效地融合多個傳感器觀測數據,并能減少測量誤差,提高數據精度,從而能提高質量基因要素信息融合的效率和準確性,為裝備全壽命周期的質量管理工作提供可靠的數據分析處理手段。