孫貴東,關 欣,常 進,張 婕
(1.海軍航空工程學院電子信息工程系,山東煙臺264001;2.海軍航空工程學院通信站,山東煙臺264001)
傳感器類型不同會產生異類量測數據[1-9],增加了信息融合的不確定性,序列數據和區間數[10-13]作為不確定性數據的重要表現形式在數據關聯領域值得研究。由于序列數據和區間數據在數據類型上的限制,使得傳感器探測到的序列類型數據無法直接和區間數據進行關聯,所以關于序列、區間異類數據類型的關聯研究是必要的,能夠有效地解決異類數據導致的數據關聯的不確定性,提高關聯率。序列、區間異類數據的關聯在傳感器數據關聯領域研究的相對較少,現有的方法大多是同型數據的關聯方法,所以本文從兩種類型數據之間的不確定性度量入手,首先對序列數據進行區間轉化,使得異類數據同型化,再從區間多屬性關聯理論[14-30]的角度出發,采用區間關聯度作為關聯指標進行數據關聯。其中,基于序列數據的頻率分布函數進行序列、區間異類數據同型轉化,用轉化后的區間數據組來表示序列數據。最后通過仿真實例,驗證了該方法在序列、區間異類數據關聯上的合理性和優越性,得到了合理的關聯結果。
定義序列為

式中,Si表示序列的第i個分量,n為序列的長度。
記區間數為

也可以記為

式中,a-=a-Δ,a+=a+Δ,a-≤a+,特別地當a-=a+時,區間數A退化為實數。
對于長度為n的序列S,利用統計規則統計其中的可能元素S i(i=1,2,…,m,m≤n)出現的個數記為y,則稱y=f(S i)為序列S的頻率分布函數,則有

根據頻率分布函數的定義對序列數據S進行頻數統計,形成頻率分布函數,為了提高計算精度和效率,采用檢測門限σ進行檢測,即滿足下式的元素保留,舍去頻數過低的數據點的影響,取其中高頻數作為主要部分。

假設經過檢測后剩下的頻率分布函數包含l個可能元素,記為S i(i=1,2,…,l,l≤m≤n)則有

式中,l為滿足檢測后剩下的序列可能值的個數,也就是序列轉化的區間個數。對于可能值S i及其對應的頻率分布函數f(S i),假設轉化后的區間中點即為S i,區間端點到中點的距離為S i對應原數據的方差記為var(S i),則序列的區間轉化可以表示為

則每一個可能值對應的序列數據可以轉化為一個區間組:

式中,c i為序列經頻率分布函數區間轉化后得到的區間權重,且

c i可以保證序列變換為區間的保真性,還原了變換后區間在原序列中所占的重要性。
定義序列經區間轉換的區間數據利用率定義為

頻率分布函數是通過統計規律得出序列可能值,并形成區間,此過程是一個統計過程需要的序列數據量較大,是傳感器量測累積一段時間后上報的數據,而在累積過程中被測目標的模式可能不唯一,所以需要對轉化后的區間所描述的模式進行唯一性判斷。可以通過頻率分布函數轉化后的可能值S i的離散程度來判斷區間所描述的模式,記離散程度為

式中,ˉS i為可能值S i的均值,且

即對于給定的門限η,如果

則判定經頻率分布函數轉化后的區間描述的目標模式唯一。
假設目標關聯序列數據集集合為T={T1,T2,…,T i,…,T m},其中m為序列序號,表示關聯類,T i為序列數據集,由多屬性序列組成。關聯區間數據集集合為I={I1,I2,…,I i,…,I n},其中I i為區間數據集,與序列數據集類似,由物理關系對應的屬性區間組成。屬性參數集為P={P1,P2,…,P num},其中num為屬性參數種類序號,表示每一類目標都具有num類屬性參數。則關聯的問題變成在多屬性集P下,序列關聯集T i(i=1,2,…,m)和區間關聯集I j(j=1,2,…,n)的配對問題。
假設關聯數據已經經過標準化處理,考慮單屬性P k作用下序列關聯集T i(i=1,2,…,m)和區間關聯集I j(j=1,2,…,n)的關聯。首先對屬性P k對應的序列關聯序列T ik=(t ik1,t ik2,…,t ikd)進行區間化表示,根據1.3節所述的基于頻率分布函數的區間化表示方法可得

式中,M為序列區間化轉化后的區間個數,則序列、區間異類數據問題就變成區間關聯問題。
計算轉化后的區間與屬性P k對應的序列區間之間的區間距離為

在實際計算過程中一般選取p=2,即加權Euclidean距離計算。
則區間關聯系數可以表示為

式中,ρ為分辨系數,ρ∈[0,1]。則多屬性條件P下的序列關聯集T i(i=1,2,…,m)和區間關聯集I j(j=1,2,…,n)的關聯度為

在實際計算中,對于多屬性組合運算∨常采用加權融合的方法進行計算,權重的確定可以根據屬性參數在關聯過程中的重要程度,利用Delphi調查法、AHP法、熵權法等來確定,這里不再討論。
設權重向量為

則多屬性條件下的區間關聯度加權組合為

通過上述處理可以得到多屬性條件下的序列關聯集T i(i=1,2,…,m)和區間關聯集I j(j=1,2,…,n)的關聯度集為

根據γij的大小按照最大關聯度關聯準則可以得到序列關聯集T i(i=1,2,…,m)與區間關聯集I j(j=1,2,…,n)之間的關聯對。
假設存在關聯序列T1和T2,64類關聯區間集I1,I2,…,I i,…,I64,關聯數據均具有3類屬性特征參數,分別記為P1,P2和P3。現要判定兩類關聯序列T1和T2在多屬性條件下分別與64類關聯區間I1,I2,…,I i,…,I64中的哪類數據相互關聯。實驗仿真數據序列按下式產生。

式中,α為服從均勻分布的離散序列值,β為服從高斯分布的離散序列值,c為高斯分布的標準差。
實驗中每條關聯序列的關聯方法是一樣的,所以以序列T1為例研究,根據2.2節給出的序列、區間異類數據關聯算法,首先形成3類屬性參數的頻率分布函數如圖1所示。
對頻率分布函數區間化生成得到3類屬性參數對應的序列、區間異類數據轉化區間為

3類屬性參數對應的序列、區間異類數據組合權重向量分別為


圖1 序列T1的頻率分布函數圖
則利用數據利用率的定義式(10)計算三類屬性特征的數據利用率分別為100%,84%,95.5%。數據利用率較高,均達到了80%以上,說明經過頻率分布函數變換后的區間表示能夠充分反映序列數據所描述的原有屬性信息。
3類屬性參數對應的序列、區間異類數據區間加權組合為

按照多屬性區間關聯方法計算轉化后的區間值,其與64類區間集關聯度變化如圖2所示。

圖2 序列T1與64類區間數據的關聯度變化圖
圖2中縱坐標為關聯度大小,橫坐標為序列T1與64類區間集關聯度大小排序編號,具體編號排序為

根據關聯度大小和編號排序得知,序列T l與第43類區間數據的關聯度最大,關聯度達到94.5%,所以最大相似度關聯準則可以判定序列數據T1與區間數據I43為關聯對。
同理可以按照上述步驟,計算得到關聯序列T2的關聯度排序編號為

得知序列T2與區間數據I1為關聯對,關聯度達到93.6%。
本對比實驗將本文算法與一種序列最值區間形成關聯法進行對比。所謂最值區間形成關聯法即對于序列的區間轉化采用的是一種直接將序列數據中的最小值和最大值分別作為轉化后的區間上下限的方法,即對于序列S=(S1,S2,…,S i,…,S n),按最值區間法轉化為

則按照本文算法和序列最值區間形成關聯法對文中T1序列的關聯計算結果如圖3所示。

圖3 序列T1與四類區間數據的關聯度變化圖
圖3中縱坐標為關聯度大小,橫坐標為關聯類數目編號,在經過100次仿真處理后,本文所述的頻率統計區間法的關聯結果始終為T1與區間數據I43為關聯對,而最值區間法最大關聯度對應的編號在{43 44 59 60}之間變化,得到的關聯結果不穩定。
根據上述實驗可以得知,利用本文所述的頻率統計區間法計算的關聯度區分度較高,而且正確關聯度也較高,達到90%以上。而最值區間法盡管關聯度也接近90%,但是計算的關聯度分布集中,這就造成對關聯類的區分模糊,在模糊度較大的情況下不能很好地進行關聯判斷。主要原因是因為最值區間法是利用序列的最值形成區間進行關聯的,這樣在序列不穩定時,最值范圍不能有效地反應整條序列內部具體的數據分布,造成轉化后的區間誤差較大,而頻率統計區間法是對序列內部具體細微的分析,能夠反應序列內數據的分布情況,因而轉化后的區間更能反映序列的變化,所以計算的關聯度較高,區分度較好。
針對傳感器探測的目標多屬性序列類數據不能直接與區間類型數據進行關聯的問題,本文從兩種類型數據之間的不確定性度量入手,提出了基于頻率分布函數的序列、區間異類數據關聯算法,利用頻率分布函數實現了序列、區間的同型轉化,在此基礎上利用多屬性區間關聯理論進行關聯判定,成功地解決了序列-區間異類數據的關聯問題,得到滿意的關聯結果。為描述目標多屬性的序列、區間異類數據的關聯問題提供了一種可行的解決方法,在異類傳感器數據融合領域具有現實意義。
[1]黃友澎,曹萬華,張志云,等.基于灰色關聯分析的異類傳感器航跡相關算法[J].華中科技大學學報(自然科學版),2011,39(10):83-86.
[2]崔博鑫,許蘊山,向建軍,等.一種基于異類傳感器信息融合的目標識別方法[J].計算機工程與應用,2012,48(24):113-116.CUI Boxin,XU Yunshan,XIANG Jianjun,et al.Target Recognition Method Based on Heterogeneous Sensors Information Fusion[J].Computer Engineering and Applications,2012,48(24):113-116.(in Chinese)
[3]DAI Yaping,WANG Junzheng.Asynchronous Data Fusion of Two Different Sensors[J].Journal of Beijing Institute of Technology,2001,10(4):402-405.
[4]劉德浩,王國宏,陳中華.基于EM-EKF的異類傳感器系統誤差配準算法[J].雷達科學與技術,2011,9(5):453-456.LIU De-hao,WANG Guo-hong,CHEN Zhong-hua.A Registration Algorithm of Different Sensors Based on EM-EKF[J].Radar Science and Technology,2011,9(5):453-456.(in Chinese)
[5]龍海鷹,任清安.空管異類傳感器數據融合算法研究[J].雷達科學與技術,2010,8(6):526-531.LONG Hai-ying,REN Qing-an.Research on Data Fusion Algorithm of ATC Heterogeneous Sensors[J].Radar Science and Technology,2010,8(6):526-531.(in Chinese)
[6]曹曉軍,彭會萍.基于相似性測度的異類傳感器的數據融合算法[J].計算機應用與軟件,2012,29(5):130-131.CAO Xiaojun,PENG Huiping.A Data Fusion Algorithm for Heterogeneous Sensor Based on Similarity Measures[J].Computer Applications and Software,2012,29(5):130-131.(in Chinese)
[7]韓崇昭,朱洪艷,段戰勝,等.多源信息融合(第2版)[M].北京:清華大學出版社,2010:478-495.
[8]何友,王國宏,關欣,等.信息融合理論及應用[M].北京:電子工業出版社,2010:251-260.
[9]楊萬海.多傳感器數據融合及其應用[M].西安:西安電子科技大學出版社,2004:84-101.
[10]胡啟洲,張衛華.區間數理論的研究及其應用[M].北京:科學出版社,2010:15-18.
[11]曾文藝,趙宜賓.基于區間數度量的區間值模糊集合的歸一化距離、相似度、模糊度和包含度的關系研究[J].模糊系統與數學,2012,26(2):82-90.
[12]曾文藝,趙宜賓.基于區間數度量的區間值模糊集合的貼近度和模糊度的關系[J].模糊系統與數學,2012,26(1):25-31.
[13]趙宜賓,曾文藝.基于區間數度量的區間值模糊集合的相似度、模糊度和包含度的關系研究[J].工程數學學報,2010,27(2):295-304.
[14]衛貴武.區間數多指標決策問題的新灰色關聯分析法[J].系統工程與電子技術,2006,28(9):1358-1359.WEI Gui-wu.New Method of Grey Relational Analysis to Multiple Attribute Decision Making with Intervals[J].Systems Engineering and Electronics,2006,28(9):1358-1359.(in Chinese)
[15]胡麗芳,關欣,何友.一種新的灰色多屬性決策方法[J].控制與決策,2012,27(6):896-898.
[16]萬樹平.不確定多傳感器目標識別的區間相離度法[J].控制與決策,2009,27(9):1306-1309.
[17]羅黨.基于正負靶心的多目標灰靶決策模型[J].控制與決策,2013,28(2):241-246.
[18]丁傳明,黎放,齊歡.一種基于相似度的混合型多屬性決策方法[J].系統工程與電子技術,2007,29(5):737-740.
[19]王正新,黨耀國,宋傳平.基于區間數的多目標灰色局勢決策模型[J].控制與決策,2009,24(3):388-392.
[20]WU Sheng,ZHANG Zhi-yong.A New Incidence Degree Model of Interval Grey Number Based on Space Mapping[C]∥2011 IEEE 18th International Conference on Industrial Engineering and Engineering Management,Changchun:IEEE,2011:8-10.
[21]YAN Shuli,LIU Sifeng.Grey Incidence Method of Decision-Making with Three-Parameter Interval Numbers and Unknown Weights[C]∥2011 IEEE International Conference on Grey Systems and Intelligent Services,[S.l.]:[s.n.],2011:582-585.
[22]ZHENG Qing-li,GUAN Ye-qing.A New Grey Incidence Model of Interval Numbers and Its Application[C]∥2011 IEEE International Conference on Systems,Man,and Cybernetics,Anchorage,AK:IEEE,2011:1881-1885.
[23]XU Zeshui.On Similarity Measures of Interval-Valued Intuitionistic Fuzzy Sets and Their Application to Pattern Recognitions[J].Journal of Southeast University(English Edition),2007,31(11):139-143.
[24]ZHANG Yingjun,MA Peijun,SU Xiaohong.Pattern Recognition Using Interval-Valued Intuitionistic Fuzzy Set and Its Similarity Degree[C]∥2011 IEEE International Conference on Intelligent Computing and Intelligent Systems,[S.l.]:[s.n.],2009:361-364.
[25]XU Z,LIU M,YANG G,et al.Application of Interval Analysis and Evidence Theory to Fault Location[J].IET Electric Power Applications,2009,3(1):77-84.
[26]SHI Hongxing,LIU Sifeng,DU Hongyun,et al.Study on the Absolute Grey Incidence Model of an Interval Grey Number Sequence[C]∥2008 IEEE International Conference on Systems,Man and Cybernetics,[S.l.]:[s.n.],2008:1664-1667.
[27]DENG J L.Introduction to Grey System Theory[J].Journal of Grey System,1989,1(1):1-24.
[28]鄧聚龍.灰理論基礎[M].武漢:華中科技大學出版社,2002:135-162.
[29]劉思峰,黨耀國.灰色系統理論及其應用[M].北京:科學出版社,2010:62-92.
[30]黨耀國,劉思峰.灰色預測與決策模型研究[M].北京:科學出版社,2009:114-119.