魏永超+莊夏+傅強



摘 要: 針對傳統Dempster?Shafer證據合成方法合成沖突證據時會出現相悖結論的問題,提出基于組合規則的證據合成方法。通過肯德爾等級相關系數得到證據間的相關程度,通過算法步驟順序求解證據距離以及權重系數后,對證據進行概率重新分配,完成證據預處理過程。引入命題支持度到新的合成規則,完成再分配證據的最終合成。同時提出算法性能模型用于分析算法優劣。實例驗證了算法在合成沖突證據時具有最優結果,且和推理一致,同時也可以用于常規證據合成,算法具有通用性和普適性。
關鍵詞: 證據理論; 沖突; 權重; 肯德爾等級相關系數; 命題支持度
中圖分類號: TN911.2?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)13?0122?04
Abstract: The conflict evidence is combined with traditional Dempster?Shafer evidence combination method, which may appear the problem of inconsistent conclusion, therefore an evidence combination method based on combination rule is proposed. The correlation degree among the evidences is obtained according to Kendall rank correlation coefficient. The evidence distance and weight coefficients are solved sequentially by means of the steps of the algorithm to perform the probability redistribution for evidences, and preprocess the evidence. The proposition support degree is introduced into the new synthesis rule for final combination of the redistribution evidence. The algorithm performance model is proposed to analyze the merits of the algorithm. The example verification results show that the algorithm has optimal result for the conflict evidence synthesis, which is consistent with the reasoning result. The algorithm can be used in conventional evidence combination, which is universal and available.
Keywords: evidence theory; conflict; weight; Kendall rank correlation coefficient; proposition support degree
0 引 言
Dempster?Shafer理論也稱為信度函數或證據理論,通常簡稱為DS理論。Dempster?Shafer(D?S)理論作為不確定知識信息融合中的推理方法之一,較之其他方法,由于在問題的未知性和不確定性上的把握優勢,在模式識別、信息融合和決策分析等領域[1?3]得到廣泛應用。Zadeh發現DS的標準化過程導致推理出現悖論結果[4],因此如何解決沖突證據的合成,成為DS理論研究的重要問題之一,目前還沒有可以接受的通用解決方案,許多學者針對高沖突證據信息融合提出了各自的解決方案[5?11]。目前高沖突證據合成解決方案通常分為兩類:引入新的組合規則;對證據進行預處理后再進行融合。兩種方法都有一定的優缺點。
本文結合證據預處理和新組合規則的方法,解決沖突證據合成問題。算法通過順序求解證據向量、肯德爾等級相關系數、證據距離、證據權重與概率重分配后完成證據預處理,同時建立了命題支持度的概念,并引入到組合規則中,用于對新的證據進行合成。提出的算法性能模型通過具體的系數值直觀分析比對算法的優劣。
1 證據理論
DS理論滿足交換律和結合律,具有良好的數學特性,可方便用于多個證據合成[12?13]。DS證據組合規則定義如下:
式中:為事件的概率權值,表示事件的支持程度,也可稱為焦元;為沖突因子,表示證據間的沖突或耦合程度:
式中是平衡系數,用來衡量各證據間的沖突程度。為1,則不能使用合成規則。表示高沖突證據,DS合成規則的正則化處理會出現與推理相違悖的結果。
2 組合規則合成算法
目前的改進算法較多,但大多模型比較簡單,不考慮證據源的可靠度,也有算法采用迭代方法[14],將合成結果引入下次證據合成中,該方法雖然在一定程度上改善了結果,但收斂控制是新的問題,且效率偏低。沖突是指兩個焦元的交集為空,DS合成規則中為了保持歸一性,放棄了沖突信息,為所有證據分配相同的權重。實際應用中,信息的可靠程度有一定差異,可以對高可靠性證據賦予較大的權重,對于可靠性低的證據賦予較低權重,是高沖突證據合成中證據預處理的核心。
本文ECMCR(Evidence Combination Method based on Compositing Rule)算法分為兩個階段:第一階段采用肯德爾相關系數形成的權值對證據預處理,并引入命題支持度;第二階段利用改進的合成規則對證據進行合成。算法的流程圖如圖1所示。算法中證據的沖突與否會決定最終的合成規則,從而在解決沖突證據合成的同時,也可以合理地得到正常證據合成結果。
2.1 肯德爾等級相關系數
肯德爾等級相關系數是統計學中的概念,以Maurice Kendall命名的,并經常用希臘字母表示其值。肯德爾相關系數是一個用來測量兩個隨機變量相關性的統計值,取值范圍在-1~1之間,當為1時,表示兩個隨機變量擁有一致的等級相關性;當為-1時,表示兩個隨機變量擁有完全相反的等級相關性;當為0時,表示兩個隨機變量是相互獨立的。 假設兩個隨機變量集合分別為它們的元素個數均為相關系數定義如下:
式中:表示中擁有一致性的元素對數(兩個元素為一對);表示不一致性的元素對數。其他定義如下:
將中的相同元素分別組合成小集合,表示集合中擁有的小集合數(例如包含元素:1 2 3 4 3 3 2,那么這里得到的則為2,因為只有2,3有相同元素),表示第個小集合包含的元素數。將中的相同元素分別組合成小集合,表示集合中擁有的小集合數,表示第個小集合包含的元素數。
2.2 證據權重
設融合系統中,辨識框架有個互不相容的完備假設命題,其冪集為有個證據基本可信度分配函數分別為
2.3 證據預處理
得到證據權重后,構建證據權重向量權重體現了證據的重要程度,從而決定其在合成過程中的作用,以及對合成結果的影響。依據證據權重向量對證據中的基本概率進行重新計算分配,定義如下:
2.4 命題支持度
在證據預處理后,通常是直接對證據進行合成,只考慮了證據的可靠度,忽略了證據組對每個命題的支持度。命題支持度把推理信息加入融合規則中,設證據組數為對命題支持度定義為:
當有半數以上的證據支持命題時,支持度為正值,否則為負值。
2.5 證據合成規則
證據合成規則是對預處理后證據的合成,得到最終的合成結果,合成公式定義如下:
2.6 算法分析
算法首先體現在準確性方面。通常算法的評估采用合成結果定性分析,無法定量描述算法的優劣。本文采用綜合分析結果量化反映合成算法的優劣。合成算法的優劣體現在:明確的合成結果;性能系數。性能系數定義如式(15)所示,其值越大表示算法效果越好。
算法的效率也是決定算法優劣的重要方面,算法效率決定算法合成的實時性,本文算法只需要一次融合就可以得到結果,無需多次迭代融合,因此算法具有較高的執行效率。
3 實例分析
通過實例數據對算法進行驗證,并和代表性算法進行對比。設證據沖突合成時的值分別為0.45和0.55,非沖突證據合成或證據數為2時,不需要命題支持度的支持。
實例一設計為沖突證據,4個證據的概率分布如下:
實例一的合成結果如表1所示,從表1中可以看出,DS和文獻[15]算法無法合成正確的結果,文獻[16]算法部分合成出正確結果,文獻[17?18]和本文算法都合成出正確結果。從結果來看,本文算法都有明確的合成結果,且合成結果值最高。
為直觀分析算法,性能系數趨勢圖如圖2所示,從圖2看出,本文的性能系數整體都高于其他算法,算法性能最優。
實例二設計為正常證據,用于正常數據的合成驗證,4個證據的概率分布如下:
表2為實例二的合成結果。所有的算法都合成出了目標傳統DS合成結果最大,文獻[15]算法最低,文獻[16?17]算法合成結果下降明顯,文獻[18]算法合成結果波動較大,本文算法合成結果值僅次于傳統DS,高于其他算法,且合成結果值較穩定。
實例二的性能系數趨勢圖如圖3所示,從圖3可以看出,傳統DS證據合成性能參數最優,本文算法其次。因此,本文算法在合成正常證據時,也就有很好的性能。
4 結 論
多源信息融合是目前研究的熱點,隨著信息來源的增多,證據間的沖突是需要解決的問題。算例證實了ECMCR算法很好地解決了證據沖突問題,同時也可以很好地完成正常證據數據合成,算法具有普適性和通用性,且算法效率較高。
參考文獻
[1] YANG J B, SINGH M G. An evidential reasoning approach for multiple?attributed decision making with uncertainty [J]. IEEE transactions on system, man and cybernetics, 1994, 24(1): 1?18.
[2] SMARANDACHE F, DEZERT J. Four versions of the proportional conflict redistribution rules of combination in information fusion [J]. Artificial intelligence, 2004, 41(3): 386?399.
[3] YANG J, SEN P. A general multi level evaluation process for hybrid MADM with uncertainty [J]. IEEE transactions on system, man and cybernetics, 2006, 36(10): 1458?1473.
[4] ZADEH L A. Review of books: a mathematical theory of evidence [J]. AI magazine, 1984, 5(3): 81?83.
[5] 郭華偉,施文康,鄧勇,等.證據沖突:丟棄,發現或化解?[J].系統工程與電子技術,2007,29(6):890?898.
[6] 王進花,吳迪,曹潔,等.基于證據分類的加權沖突證據組合[J].計算機科學,2013,40(1):247?250.
[7] 張燕君,龍呈,李達.基于沖突表示的沖突證據融合方法[J].模式識別與人工智能,2013,26(9):853?858.
[8] 王俊松,郝永生.基于信息熵測度的沖突證據合成方法[J].計算機應用研究,2014,31(9):2629?2643.
[9] 陳一雷,王俊杰.一種D?S證據推理的改進方法[J].系統仿真學報,2004,16(1):28?30.
[10] LIU W. Analyzing the degree of conflict among belief functions [J]. Artificial intelligence, 2006, 170(11): 909?924.
[11] 魏永超.基于K?L距離的改進D?S證據合成方法[J].電訊技術,2011,51(1):27?30.
[12] 秦志強.數據融合技術及其應用[J].兵工自動化,2003,22(5):20?23.
[13] 李弼程,王波,魏俊,等.一種有效的證據理論合成公式[J].數據采集與處理2002,17(1):33?36.
[14] 胡海亮,鐘求喜,劉瀏.基于迭代合成的D?S證據理論改進方法[J].計算機應用研究,2016(10):2985?2987.
[15] YAGER R R. On the Dempster?Shafer framework and new combination rules [J]. Information sciences, 1987, 41(2): 93?137.
[16] 孫全,葉秀清,顧偉康.一種新的基于證據理論的合成公式[J].電子學報,2000(8):117?119.
[17] 蒲書緒,楊雷,楊萃元,等.一種改進的證據合成規則[J].計算機工程,2006,32(23):7?9.
[18] 王力,白靜.改進的證據理論在多傳感器目標識別中應用[J].科技通報,2016,32(7):134?137.