郭興林,孫振曉,周昱瑤,漆蓮芝,張誼
(中國工程物理研究院計算機應用研究所,四川 綿陽 621900)
DS 證據理論被廣泛用于信息融合領域,然而Zadeh[1]指出在證據存在高沖突時,直接使用證據理論進行融合可能得出有悖于常理的結論。針對證據沖突的情況,主要的解決辦法分為2 類[2],一類是對沖突證據進行預處理[3-6],消除或降低證據間的沖突性;另一類是修改證據合成規則[7-13],將證據間沖突進行再分配。這2類方法均需要對證據間沖突進行準確度量。
國內外學者針對證據沖突度量進行了大量研究,Jousselme 等[14]給出了集合的相似性定義,采用證據間距離衡量證據沖突度。楊風暴[15]給出了證據一致度、證據沖突度、證據沖突強度、證據沖突/一致度等參數描述證據沖突程度。Liu[16]采用Pignistic概率轉換定義了證據間Pignistic概率距離,將其作為證據間沖突度量指標。蔣雯等[17]改進了Jousselme 距離沖突度量方法,將Jousselme 距離和沖突因子聯合,取其均值作為新的沖突因子。柯小路等[18]通過構建證據基本概率分配(BPA,basic probability assignment)矩陣,對其進行奇異值分解,利用最小奇異值表示證據間沖突。宋亞飛等[19]在分析證據相關性與沖突關系的基礎上,給出了基于證據相關系數的沖突判定準則。包甜甜等[2]采用交叉熵表示證據的散度,通過Hamacher T–余范融合證據距離和證據散度來度量證據間沖突。上述方法在部分沖突場景下具有較好的適應性,一定程度上彌補了經典沖突因子的缺陷,但仍存在一些不足。為此,本文提出了一種基于Pignistic 概率轉換和奇異值分解的證據沖突度量方法,能夠較好地適應證據融合時可能出現的多種證據沖突場景。
DS 證據理論是由 Dempster[20]提出,后經Shafer[21]擴充和發展形成的證據推理方法。
定義1設Θ為辨識框架,Θ的所有可能子集構成冪集2Θ。一個 BPA 函數定義為映射m:2Θ→[0,1],滿足[20]

例1設辨識框架{θ1,θ2},證據E1、E2的基本概率函數m1、m2滿足

證據E1、E2是完全一致的,理論上證據沖突應該為0,而K度量結果為0.5,表示證據間存在較大沖突。正因為K僅局部反映了證據焦元間的非相容程度,導致K度量結果與實際情況不符。
針對經典的沖突因子K在部分證據沖突場景下存在沖突度量失準的問題,不少學者對證據沖突度量方法進行了深入研究,提出了一些改進方法,具有代表性的有以下幾種。
定義3Jousselme 證據距離。假設辨識框架Θ下的有N個相互獨立的元素,m1、m2是證據E1、E2的基本概率分配函數,其焦元分別為Ai、Bj,則m1、m2之間的Jousselme 距離可以表示為[14]

其中,m1、m2是由m1、m2構成的2N維列向量;D是焦元關聯矩陣,為2N× 2N的正定系數矩陣,其元素可表示為

定義4Pignistic 概率距離。設m1和m2是辨識框架Θ下證據E1和E2的基本概率分配函數,BetPm1和BetPm2分別為其Pignistic 概率轉換,則Pignistic 概率距離定義為[16]

其中,Pignistic 概率轉換函數定義為

Pignistic 概率距離描述證據間對于不同焦元支持程度的最大差異。
定義5聯合沖突度量因子。設任意兩證據間Dempster 沖突因子為Kij,Jousselme 證據距離為dBPA(mi,mj),聯合沖突度量因子定義為[17]

定義6相關系數。設m1和m2是辨識框架Θ下證據E1和E2的基本概率分配函數,m1和m2之間相關系數定義為[19]

定義7最小奇異值。設m1和m2是辨識框架Θ下證據E1和E2的基本概率分配函數,對應的焦元集為A和B,記C=A∪B={C1,C2,…,Cm},則可定義如下BPA 矩陣[18]

則證據沖突量定義為

其中,σ(MD)表示對MD矩陣進行奇異值分解后得到的奇異值,直接選取最小奇異值用于度量證據間沖突。
證據沖突本質上可理解為證據對焦元信任的差異。在證據理論框架下,兩方面的原因導致證據間存在沖突[23]:一方面是證據源可靠性不足導致證據信度存在差異,例如專家主觀判斷存在誤差、傳感器抗干擾能力不足等;另一方面是由于對事物認知不充分導致辨識框架不完整,證據給出支持多子集命題甚至完全未知的結論。綜上所述,證據沖突表現在定量信度和定性焦元差異2 個層面,對二者進行充分考慮是準確度量證據沖突的關鍵。
Jousselme 等[14]提出的焦元關聯矩陣D被廣泛用于衡量證據焦元差異,如定義3、定義6 和定義7所示,其應用模式一般為

其中,M為廣義的概率分配函數矩陣,M′為矩陣轉換后的信任函數矩陣,其元素可表示為

從式(12)可以看出,D的本質作用是在各相容、互斥焦元之間進行基本概率映射,將證據焦元差異映射到信度差異上去,但這種映射缺乏相應的理論支撐,物理意義并不明確。另外,由于D為正定矩陣,滿足dij=dji,映射過程可能會引入干擾,破壞證據特征,造成沖突度量的準確性降低。例如,當焦元{θ2,θ3}向{θ1,θ2}概率映射時會將其概率的13分配給焦元{θ1,θ2},反之亦然,概率轉換的比例意義不明確。又如,在焦元{θ1,θ2}向θ1概率映射過程中,會將{θ1,θ2}信任的12 分配給θ1,這種映射類似于Pignistic 概率轉換,反之,在焦元θ1向{θ1,θ2}概率映射過程中,同樣會將θ1信任的12 分配給{θ1,θ2}。類似的映射雖然在一定程度上可以將焦元差異反映到信度差異上,但同時可能會引入干擾,造成算法度量性能下降。
為了能準確充分地反映證據焦元差異,同時不引入干擾,采用具有概率論和集合論支撐的Pignistic 概率轉換[8],將焦元差異映射到信度差異上,其矩陣形式可表示為
其中,P表示焦元概率轉換矩陣,pij表示焦元Bj向焦元Ai概率轉換的轉換系數。不同于D,P為非對稱矩陣,pij是有方向性的,pij定義為

轉換后M′的行向量即為原BPA 經Pignistic 概率轉換的信任函數,實現了焦元差異向信度差異的有效映射。但由于Pignistic 概率轉換會拓展證據的焦元集合,為原始證據不信任的焦元分配信任度,造成原始證據部分信息丟失,導致無法有效區分未知命題和同概率命題等情況。為了能充分表征證據差異特征,構建證據復合信任函數矩陣M′,M′滿足

其中,I為n階單位矩陣;M′中每個證據向量既包含原始的信度差異特征,也包含映射后的焦元差異特征。
在衡量證據信度差異方面,現有方法易受證據信度分布離散程度的影響,難以有效反映證據特征。由于矩陣奇異值分解能夠有效提取矩陣結構特征,本文提出了一種改進的基于奇異值分解的證據沖突度量方法,通過提取證據復合信任函數矩陣的奇異值來度量證據間的沖突情況。
定義8設任意2 個證據復合信任函數矩陣M′∈R2×n,M′中元素表示第i個證據對第j個焦元的信任程度,則存在正交矩陣U∈R2×2和V∈Rn×n,使[24]

考慮到證據復合信任函數矩陣的多變性、復雜性,其特征方向的個數及重要性都是不斷變化的,且重要性具有一定的相對性。文獻[18]僅將最小奇異值對應的特征方向作為沖突,而未結合矩陣的主要特征方向進行考慮,忽略了沖突與相似的相對性,具有一定的局限性。因此綜合考慮證據矩陣相似特性和沖突特性,將矩陣空間劃分為相似子空間S和沖突子空間N,相似子空間由奇異值最大的特征方向構成,表示證據矩陣的主特征方向,證據矩陣在該特征方向上是趨于相似的,沖突子空間由奇異值較小的特征方向構成,表示證據矩陣在這些特征方向上是沖突的。
定義9對于任意2 個證據構成的復合信任函數矩陣M′,其相似子空間S和沖突子空間N維數均為1,證據沖突度量因子定義為

其中,σmax、σmin分別為M′奇異值分解后的最大、最小奇異值;GSVD越大,表示證據間沖突越大。改進的沖突度量因子全面考慮了證據矩陣的結構特征,能夠較好地對證據間沖突進行度量,具有以下性質。


為了驗證GSVD方法的沖突度量性能,在典型證據沖突場景下與常見方法進行了對比分析。由于dBPA、difBetP、Kd、Cor、diSV、GSVD僅定義了兩兩證據間的沖突,為方便計算,將證據集合兩兩間沖突的均值作為全局沖突。
例2以文獻[15]算例為參照,設辨識框架Θ={θ1,θ2,θ3},初始證據集合包含證據E1、E2,其BPA 分別為m1、m2,有m1(θ1)=1,m1(θ2)=0,m1(θ3)=0,m2(θ1)=0,m2(θ2)=1,m2(θ3)=0,向證據集合中添加新的證據Ei(i=3,4,…,N),其BPA 函數為mi(θ1)=0,mi(θ2)=0,mi(θ3)=1,證據集合中證據數目共計N個,對N從2 增加到6 過程中各方法沖突度量結果進行統計,如表1 所示。

表1 全沖突場景沖突度量結果
當N=2,3時,證據分別完全信任不同的焦元,證據完全沖突,各方法均能正確度量。當N>3時,新加入的證據完全支持θ3,新的證據集合對θ3信任度持續增加,證據集合的一致性增強,證據間沖突應相應減小。從表1 中可以看出,K由于存在“一票否決”的特性,新加入的證據對θ3的支持度被m1(θ3)=0、m2(θ3)=0否決掉,導致在N變化過程中始終保持不變,與實際情況不符。dBPA、difBetP、Kd、Cor、diSV、GSVD方法隨著N的增加,沖突度量結果呈遞減趨勢,趨勢變化符合預期,且數值基本保持一致。
例3以文獻[25]算例為基礎擴展全沖突場景,設辨識框架,證據集合包含證據E1、E2,其BPA 分別為m1、m2,有m1(θj)=1/L,j=1,2,…,L,m2(θk)=1/L,k=L+1,L+2,… ,2L,m1、m2分別支持不同焦元,現逐漸調整L,對L動態變化過程中各方法沖突度量結果進行統計,如表2 所示。

表2 全沖突場景擴展形式度量結果
在L變化過程中,兩證據始終信任不同的焦元,且信任程度一致,證據完全沖突。從表2 可以看出,K由于僅關注證據的非相容性,度量恒為1,度量結果正確。根據dBPA、difBetP、Kd定義,3 種方法未考慮證據的一致性,度量結果會受證據信度離散程度的影響,隨著L的增大,證據信度的離散程度增大,導致證據沖突降低,度量結果與實際不符。diSV 僅考慮最小奇異值σmin方向特征,未考慮其余特征,在證據完全沖突時,矩陣 2 個特征方向的重要性是一致的,即σmax=σmin,并且隨著證據信度離散程度的增加,奇異值減小,導致沖突度量結果與實際不符。Cor、GSVD方法由于綜合考慮了證據的差異性和相似性,沖突度量結果正確。
例 4以文獻[1]算例為參照,設辨識框架Θ={θ1,θ2,θ3},初始證據集合包含證據E1、E2,其BPA 分別為m1、m2,有m1(θ1)=0.9,m1(θ2)=0.1,m1(θ3)=0,m2(θ1)=0,m2(θ2)=0.1,m2(θ3)=0.9,現增加第3 條證據E3到證據集合中,其BPA 是動態變化的,m3初始狀態等同于m2,m3的變化趨勢分 為 2 個階段,第一階 段:m1(θ1)=ε,m3(θ3)=0.9?ε,m3(θ2)=0.1,增大ε直至m3(θ1)=m3(θ3);第二階段:m3(θ1)=0.45?ε,m3(θ2)=0.1+2ε,m3(θ3)=0.45?ε,增大ε直至m3(θ2)=1。對m3動態變化過程中各方法沖突度量結果進行統計,如表3 所示。
從表3 中可以看出,在m3為空,即只有2 個證據時,m1強烈信任θ1,m2強烈信任θ3,且都部分信任θ2,證據沖突較高,各方法都能較好地度量。當加入證據E3時,由于m3初始狀態等同于m2,均強烈信任θ3,證據信任分布的一致性增強,證據間沖突相應減少。K受“一票否決”的影響,沖突反而增加,與實際不符。當m3在第一個階段變化時,m3仍然主要支持θ3,但同時部分信任θ1,m3對m1支持性增加,證據集合間沖突持續減小。K、dBPA、difBetP、Kd度量結果保持不變,與實際不符。當m3(θ1)=m3(θ3)時,m3同時支持m1和m2,證據間沖突達到最小。當m3在第二階段變化時,m3對θ2的信任持續增加,對θ1、θ3的信任逐漸減小,對證據E1、E2支持性減弱,證據沖突逐漸增大。當m3完全信任θ2時,3 個證據分別信任不同的焦元,證據間沖突達到最大。在m3動態變化過程中,Cor、diSV、GSVD度量結果變化趨勢均能根據證據集合變化正確變化。

表3 變信度場景沖突度量結果
例5以文獻[19]算例為參照,設辨識框架,滿足θi=i,i=1,2,…,20,證據集合包含證據E1、E2,其BPA 分別為m1、m2,m1滿足m1({2,3,4})=0.05,m1({7})=0.05,m1(A)=0.8,m1(Θ)=0.1,其中A是Θ的子集,m2滿足m2({1,2,3,4,5})=1,現調整m1中焦元A元素構成,A初始狀態為{1},每次遞增一個元素直至變為Θ,A中元素個數為N,對N變化過程中各方法沖突度量結果進行統計,如表4 所示。
從表4 中可以看出,當焦元A中元素個數發生變化時,證據間一致性會發生變化,K方法度量結果在焦元A整個變化過程中始終恒定不變,與實際情況不符。在A從{1} 逐漸變化到{1,2,…,5}的過程中,2 條證據逐漸趨于一致,沖突性逐漸減小。當A等于{1,2,…,5}時,證據間一致性達到最大,證據間沖突達到最小。此后由于A變化到{1,2,…,20}過程中焦元元素數目增加,證據間一致性又逐漸降低,沖突也隨之增大。dBPA、difBetP、Kd、Cor、diSV、GSVD方法沖突度量結果變化趨勢正確,并且GSVD變化趨勢更平緩。

表4 變焦元場景-1 沖突度量結果
例6設辨識框架,證據集合包含證據E1、E2,其基本概率分配函數m1、m2初始狀態為m1(A)=1,A={θ1,θ2,θ3,θ4,θ5},m2(B)=1,B={θ6,θ7,θ8,θ9,θ10},現同時按順序調增焦元A、B中元素的數目,直到均變為Θ,焦元A、B中相同元素的數目為N,對N動態變化過程中各方法沖突度量結果進行統計,如表5 所示。

表5 變焦元場景-2 沖突度量結果
從表5 中可以看出,當證據為初始狀態時,A、B焦元相同元素的個數為0,證據完全沖突,各方法度量結果均正確。隨著N的增加,證據同時信任的元素增加,證據間的一致性增強,沖突逐漸減小。直到N=10,兩證據完全相同時,證據間沖突變為0。由于K僅考慮到證據間非包容性,度量結果恒為0,與實際情況不符。dBPA、difBetP、Kd、Cor、diSV、GSVD方法沖突度量結果變化趨勢正確。
例7以文獻[14]算例為參照,設辨識框架,證據集合為E,相應的BPA 函數為mi,每一條證據只有一個焦元,且相互嵌套,即E1的焦元為{θ1},E2的焦元為{θ1,θ2},Ei的焦元 為{θ1,θ2,…,θi},且mi滿足mi({θ1,θ2,…,θi})=1,i=1,2,… ,N,對N從2 增加到10 過程中各方法沖突度量結果進行統計,如表6 所示。

表6 焦元嵌套場景沖突度量結果
當N=2時,證據E1、E2焦元存在嵌套關系,即{θ1}?{θ1,θ2},m1完全信任θ1,m2同時信任θ1和θ2,兩證據具有一定的相似性,同時也存在一定的沖突。從表6 中可以看出,由于證據焦元是相容的,K方法度量結果為0,與實際不符,其余方法度量正確。當向證據集合加入證據Ei時,mi除了信任前i? 1條證據信任的{θ1,… ,θi?1}外,還部分信任前i? 1條證據否定的θi,證據間的沖突增大。隨著N的持續增加,證據集合中沖突焦元逐漸增多,證據間的一致性降低,證據集合總的沖突度也逐漸增大。K保持恒定不變,與實際不符。dBPA、Kd由于焦元關聯矩陣D會引起數據離散程度變化,隨著mi支持的焦元元素數目的增多,經D映射后,證據信度的離散程度進一步增大,dBPA、Kd相應地減小,與實際不符。difBetP 方法僅考慮到焦元支持程度的最大差異,忽略了證據的相似性,陷入局部極值點,度量結果恒定不變,不符合實際情況。Cor、diSV 考慮了證據的差異性和相似性,但穩定性差,在2≤N≤ 9時,沖突度量結果逐漸增大,在N=10時,度量結果出現了減小的情況,與實際不符。在證據集合增長過程中,GSVD度量結果平穩增長,變化趨勢與實際相符。
綜上所述,相較于其他方法,GSVD方法能夠適應更多的證據場景,且能夠隨著證據集合的變化動態地調整度量結果,度量結果準確性高,穩定性好。
證據沖突度量是制約證據理論運用效果的關鍵因素,針對目前常見沖突度量方法的不足,本文提出了一種基于Pignistic 概率轉換和奇異值分解的證據沖突度量方法,通過Pignistic 概率轉換構建證據復合信任函數矩陣,采用奇異值分解方法提取矩陣特征,并基于奇異值構建了新的沖突度量因子。算例分析表明,所提方法能夠在全沖突場景、變信度場景、變焦元場景、焦元嵌套等多種證據場景下準確度量沖突,與常見方法相比,所提方法具有適應性廣、準確性高、穩定好的優點。另外,本文僅給出了證據沖突的度量方法,如何依據沖突度量結果,對沖突證據進行預處理以及選擇合適的證據合成規則是下一步的研究重點。