周志杰 唐帥文 胡昌華 曹 友 王 杰
1967 年,Dempster 首次提出證據(jù)理論并將其用于統(tǒng)計問題的相關(guān)研究[1-2].之后,Shafer 于1976年發(fā)表了證據(jù)理論的第一本專著《A Mathematical Theory of Evidence》,通過引入信任函數(shù)(Belief function)概念,進一步發(fā)展和完善了證據(jù)理論,即Dempster-Shafer (D-S)理論,標志著證據(jù)理論的正式誕生[3].在D-S 框架下,辨識框架(Frame of discernment,FoD)是由一組相互排斥且整體完備的命題集組成的,其基本概率質(zhì)量不僅能賦給任意單個命題集,也能賦給該命題集的任意子集[4].因此,所有的證據(jù)都可以被描述為一種定義在冪集辨識框架下的置信分布(Belief distribution,BD)形式.DS 證據(jù)理論從置信分布的角度拓展了傳統(tǒng)的概率分布,構(gòu)成聯(lián)合概率推理過程,滿足證據(jù)的交換律和結(jié)合律,是傳統(tǒng)的貝葉斯理論的推廣[5].作為一種強有力的不確定性推理和信息融合方法[6-7],D-S 證據(jù)理論具有如下優(yōu)點:
1)利用信任函數(shù)表達知識的不確定性,克服了傳統(tǒng)貝葉斯理論對先驗知識或條件概率的依賴,使用限制條件更少,具有強大的證據(jù)組合能力.
2)能夠有效處理各類不確定性,如隨機性、模糊性、不準確性和不一致性,合理分配基本概率質(zhì)量.其中,隨機性是指同一事件會產(chǎn)生多種不同的結(jié)果;模糊性是指同一事件會產(chǎn)生含糊的結(jié)果;不準確性是指證據(jù)或者數(shù)據(jù)源由于受到各種干擾的影響而變得不完全可靠;不一致性是指證據(jù)或者數(shù)據(jù)源的多樣性.
3)能夠有效區(qū)分無知性和等可能性,知識的表示更加靈活準確.在D-S 證據(jù)理論中,證據(jù)對命題的部分支持并不意味著將證據(jù)的剩余支持分配給該命題的非命題,而是分配給整個辨識框架.
隨著證據(jù)理論的提出,許多學者開始對證據(jù)理論的理論模型解釋、算法實現(xiàn)及其實際應用進行探索[8-9].D-S 證據(jù)理論的核心是Dempster 組合規(guī)則,盡管它具有強大的證據(jù)組合能力,在面臨沖突證據(jù)時卻存在著“反直覺”問題,產(chǎn)生違背常理的結(jié)論,具體見本文第1 節(jié).此外,當證據(jù)數(shù)量龐大時,若采用Dempster 組合規(guī)則對證據(jù)進行組合,則會產(chǎn)生組合爆炸問題,計算量呈指數(shù)增加.鑒于此,廣大學者從輸入信息的表達和組合規(guī)則的改進等多方面對D-S 證據(jù)理論進行了深入研究,目前主要圍繞信任函數(shù)和置信分布兩大分支展開.其中,信任函數(shù)主要從基本概率分配的角度來表達證據(jù)的概率特性[10],而置信分布主要從信度的角度來表達證據(jù)的概率特性,進而綜合證據(jù)的權(quán)重和可靠度,實現(xiàn)混合式表達[11].從本質(zhì)上來說,二者是相同的,均可用于證據(jù)的表達.
在信任函數(shù)層面,Smets 等[12-13]將信任函數(shù)推廣到辨識框架的所有模糊子集上,并提出了Pignistic 概率和可傳遞信度模型(Transferable belief model,TBM).Pawlak[14]提出的粗糙集(Rough sets)理論為證據(jù)理論、模糊集理論和容差理論的發(fā)展提供了新的機制,為無限框架上的證據(jù)處理向有限框架上的近似轉(zhuǎn)化提供了思路.Voorbraak[15]給出了信任函數(shù)的貝葉斯近似計算公式,并證明了信任函數(shù)的貝葉斯近似的合成等于這些信任函數(shù)的合成的貝葉斯近似,從理論層面減少了證據(jù)理論的計算量.Cobb 等[16]比較了貝葉斯與信任函數(shù)推理的異同,并證明了二者在具有確定模型的情況下可以實現(xiàn)合理轉(zhuǎn)換.
在置信分布層面,1994 年,Yang和Singh[5]首次提出了證據(jù)推理(Evidential reasoning,ER)方法,并將其應用于摩托車的性能評估中,為有效解決多屬性決策(Mutiple-attribute decision making,MADM)問題提供了思路.在此基礎(chǔ)上,Yang[17]進一步提出了基于規(guī)則/效用的輸入信息轉(zhuǎn)化方法,為不確定性條件下的定量和定性信息表達提供了理論支持,提高了ER 方法解決不確定性的能力.文獻[18]提出了一種基于模糊規(guī)則的證據(jù)推理方法(Fuzzy rule-based evidential reasoning,FURBER),使用模糊語言變量描述用于定義安全級別的參數(shù),對工程系統(tǒng)的安全性進行建模、分析與綜合,并成功應用于海洋工程系統(tǒng)(浮式生產(chǎn)儲存卸載系統(tǒng))的系統(tǒng)安全建模.Wang 等[19]首次將ER 方法應用于環(huán)境影響評估(Environmental impact assessment,EIA)問題,并提出了ER 解析算法,該算法是ER 方法的顯式表達,將有助于解決ER 的優(yōu)化問題.Xu[20]和Gao 等[21]將證據(jù)推理算法擴展到區(qū)間ER 算法,進一步提高了ER 處理區(qū)間不確定性的能力.2013 年,Yang和Xu[11]提出了ER 規(guī)則,首次考慮了證據(jù)的可靠度,并證明了Dempster 組合規(guī)則和原始ER 算法都是ER 規(guī)則的特殊情況,將證據(jù)推理理論發(fā)展到了一個新高度.
目前,證據(jù)推理理論以其在不確定推理方面諸多的優(yōu)勢得到了快速發(fā)展,廣泛應用于模式識別[22]、信息融合[23-25]、人工智能[9,26]、專家系統(tǒng)[27-28]、故障檢測與診斷[29]、多屬性決策分析[30-32]、風險分析[33-34]、圖像處理[35]、回歸分析[36]、供水系統(tǒng)[37]等諸多領(lǐng)域.國際知名學者Durbach 等[38]對證據(jù)推理進行了高度評價,指出:“Perhaps the most well-known beliefbased method for MCDA is the evidential reasoning rule,which regards as an alternative's assessment on each attribute as a different source of evidence regarding that alternative's overall suitability (或許最著名的基于信度的MCDA 方法是證據(jù)推理規(guī)則,該規(guī)則將評估方法對每個屬性的評估視為關(guān)于評估方法整體適用性的不同證據(jù)源)”.
本文從置信分布的角度出發(fā),對證據(jù)推理理論方法進行概述,總結(jié)分析了相關(guān)典型文獻在證據(jù)理論發(fā)展過程中提出的重要思想,旨在為證據(jù)理論的發(fā)展和改進提供一定的參考和借鑒,引起廣大學者對證據(jù)推理的興趣.本文的整體框架與脈絡(luò)如圖1所示.

圖1 論文的整體框架Fig.1 The overall framework of this paper
假設(shè) Θ={H1,···,HN}是由一組相互排斥且構(gòu)成完備集的命題所組成的集合,即對于任意的i,j ∈[1,N] 且恒有 Hi∩Hj=? .其中,符號?表示空集,Hi表示第 i個命題,Θ 表示辨識框架(也稱全集).定義基本概率質(zhì)量為一個映射函數(shù),滿足如下條件

式中,m(Hi)表示恰好分配給命題 Hi的基本概率質(zhì)量.恰好分配給辨識框架的基本概率質(zhì)量也稱為全局無知性,記為m(Θ);而恰好分配給辨識框架的非單子集(如{H1,H2})的基本概率質(zhì)量稱為局部無知性.此外,辨識框架的冪集包含 2N個子集,記為2Θ或 P(Θ),表示為

在D-S 證據(jù)理論中有兩個基本概念,用來對證據(jù)的置信度進行衡量,即信任函數(shù) Bel(A)和似然函數(shù) Pl(A),它們分別由下式確定:

在式(3)和式(4)中,Bel(A)表示命題 A 的全部子集的BPA 之和,即命題 A 一定成立;而 Pl(A)表示所有與命題 A 相交的子集的BPA 之和,即不否認命題 A 的信任度.Bel(A)和 Pl(A)存在如下關(guān)系:

假設(shè)有兩條相互獨立且完全可靠的證據(jù),相應的BPA 為m1和 m2,對于任意的 A?Θ,Dempster 合成規(guī)則可表示為

其中,⊕ 表示正交和算子.
作為一種不確定性推理方法,D-S 證據(jù)理論可以有效描述帶有不確定性的輸入信息,并實現(xiàn)證據(jù)的定量表達[27].給定輸入 xi,可以將其等價轉(zhuǎn)化為如下置信分布形式:

其中,xi既可以是定性知識,也可以是定量信息,還可以是符號信息[27,39].(Hn,βn,i)表示第 i 個輸入被評估為等級 Hn的置信度為βn,i,N 表示評估等級的數(shù)量,L 表示輸入信息的數(shù)量.下面給出不同形式的輸入向 βn,i轉(zhuǎn)化的方法[17,39].
1)基于語義參考值的定量輸入轉(zhuǎn)化方法
a)基于規(guī)則/效用的輸入信息轉(zhuǎn)化方法
若輸入定量信息為xi,相應的參考值為hi,ji=1,···,L,j=1,···,J,其中J 表示參考值的個數(shù).此時,決策者或?qū)<铱梢詫?xi的數(shù)值量 xi,j與其參考值 hi,j建立起映射關(guān)系,即

不失一般性,假設(shè)相對于參考值 hi,j而言,決策者更偏向于參考值 hi,j+1.令 hi,J和 hi,j+1分別為最大和最小的參考值,那么,xi可以等價轉(zhuǎn)化為類似于式(7)所示的置信分布形式:

βi,j的計算式為

注1.基于規(guī)則/效用的輸入信息轉(zhuǎn)化方法并不局限于式(10),具體取決于實際決策場景中輸入與輸出的關(guān)系,計算表達式可以是線性的(如三角函數(shù)、梯形函數(shù)等),也可以是非線性的(如指數(shù)函數(shù)、對數(shù)函數(shù)、復合函數(shù)等).
b)基于模糊語義值的輸入轉(zhuǎn)化方法
此種轉(zhuǎn)化方法將輸入信息的參考值設(shè)置為模糊形式的語義值,而輸入信息可以是形如確定性數(shù)值、閉區(qū)間、三角形模糊數(shù)、梯形模糊數(shù)等的定量信息.采用基于隸屬度函數(shù)的方法求解定量輸入 xi相對于模糊參考值 hi,j的置信度,其核心是選取合適的匹配函數(shù).
2)基于區(qū)間的定量輸入轉(zhuǎn)化方法
此種轉(zhuǎn)化方法的輸入信息為區(qū)間形式,轉(zhuǎn)化方法和基于語義參考值的定量輸入轉(zhuǎn)化方法類同,主要區(qū)別在于匹配函數(shù)的不同,選取方法可參考文獻[40-41].
3)基于主觀決策的定性輸入轉(zhuǎn)化方法
此種轉(zhuǎn)化方法的輸入為定性信息,通常由決策者或?qū)<腋鶕?jù)領(lǐng)域知識進行主觀判斷,給出輸入相對于參考值 hi,j的置信度.
4)基于主觀決策的符號輸入轉(zhuǎn)化方法
此種轉(zhuǎn)化方法的輸入為符號信息,通常由決策者或?qū)<腋鶕?jù)領(lǐng)域知識進行主觀判斷,給出輸入相對于參考值 hi,j的置信度.該方法和基于主觀決策的定性輸入轉(zhuǎn)化方法類同.
Zadeh 在研究D-S 證據(jù)理過程中首次發(fā)現(xiàn)了Dempster 規(guī)則在處理沖突證據(jù)上存在的不足,國內(nèi)外學者也對其融合悖論問題進行了廣泛而深入的探討與分析[42-43].“Zadeh 悖論”可用如下案例進行說明.
在某宗“謀殺案”中,根據(jù)兩個目擊證人(e1和e2)來判定三個犯罪嫌疑人(Peter,Paul,Mary)中究竟誰是真正的兇手.兩條證據(jù)的基本概率質(zhì)量如表1 所示.

表1 證據(jù)的基本概率分配Table 1 Basic probability assignment of evidence
采用式(6)所示的Dempster 合成規(guī)則進行證據(jù)組合.首先,計算證據(jù)沖突系數(shù) K (該系數(shù)反映了兩條證據(jù)的沖突度,即它們沒有共同支持的命題的程度)

其次,分別計算Peter、Paul和Mary 的組合概率質(zhì)量

最后,得到組合概率質(zhì)量為

上述結(jié)果認定Paul 是兇手,顯然違背了人的常識推理結(jié)果.因此,Dempster 組合規(guī)則在沖突證據(jù)面前存在明顯的缺陷.
目前,解決D-S 證據(jù)理論的沖突問題和組合爆炸問題主要有兩大途徑:一是從證據(jù)源出發(fā),修改證據(jù)的信任函數(shù),如Shafer 提出的折扣系數(shù)法[11].胡昌華等[44]通過Pignistic 變換,提出一種基于新的折扣率的D-S 改進算法,有效降低了決策風險,提高了證據(jù)沖突情況下融合結(jié)果的可靠性.韓德強等[45]提出了一種新的基于證據(jù)方差的序貫式加權(quán)證據(jù)組合方法,對沖突證據(jù)進行了修正.二是從合成規(guī)則出發(fā),把證據(jù)沖突度作為全局無知性分配給辨識框架或者作為局部無知性分配給相關(guān)命題的子集.具有代表性的改進規(guī)則有Yager 規(guī)則[46]、Dubios和Prade 規(guī)則[47]、PCR5 規(guī)則[48]等.
Yager 合成規(guī)則描述如式(16)所示.

Dubois和Prade[47]提出一種局部分配沖突的合成規(guī)則,如式(17)所示.

根據(jù)式(17)可知,Dubois和Prade 合成規(guī)則將沖突信度作為局部無知性直接分配給命題的子集,這樣能夠避免“反直覺”問題.與式(16)相比,式(17)顯得更為合理.但在式(17)中,由于缺乏合理性證明,Dubois和Prade 合成規(guī)則不構(gòu)成聯(lián)合概率推理過程.
Smarandache 等[48]提出一系列比例沖突重分配(Proportional conflict redistribution,PCR)規(guī)則,其中PCR5 效果最為良好,如式(18)所示.

根據(jù)式(18),相比于上述兩種規(guī)則,在處理沖突證據(jù)時,PCR5 能夠更為合理地局部分配沖突信度.然而,PCR5 仍然不構(gòu)成聯(lián)合概率推理過程,也不構(gòu)成貝葉斯推理過程,其合理性有待進一步證明.
在合成規(guī)則改進上,Simard 等[49]提出一種修剪的D-S 算法,有效減少了證據(jù)合成的計算量,且算法具有自適應性,但是不滿足證據(jù)的交換律.Lefevre 等[50]采用專家主觀法和權(quán)重因子自適應學習方法來確定證據(jù)的權(quán)重系數(shù),通過權(quán)重折扣來解決證據(jù)沖突問題,并證明了該方法是Dempster合成規(guī)則、Dubois和Prade 合成規(guī)則的一般化方法.文獻[51]通過構(gòu)造可靠性判斷矩陣以獲得每個證據(jù)源的權(quán)重,采用Dempster 合成規(guī)則組合加權(quán)后的證據(jù)以識別目標,提高了D-S 證據(jù)理論處理高度沖突證據(jù)的能力和目標識別速度.Jiang和Zhan[52]在D-S 證據(jù)理論的基礎(chǔ)上,提出了一種改進的廣義證據(jù)組合規(guī)則,進一步明確了證據(jù)組合規(guī)則的幾何與物理意義.
上述改進方法或新的規(guī)則解決了沖突證據(jù)存在的部分問題,但部分方法不再滿足Dempster 合成規(guī)則的基本性質(zhì),如交換律和結(jié)合律等.此外,許多方法都不是一個嚴格的概率推理過程,也不是貝葉斯推理過程,更沒有解決組合爆炸的問題.
為了克服傳統(tǒng)Dempster 組合規(guī)則的“反直覺”和組合爆炸問題,在滿足傳統(tǒng)貝葉斯的聯(lián)合概率推理的基礎(chǔ)上,ER 算法應運而生,并得到了深入發(fā)展[4-5,17,30-31].
假設(shè)某個評估方案可以由 L 條獨立證據(jù)ei(i=1,···,L)評估得到,辨識框架由 N個評估等級θn(n=1,···,N)組成,即Θ={θ1,···,θN}.一條證據(jù)可以表示為如下置信分布形式:

其中,pn,i表示該評估方案在證據(jù) ei下被評估為等級 θn的置信度,且滿足pΘ,i表示全局無知性.對于任意 pn,i>0 ,(θn,pn,i)稱為ei的一個焦元.
假設(shè)證據(jù)的權(quán)重為wi(i=1,···,L),歸一化后滿足 0≤wi≤1 ,且對于證據(jù) e1和 e2,其基本概率質(zhì)量可表示為

則 e1和 e2的組合概率質(zhì)量由式(21)~(24)確定:

其中,mn,e(2)表示 e1和 e2組合后分配給命題 θn的聯(lián)合概率質(zhì)量,mΘ,e(2)表示 e1和 e2組合后分配給辨識框架的聯(lián)合概率質(zhì)量,mP(Θ),e(2)表示 e1和e2組合后分配給冪集的聯(lián)合概率質(zhì)量.K0表示兩條證據(jù)組合時的歸一化系數(shù),以確保組合后的概率質(zhì)量之和為1.相應的組合置信度可表示為式(25)和式(26).
兩條證據(jù)對應的評估結(jié)果可以表示為如下置信分布形式:

對于 L 條獨立證據(jù) ei,i=1,···,L,可重復式(21)~(26),將之前組合得到的基本概率質(zhì)量與第3條證據(jù)的基本概率質(zhì)量進行組合,依次循環(huán),即可得到評估方案的最終評估結(jié)果

文獻[11]已證明,式(21)~(26)所示的ER 算法可等價描述為

顯然,當證據(jù)的權(quán)重均為1 時,式(29)~(33)等價于式(6),即ER 算法退化成Dempster 組合規(guī)則,說明Dempster 組合規(guī)則是ER 算法的特例.不同于Dempster 組合規(guī)則,ER 算法將剩余信度分配給了各個單集,把無知性分配給了辨識框架,而Dempster 組合規(guī)則將剩余信度直接全部分配給了辨識框架,把它當作全局無知性來處理,沒有把剩余信度和無知性區(qū)分處理.顯然,ER 算法更為合理[11].
在融合證據(jù)過程中,式(32)中的第1 項[(1-w1)mn,2+(1-w2)mn,1]表示證據(jù)個體支持的有界和,第2 項[mn,1mn,2+mn,1mΘ,2+mn,2mΘ,1]表示證據(jù)整體支持的正交和.文獻[53]對這兩項在證據(jù)組合過程中的作用以及它們與證據(jù)權(quán)重的關(guān)系進行了深入的探討和分析.
假設(shè)評估等級 θn的效用為u(θn),那么該評估方案的期望效用計算如下[17]

注2.效用的概念在概率論中相當于數(shù)學期望.式(34)進一步可以理解為離散型隨機變量的數(shù)學期望,表示對評估方案的評價的最終有效性,其中u(θn)相當于離散點的值,pn,e(L)相當于離散點的概率.
ER 算法通過合理分配證據(jù)的權(quán)重和可靠度,使得證據(jù)在不同的決策場景中具有與之相適應的特性,從而保證了高沖突證據(jù)之間的準確融合,避免了“反直覺”問題.同時,采用正交和算子進行證據(jù)組合,通過迭代計算,大大減小了傳統(tǒng)證據(jù)組合的計算量,在一定程度上克服了組合爆炸問題.
作為證據(jù)理論的關(guān)鍵參數(shù)之一,證據(jù)權(quán)重反映了決策者對證據(jù)的偏好程度,并在很大程度上影響了證據(jù)組合結(jié)果.以市場和商業(yè)制造為例,顧客對產(chǎn)品的偏好往往決定了此類產(chǎn)品的市場銷量.因此,如何確定證據(jù)權(quán)重成為了證據(jù)理論發(fā)展的一個重點[54].Deng 等[55]提出了一種客觀賦權(quán)方法,通過量化多準則決策中的對比強度和評估準則的沖突特征來得到屬性權(quán)重,為公司、企業(yè)的比較提供了借鑒.文獻[56]也提出了一種客觀的權(quán)重求取方法,用于解決競爭公司的業(yè)績排名問題,其中屬性權(quán)重由給定方案生成的平均內(nèi)在信息來衡量.然而,當所有的評估方案具有相似的績效評級時,即證據(jù)之間的相似性較強,上述方法往往會將各證據(jù)的權(quán)重分配為基本相等,導致權(quán)重偏低.對于某些特定的場合,如面向任務(wù)的決策,證據(jù)權(quán)重可以通過決策者給出的一些模糊規(guī)則進行估計得到[57].Deng 等[58]提出了一種考慮區(qū)間權(quán)重的證據(jù)推理方法,通過決策者對基本屬性的評估以及對評估方案的偏好程度來估計每個屬性的權(quán)重區(qū)間.結(jié)果表明,決策者給出的偏好程度越高,權(quán)重的估計結(jié)果就越準確.該方法為市場上分析客戶潛在需求和開發(fā)新產(chǎn)品提供了思路.
證據(jù)理論在工程系統(tǒng)的安全風險分析和信息融合應用過程中,有時存在系統(tǒng)信息缺乏、歷史經(jīng)驗不足、參數(shù)定義不明確、信息難以量化等問題,單一的證據(jù)融合方法無法滿足實際需要.而模糊集理論提供了一種在決策過程中描述語義變量的方法,無需專家提供存在風險因素的精確描述,可以有效處理模糊信息,是傳統(tǒng)概率統(tǒng)計方法的有力補充[59].為了彌補證據(jù)理論的不足,Ishizuka 等[60]提出將模糊集理論和證據(jù)理論結(jié)合起來,用于復雜問題決策.
模糊證據(jù)推理通常按照模糊隸屬度函數(shù)的選擇、基于證據(jù)理論的目標信息融合和評判準則的選取三個步驟實施.Liu 等[18]在模糊邏輯和ER 方法的基礎(chǔ)上,提出了一種基于模糊規(guī)則的分層多專家安全分析與基于ER 方法的融合框架,為解決工程系統(tǒng)安全性評估中的混合不確定性問題提供了框架.FURBER 方法將傳統(tǒng)的“IF-THEN”規(guī)則擴展到了具有置信結(jié)構(gòu)的規(guī)則庫,其最突出的特點在于,匹配函數(shù)的輸入是數(shù)值形式,語義值使用模糊隸屬度函數(shù)進行表征,同時適用于定量和定性屬性.該方法為規(guī)則庫中的規(guī)則訓練與更新提供了思路,在工程和管理系統(tǒng)的安全性評估和設(shè)計決策支持方面,特別是在最初的概念設(shè)計階段潛力巨大.周謐[61]針對模糊環(huán)境下的MADM 問題,將三角模糊權(quán)重引入到證據(jù)推理中,研究了基于區(qū)間效用表達的證據(jù)推理MADM 方法,有效地解決了模糊信息與證據(jù)的融合問題.宋亞飛等[62]從Dempster 組合規(guī)則出發(fā),提出了一種基于復合可靠度的時域證據(jù)組合方法,提高了識別系統(tǒng)的抗干擾能力.Yang 等[63]采用模糊證據(jù)推理對不充分和模糊的多準則信息進行處理,并對油輪的選擇過程進行了改進.
最初的D-S 證據(jù)理論只能用來組合確定的證據(jù),卻無法有效處理不確定證據(jù),而決策者在決策過程中往往更傾向于給出區(qū)間形式的評價結(jié)果.Lee 等[64]最早開始研究具有區(qū)間置信結(jié)構(gòu)的證據(jù)的組合,并定義了一種廣義的證據(jù)加和、乘法運算規(guī)則,但也存在權(quán)重分配過于主觀隨意、證據(jù)組合前和組合后的非標準化等問題.Den?ux[65-66]系統(tǒng)地研究了區(qū)間證據(jù)的組合及歸一化問題,指出區(qū)間算法并不適用于證據(jù)的組合概率質(zhì)量計算,也證明了區(qū)間證據(jù)組合不滿足結(jié)合律,并提出了一種新的區(qū)間證據(jù)組合及歸一化方法.但是該方法隔離了區(qū)間證據(jù)的組合和歸一化過程,反而增加了歸一化后的區(qū)間證據(jù)的不確定性.之后,Yager[67]也進行了相關(guān)研究,但仍然存在區(qū)間證據(jù)的組合概率質(zhì)量計算和歸一化不當?shù)膯栴}.Wang 等[68]在Den?ux的研究基礎(chǔ)上,提出了一種用于組合和歸一化區(qū)間置信結(jié)構(gòu)的最優(yōu)方法,即區(qū)間證據(jù)推理(Interval evidential reasoning,IER)算法,其中證據(jù)的組合和歸一化同時進行而非單獨進行.
在多屬性決策分析(Multiple attribute decision analysis,MADA)問題中,假設(shè)A={a1,a2,···,aM}表示 M個決策方案的集合,ai表示第 i 個決策方案;E={e1,e2,···,eL}表示每個決策方案可由 L 條獨立證據(jù)進行評估得到;若 H={H1,H2,···,HN}為辨識框架,那么證據(jù) ei的區(qū)間置信結(jié)構(gòu)可以表示為

注 3.第3.1 節(jié)的辨識框架 Θ={θ1,···,θN}和本節(jié)的辨識框架 H={H1,H2,···,HN}本質(zhì)上是相同的,二者可以互換,具體描述形式取決于決策者.
原始的ER 算法只考慮了證據(jù)的歸一化權(quán)重,認為證據(jù)是完全可靠的.但是,由于不同的證據(jù)獲取的方式不同,且在獲取過程中可能受到各種干擾的影響,證據(jù)不一定完全可靠.若此時仍采用ER算法組合證據(jù),組合結(jié)果將與實際結(jié)果存在較大誤差.因此,考慮證據(jù)的可靠度,進而增加證據(jù)的客觀性就顯得尤為重要了.證據(jù)的可靠度和權(quán)重的區(qū)別在于,可靠度反映了證據(jù)源為解決給定問題提供正確評估或解決方案的能力,是證據(jù)的固有屬性,屬于客觀概念;而權(quán)重反映了證據(jù)之間的相對重要性,代表了決策者對證據(jù)的偏好程度,隨決策者的主觀意志而改變,屬于主觀概念[69-70].ER 規(guī)則有效區(qū)分了證據(jù)的可靠度和權(quán)重,并將二者融入到證據(jù)的置信分布中.
假設(shè)辨識框架為Θ={θ1,···,θN},證據(jù) ei可以表示為如式(19)所示的置信分布形式,ei的權(quán)重和可靠度分別為wi和 ri,那么帶有可靠度的證據(jù)的加權(quán)置信分布定義為

其中,

在式(37)中,crw,i=1/(1+wi-ri)表示歸一化系數(shù),使對于任意兩條獨立證據(jù) ei和 ej,假設(shè)其置信分布形式可由式(36)表達,則 ei和 ej對命題 θ的聯(lián)合支持 pθ,e(2)由下式確定

不失一般性,對于 L 條獨立證據(jù)E={e1,e2,···,eL},它們對命題 θ的聯(lián)合支持 pθ,e(L)可通過不斷迭代下式得到

其中,k=3,···,L.mθ,e(k)反映了前 k 條證據(jù)組合后對命題 θ 的聯(lián)合支持程度,且有mθ,e(1)=mθ,1,mP(Θ),e(1)=mP(Θ),1.顯然,當 rk≡wk時,式(40)~(43)等價于式(29)~(33),即ER 規(guī)則退化成原始的ER 算法,說明原始ER 算法是ER 規(guī)則的特例.當 rk≡1 時,式(40)~(43)等價于式(6),即ER 規(guī)則退化成Dempster 組合規(guī)則,說明Dempster 組合規(guī)則也是ER 規(guī)則的特例.
假設(shè) L 條獨立證據(jù)組合后的總體可靠度為re(L),組合權(quán)重為we(L),由式(37)可得mP(Θ),e(L)=(1-re(L))/(1+we(L)-re(L)).因此,re(L)可由下式確定

在式(44)中,we(L)的取值應該介于 L 條獨立證據(jù)的最大權(quán)重 max{wi}和1 之間,故有re(L)(we(L))∈[re(L)(1),re(L)(max{wi})].
為了進一步闡述Dempster 組合規(guī)則、原始ER 算法和ER 規(guī)則之間的關(guān)系,下面以文獻[71]中的兩條獨立證據(jù)的組合為例進行說明.假設(shè)辨識框架為Θ={A,B},證據(jù) e1和 e2的置信分布如表2所示.

表2 證據(jù)的置信分布Table 2 Belief distribution of evidence
假設(shè) e1和 e2的權(quán)重及可靠度分別為w1=0.2,w2=0.8,r1=0.8,r2=0.7,根據(jù)式(6)、式(29)~(33)和式(40)~(43),分別采用Dempster 組合規(guī)則、原始ER 算法和ER 規(guī)則對證據(jù)進行組合,得到結(jié)果如表3 所示.
在表3 中,證據(jù) e1和 e2不存在無知性,且證據(jù)權(quán)重已經(jīng)滿足了歸一化要求,那么Dempster 組合規(guī)則和原始ER 算法的組合結(jié)果應當一致.但是,Dempster 組合規(guī)則將全局無知性分配給了辨識框架 Θ ,導致m(Θ)=m(P(Θ)).若將m(P(Θ))重新分配給命題A和B,那么pA,e(2)=mA,e(2)/(1-mΘ,e(2))=0.452,pB,e(2)=mB,e(2)/(1-mΘ,e(2))=0.548,該結(jié)果與原始ER 算法的結(jié)果完全一致,這也說明了證據(jù)的權(quán)重均為1 時,ER 算法退化為Dempster 組合規(guī)則.
同時,若將證據(jù)的可靠度設(shè)置為r1=0.2,r2=0.8,基于式(40)~(43)所示的ER 規(guī)則,得到證據(jù)的組合結(jié)果如下所示

顯然,式(45)與表3 中原始ER 算法的組合結(jié)果完全一致,這也說明了證據(jù)的可靠度等于歸一化權(quán)重時,ER 規(guī)則退化為原始ER 算法.

表3 證據(jù)組合結(jié)果的比較Table 3 Comparison of evidence combination results
證據(jù)推理已廣泛用于評估決策等多個領(lǐng)域中,有效解決了多源不確定性問題.本節(jié)主要從信息融合、多屬性決策、模式識別等方面介紹證據(jù)推理的典型應用.
信息融合早在20 世紀70 年代被稱為數(shù)據(jù)融合,源于美國的聲納信號處理系統(tǒng),后來在軍事領(lǐng)域中受到廣泛關(guān)注.證據(jù)推理以其強大的證據(jù)融合能力,在信息融合中得到了深入發(fā)展.
文獻[72]采用推廣的D-S 證據(jù)理論對距離圖象和彩色圖象進行融合,提高了融合結(jié)果的準確性與可靠性.文獻[73]將D-S 證據(jù)理論用于解決海上識別和屬性融合問題,圍繞兩種識別信息融合體系結(jié)構(gòu),對命題的生成和管理進行了詳細討論.Liu 等[74]針對異構(gòu)遙感圖像的檢測和融合問題,提出了一種動態(tài)證據(jù)推理(Dynamic evidential reasoning,DER)方法,用于多時相圖像的順序融合.Paksoy和G?ktürk[75]采用不同的信息融合技術(shù)進行軟件缺陷預測,通過實驗驗證了D-S 證據(jù)理論的良好預測效果.Quost 等[76]針對分類器組合時證據(jù)不獨立的問題,提出了一種基于 t 范數(shù)的改進Dempster 組合規(guī)則,并通過實際數(shù)據(jù)集證明了所提方法的有效性.Li 等[77]提出了一種不確定條件下總生產(chǎn)計劃(Aggregate production planning,APP)的分層置信規(guī)則庫(Belief rule base,BRB)推理方法,為APP 提供了一種高性能的解決方案.Zhou 等[33]提出了一種新的使用故障數(shù)據(jù)和專家知識的基于BRB和ER 的模型,將異步多源信息轉(zhuǎn)換到同一標準框架下并進行融合,用于預測和評估航空裝備的壽命.Kong 等[78]采用ER 方法融合客觀質(zhì)量指標、主觀專家判斷和患者反饋,對醫(yī)院的整體質(zhì)量進行系統(tǒng)全面的評估,為醫(yī)學質(zhì)量評估提供了新的融合框架.Zhu 等[79]為了提高證券分析師預測信息的利用率,提出了一種二維漸進框架下的證據(jù)推理算法和證據(jù)組合方法,對證券分析師的股票評級信息進行融合,提高了融合結(jié)果的準確性.Li 等[80]針對滑坡壩災害評估中的數(shù)據(jù)不完整和不準確問題,提出了一種基于多尺度臨近語義術(shù)語和證據(jù)推理的災害評估方法,并以2008 年汶川地震為背景,對7 座滑坡壩進行災害評估,驗證了所提方法的有效性和合理性.
MADM 早在20 世紀90 年代得到研究,也稱為有限方案多目標決策,主要涉及離散、有限個決策方案的決策問題[81].證據(jù)推理最早是在MADM背景下提出來的,并為解決不確定多屬性決策問題提供了思路.
Yang和Sen[82]對ER 方法在復雜工程產(chǎn)品改造設(shè)計中的應用進行了梳理和總結(jié),并采用ER 方法對近海渡輪的改裝設(shè)計進行了方案篩選.文獻[83]針對傳統(tǒng)數(shù)學決策方法在定性知識和定量信息建模中的不足,提出了一種基于近似推理和證據(jù)推理的復合決策方法,用于海洋工程產(chǎn)品在初始設(shè)計階段的性能評估.Wang和Elhag[84]提出了一種基于證據(jù)推理的橋梁安全性評估方法,實現(xiàn)了橋梁整體安全性的分布式評估,克服了決策者的主觀意志帶來的不確定性.付艷華等[85]采用證據(jù)推理對MADM問題中的不確定性進行建模,為供應商績效評估和選擇中的定性知識和定量信息的表達提供了統(tǒng)一的框架.Shintemirov 等[86]提出了一種基于證據(jù)推理的變壓器繞組評估方法,將頻率響應分析法(Frequency response analysis,FRA)評估過程轉(zhuǎn)換為ER 框架下的MADM 問題,克服了傳統(tǒng)的FRA 在處理不確定性方面的不足.沈江等[87]針對MADM中的異構(gòu)數(shù)據(jù)融合與決策問題,提出了一種基于DS 證據(jù)理論的證據(jù)鏈融合推理方法,并在心臟病診斷案例中驗證了所提方法的有效性.劉佳俊等[88]提出了一種基于BRB和ER 的裝備壽命評估方法,提高了BRB 專家系統(tǒng)的評估能力,有效解決了航天產(chǎn)品試驗樣本少、壽命評估難等問題.Li 等[89]提出了一種基于條件廣義最小方差和置信規(guī)則庫的復雜系統(tǒng)安全性評估模型,采用ER 方法進行模型推理,并對WD615 型柴油機的安全性進行評估,提高了評估結(jié)果的準確性,降低了計算復雜度.Bao 等[90]提出了一種基于期望理論和ER 方法的直觀模糊決策方法,并在權(quán)重不完整和未知的情況下對屬性權(quán)重進行了優(yōu)化,并將其應用于解決MADM 中的決策方案排序問題.Zhou 等[91]將ER 規(guī)則推廣至群決策環(huán)境下的MADM 問題,充分考慮了專家和證據(jù)的區(qū)間權(quán)重和可靠度,并對電動汽車的使用壽命進行了評估.
模式識別又稱為模式分類,是指通過計算機用數(shù)學技術(shù)方法來研究模式的自動處理和判讀,是機器學習領(lǐng)域的一個新熱點[92].證據(jù)推理作為一種強大的不確定性推理方式,在模式識別領(lǐng)域受到了廣泛關(guān)注.
Van Cleynenbreugel 等[93]通過對同一場景的多時間SPOT 圖像進行信息提取,獲取各道路段的證據(jù),并采用D-S 證據(jù)理論進行道路網(wǎng)絡(luò)的路段識別,提高了識別的準確率.文獻[94]采用ER 方法對遙感多源數(shù)據(jù)進行分類,將證據(jù)的置信度表示為區(qū)間概率形式以表達不確定性,并對201 波段高分辨率成像光譜儀數(shù)據(jù)進行了有效分類.司小勝等[95]提出了一種基于證據(jù)推理的故障預報模型,通過非線性優(yōu)化來確定預測模型的參數(shù),有效解決了定量與定性不確定性信息下的非線性系統(tǒng)故障預報問題,并探索了該方法在工程實際中的應用潛力.Liu等[96]提出了一種基于原型的信用分類方法來處理不完整模式的分類問題,根據(jù)訓練樣本來估計數(shù)據(jù)的缺失值,通過證據(jù)的組合獲得了不完整模式的分類結(jié)果,在實驗測試中證明了所提方法的有效性.文獻[97]從證據(jù)的內(nèi)部沖突和外部沖突出發(fā)計算證據(jù)的相似性測度,對證據(jù)進行修正,基于聚類分析和Dempster 組合規(guī)則,有效解決了沖突證據(jù)合成的“反直覺”問題.Wang 等[98]針對離散模糊集和傳統(tǒng)匹配度方法存在的信息丟失問題,提出了一種新的基于直覺梯形模糊數(shù)和包含度量的直覺模糊證據(jù)推理方法,提高了證據(jù)表示和推理的準確性,所提方法在中風診斷中得到了驗證.周志杰等[99]提出了一種基于三階Volterra 級數(shù)和ER 算法的航天繼電器故障預測方法,為有效預防航天繼電器發(fā)生故障提供了輔助支持.袁杰等[100]針對過程知識類型多樣和運行數(shù)據(jù)不準確的復雜工業(yè)流程,采用D-S證據(jù)理論融合混合專家知識系統(tǒng)來進行故障診斷,提高了專家知識的利用率和專家系統(tǒng)的智能化程度.Xu 等[101]提出了一種基于ER 規(guī)則的分類方法,充分考慮了證據(jù)的權(quán)重和可靠度,并利用UCI 機器學習數(shù)據(jù)庫中的5 個流行的Benchmark 數(shù)據(jù)庫證明了所提分類方法具有較高的準確性.Yang 等[102]針對客戶投訴中存在的信息不準確和不一致的問題,開發(fā)了一種基于ER 規(guī)則的分類器,以作為決策支持系統(tǒng)的核心組件,為電信公司提供了信息化和數(shù)據(jù)驅(qū)動的方法.
S?nmez 等[103]采用證據(jù)推理方法來解決承包商資格預審問題,為解決決策者因信息缺乏、時間緊張和專業(yè)知識匱乏等而需要進行不確定、不完整或不精確評估的問題提供了有效的評估機制.Yang等[104]研究了遞歸ER 算法的非線性特征,并將其應用于汽車發(fā)動機質(zhì)量的評估和船舶設(shè)計的評估問題,證明了ER 方法在處理一般決策問題方面的潛力.文獻[105]以大腸桿菌群和異養(yǎng)板數(shù)為證據(jù)源,采用D-S 證據(jù)理論進行證據(jù)組合,對供水網(wǎng)絡(luò)的微生物水質(zhì)進行評估,為決策者提供了輔助決策.Xu等[106]將ER 方法作為BRB 專家系統(tǒng)的推理機,探討了BRB 的訓練方法,將其應用于管道泄漏檢測.Zhou 等[107]提出了一種專家干預下的基于BRB 專家系統(tǒng)的在線更新算法,實現(xiàn)了管道泄漏的有效檢測.為了進一步提高預測精度,Zhou 等[108]又提出了一種由兩個BRB 組成的系統(tǒng)行為預測模型,充分融合專家知識,并提出了預測模型的遞推更新算法,分別用于處理判斷輸出和數(shù)值輸出.Hu 等[109]提出了一種新的基于ER 算法的系統(tǒng)可靠性預測技術(shù),并對渦輪增壓器發(fā)動機系統(tǒng)的可靠性進行預測,提高了預測性能和速度.Chen 等[110]提出了兩種優(yōu)化方法,應用BRB 系統(tǒng)求解了一個非線性現(xiàn)金流約束下的高維非線性投資組合優(yōu)化問題,對RiskMetrics WealthBench 系統(tǒng)進行了有效的補充.Fu 等[111]針對多屬性群決策分析中存在的專家不可靠問題,在考慮專家可靠度的基礎(chǔ)上提出了一種新的基于ER 規(guī)則的決策方法,并對安徽省蕪湖市進行了行業(yè)評價.Chen 等[112]針對離散置信結(jié)構(gòu)的組合問題,將傳統(tǒng)的證據(jù)推理擴展至具有離散結(jié)構(gòu)的證據(jù)推理,為非沖突離散證據(jù)的組合提供了合理方案,同時有效解決了內(nèi)部或外部沖突證據(jù)組合產(chǎn)生的“反直覺”問題.
本文總結(jié)分析了證據(jù)推理理論的發(fā)展過程,系統(tǒng)梳理了國內(nèi)外典型相關(guān)文獻的主要工作,為證據(jù)推理的發(fā)展和改進提供了一定的參考和借鑒.作為一種強大的不確定性推理方法,證據(jù)推理為不確定信息的表達和傳遞提供了一個良好的框架,在評估與決策中發(fā)揮了重要作用,其主要特征總結(jié)如下:
1)證據(jù)推理構(gòu)成聯(lián)合概率推理過程,是傳統(tǒng)貝葉斯理論的一般化,其推理過程清晰透明,具有可解釋性.證據(jù)推理采用正交和算子對證據(jù)的加權(quán)置信分布進行運算,通過嚴格的概率推理,保證了證據(jù)組合過程的可追溯,推理結(jié)果為置信分布形式,保證了可解釋性,同時滿足證據(jù)組合的可交換性和可結(jié)合性.
2)證據(jù)的三要素包括置信分布、權(quán)重和可靠度,其中權(quán)重和可靠度可通過歷史數(shù)據(jù)進行訓練以優(yōu)化系統(tǒng)的性能.證據(jù)的置信分布是證據(jù)的基本表達形式,是一種廣義的概率表達,既能夠表征局部無知性,也能夠表征全局無知性.由于證據(jù)的權(quán)重和可靠度在大多數(shù)情況下是由專家依據(jù)領(lǐng)域經(jīng)驗而給出的,帶有一定的主觀性和不確定性,因此有必要對其進行優(yōu)化更新,以獲取更精確的權(quán)重和可靠度,保證融合結(jié)果的準確性.
3)證據(jù)推理可以是純數(shù)據(jù)驅(qū)動型,也可以融合定量信息和定性知識.通過一定的規(guī)則,證據(jù)推理能夠?qū)⒏鞣N形式的輸入轉(zhuǎn)化至統(tǒng)一的置信框架,并進行證據(jù)的組合,而這也恰恰是證據(jù)推理相比于決策理論、模糊理論和傳統(tǒng)貝葉斯理論的優(yōu)勢所在.
4)證據(jù)推理可以對多種不確定性進行表達、建模和分析,如隨機性、模糊性和無知性等.證據(jù)推理提供了一種強有力的信息表達方式,不確定性能夠通過一定的規(guī)則轉(zhuǎn)化為概率,并通過置信分布形式進行表達,并在證據(jù)組合的過程中無損失地傳遞,直至組合結(jié)果.此外,證據(jù)推理可以有效表達區(qū)間形式的不確定性,這也進一步提高了其表達不確定性的能力[113].
5)證據(jù)推理滿足不支持原則、一致性原則、局部性原則和非支配性原則.其中,不支持原則是指如果沒有任何證據(jù)支持某個假設(shè),則合成之后的結(jié)果也將不支持該假設(shè);一致性原則是指如果所有證據(jù)完全支持某個假設(shè),則合成之后的結(jié)果也將完全支持該假設(shè);局部性原則是指如果所有證據(jù)支持相同的假設(shè)子集,則合成之后的結(jié)果也將支持該假設(shè)子集,而不支持該假設(shè)子集之外的假設(shè)和假設(shè)子集;非支配性原則是指如果至少一條證據(jù)支持某個假設(shè),且沒有任何證據(jù)起支配作用,則合成之后的結(jié)果也將部分支持該假設(shè).
證據(jù)推理的未來發(fā)展可分為以下幾個方面:
1)互斥證據(jù)組合的合理性證明.盡管目前學術(shù)界普遍認為兩條互斥證據(jù)的組合應該是加性的,但仍需要從概率統(tǒng)計的角度給出嚴格證明.因此,給出互斥證據(jù)組合的合理性證明是支撐證據(jù)推理理論發(fā)展的核心之一.
2)不獨立證據(jù)的組合.證據(jù)推理理論的前提條件是每條證據(jù)相互獨立,而在實際應用背景中,證據(jù)之間會存在相關(guān)性,難以保證相互獨立.因此,研究一種新的不依賴于證據(jù)獨立的證據(jù)組合規(guī)則是證據(jù)推理理論發(fā)展的方向之一.
3)證據(jù)權(quán)重與可靠度的確定.作為證據(jù)的兩大關(guān)鍵參數(shù),證據(jù)權(quán)重和可靠度在學術(shù)界得到了廣泛研究.典型的權(quán)重求取方法有變異系數(shù)法,離差最大化法,客觀賦權(quán)法,專家打分法等;而典型的可靠度求取方法有基于距離的方法,基于概率統(tǒng)計的方法,面向任務(wù)的方法,基于復雜度的方法等.但所提方法大多只適用于一定的工程背景,不具有普適性.因此,研究一種通用的證據(jù)權(quán)重及可靠度確定方法是證據(jù)推理理論發(fā)展的重點之一.
4)證據(jù)的擾動分析.在工程實踐中,復雜系統(tǒng)往往會受到各種擾動因素的影響,如何定量表征擾動對證據(jù)源的影響程度、確保證據(jù)在獲取過程中不會受到損失、緩解并消除擾動的作用,是證據(jù)推理魯棒性研究的關(guān)鍵所在.
5)可解釋的深度證據(jù)推理.證據(jù)推理在低維系統(tǒng)建模方面的效果較為理想,但在高維復雜系統(tǒng)中的建模能力仍有待進一步檢驗.深度學習是目前人工智能領(lǐng)域較受歡迎的方法,具有強大的數(shù)據(jù)挖掘和學習能力,但缺乏可解釋性.因此,如何在保證證據(jù)推理可解釋性的前提下,將證據(jù)推理和深度學習相結(jié)合,以提高證據(jù)推理的建模學習能力,是證據(jù)推理理論未來向深入拓展的立足點之一.
6)基于證據(jù)推理的數(shù)據(jù)分析與可解釋機器學習.在大數(shù)據(jù)和人工智能盛行的背景下,機器學習以其擬合性能好、算法精度和運行效率高等特點脫穎而出.然而,機器學習無法綜合考慮專家系統(tǒng)存在的各類不確定性,存在可解釋性難以保持的不足.作為專家系統(tǒng)的強大引擎和信息融合機制,證據(jù)推理可以較好地彌補這些不足,實現(xiàn)有效的數(shù)據(jù)分析和可解釋機器學習,這也是證據(jù)推理未來的發(fā)展趨勢之一.