王 偉, 劉付顯, 徐 浩
(空軍工程大學防空反導學院, 陜西 西安 710051)
在動態的環境中,決策主體獲得的信息通常是不完備、不一致的,因此主體間必然存在著沖突和分歧,而辯論是解決沖突的有效方法[1-2],并已經成為人工智能研究領域的熱點問題。文獻[3]提出的抽象辯論框架是影響較大的辯論模型,之后許多學者對抽象辯論框架進行了擴展,如基于規則的辯論框架[4]、雙極辯論框架[5]、擴展雙極辯論框架等[6]。
以上模型主要應用于確定性條件下的辯論推理,而實際的辯論過程存在著不確定性。近年來,國內外學者對不確定性條件下的辯論模型進行了研究,如文獻[7]提出的基于偏好的辯論框架、文獻[8]提出的基于Dempster-Shfer理論的辯論框架、文獻[9-10]提出的基于可信度的辯論模型和基于證據理論的辯論模型等。以上模型用不同方法實現了辯論模型的不確定性描述,但其對辯論系統中論據之間關系的構建還不夠全面。
本文在論據內部結構的描述上借鑒文獻[11]的模型,對論據之間關系的描述進行了擴展,論據之間不僅存在相互攻擊和支援關系,還允許對這種攻擊和支援關系進行支持或反對。應用證據理論分析不確定性條件下的辯論推理過程,實現對論據信度的定量化描述。
群體研討是通過發言者之間的對話進行的,對話過程中產生的論據(觀點)構成了整個研討的內容。研討框架是對研討論據的形式化描述,包括論據的內部結構描述和論據之間的相互關系描述。本文在文獻[11]的基礎上提出一種擴展研討模型,不僅包括論據之間的攻擊和支援關系,還允許對這種攻擊和支援關系進行支持或反對。
定義1[11]陳述是對事物的表述,它可以是客觀數據、主觀判斷、事實現象、理論知識等,是構成論據的基本組成單位,記為h。



圖1 推理論據之間關系圖Fig.1 Diagram of relations between reasoning arguments
定義4規則論據是一個二元組Ag=(H,rll),其中,H是一個陳述集,rll是一個論據—論據關系,且滿足:①H是相容的;②邏輯上H推理出rll,記為H?rll。所有規則論據的集合記為Ag。


圖2 論據—規則關系圖Fig.2 Diagram of relations between arguments and rules
圖2(a)表示Cg反對At對Bt的攻擊;圖2(b)表示Cg支持At對Bt的攻擊;圖2(c)表示Cg反對At對Bt的支援;圖2(d)表示Cg支持At對Bt的支援。
定義6基于辯論的研討框架是一個二元組AG=(A,R),其中,A=At∪Ag是論據集,R=Rll∪Rlg是關系集。
在動態多變的環境中,論據及其論據之間的關系都存在不確定性,證據理論是表示和處理不確定性推理的有效方法,本文基于證據理論對研討模型的論據和關系進行分析。
定義7[12]對于一個判決問題,所有可能答案的完備集合為Θ={θ1,θ2,…,θn},且Θ中的元素都是兩兩互斥的,則稱Θ為識別框架。Θ的冪集記為2Θ。
定義8[13]對任意的命題A∈2Θ,定義映射m:2Θ→[0,1]滿足下列條件:
(1)m(?)=0

則稱m為Θ上的基本信度賦值(basic belief assignment, BBA)。
定義9[14]假設識別框架Θ下的兩個獨立證據m1和m2,根據Dempster組合規則進行融合得到m=m1⊕m2,定義為
(1)

定義10將某一陳述h的真假作為待判決的問題,構造陳述識別框架,記為Θh={True,False},其中True代表陳述為真,False代表陳述為假。
定義11對于陳述識別框架Θh={True,False},定義在2Θh上的信度賦值函數mh:2Θh→[0,1],其中,mh(True)=αh表示發言人根據當前態勢判斷此陳述為真的信度,mh(False)=βh表示陳述為假的信度,mh(Θh)=γh=1-α-β表示對陳述真假未知的信度,陳述h的信度值向量記為w(h)=(αh,βh,γh)。
定義12將某一前提H={h1,h2,…,hn}的真假作為待判決的問題,構造前提識別框架,記為ΘH={True,False}。

2.2.1 基于證據映射的推理規則表示
定義13[10,15]證據映射是指前提識別框架ΘH到結論識別框架Θh的映射,描述了從ΘH中各元素到Θh中各元素的推理關系。從ΘH到Θh的證據映射表示為Γ:ΘH→22Θh×[0,1]。對于ΘH中的每一個元素的證據映射表示為
(2)
式中,θHi為前提中的元素;θhij為結論中的元素;f(θHi→θhij)為θHi支持θhij的規則強度。

式(2)滿足以下條件:
(1)θhij≠?,j=1,2,…,m;
(2) 0 2.2.2 推理論據結論的計算 (4) 根據前提H的信度值向量w(H)和映射矩陣R(At),可得到結論h的信度值向量 w(h)=w(H)·R(At) (5) 假設有多個前提指向同一結論h,可根據Dempster組合規則對h的多個信度值向量進行融合,得到w(h)=w(h)1⊕w(h)2⊕…⊕w(h)k。 2.2.3 規則論據結論的計算 由于前提H與結論rll之間的規則關系較為復雜,將其分為兩類(第一類為前4項,第二類為后4項)分別計算后再合成。 式中,r31和r32的計算方法同式(3)和式(4)。 根據前提H的信度值向量w(H)和映射矩陣R1,可得到映射矩陣R(At)的第一行為 (6) 式中,r31和r32的計算方法同式(3)和式(4)。 可得到映射矩陣R(At)的第二行為 (7) 因此,在H的影響下,原映射矩陣R(At)更新為 (3)R(At)的第三行計算方法同式(3)、式(4)。 在研討過程中,當產生新的推理論據A2時,若存在論據—論據關系(A2,A1),則A2會改變A1的前提H1中某個陳述h1i的信度值,從而改變A1的結論h1的信度值。隨著研討的繼續進行,產生關系(A3,A2),則A3會改變A2的前提H2中某個陳述h2j的信度值,從而改變A2的結論h2(即為h1i)的信度值,最終改變A1的結論h1的信度值。另外,當產生新的規則論據A4時,若存在論據—規則關系(A4,(A2,A1)),則A4會改變A2到A1的映射矩陣R21,從而改變A2的結論h2(即為h1i)的信度值,最終改變A1的結論h1的信度值。因此,每增加一個新的論據時,整條論據鏈路上對應陳述的信度值都會改變。 (1) 當增加一個推理論據時研討框架內陳述信度值更新算法如下: 步驟1產生一個推理論據At=(HA,hA),設置前提HA={hA1,hA2,…,hAn}中各陳述hAi的初始信度值為w(hAi)0=(αhAi,βhAi,γhAi)0,計算HA的信度值w(HA)0,生成由HA到hA的推理規則映射矩陣RA。 步驟2計算hA的信度值w(hA)=w(HA)·RA,若hA為整個辯論的目標陳述,則陳述的信度值更新結束。若hA屬于某論據Bt=(HB,hB)的前提,即hA=hBj∈HB,則hA對hBj的信度值進行更新w(hBj)new=w(hBj)0⊕w(hA),更新HB的信度值w(HB)new,計算hB的信度值w(hB)=w(HB)new·RB。 若hB仍然屬于某論據的前提,則參照上述步驟2繼續執行更新操作,直至更新整個辯論的目標陳述為止。 (2)當增加一個規則論據時研討框架內陳述信度值更新算法如下: 步驟1產生一個規則論據Cg=(HC,rC),其中,前提HC={hC1,hC2,…,hCn},關系rC=(At,Bt)。設置各陳述hCi的初始信度值為w(hCi)0=(αhCi,βhCi,γhCi)0,計算HC的信度值w(HC),置At的初始映射矩陣為R(At)0,計算更新的后映射矩陣為R(At)new。 步驟2計算hA的更新信度值w(hA)new=w(HA)·R(At)new,進而hA對hBj的信度值進行更新w(hBj)new=w(hBj)0⊕w(hA)new,繼而更新hB的信度值。 若陳述h的信度值向量為w(h)=(αh,βh,γh),可以依據以下3種規則判斷其是否為可接受的: 規則1若αh>α0,則陳述h是可接受的。 規則2若βh<β0,則陳述h是可接受的。 規則3若αh-βh>ε0,則陳述h是可接受的。 式中,α0、β0、ε0為提前設定的閾值。具體采用哪種規則依據實際辯論問題進行選擇。 根據本文提出的群體研討模型,設計一個研討實例。參與研討的成員就某一主題展開辯論,隨著時間的推進產生一系列論據,論據的設置如表1所示,論據之間的關系如圖3所示。 表1 研討論據 圖3 論據關系圖Fig.3 Diagram of relations between arguments 時間節點1產生論據A1,前提H1的信度值w(H1)1=w(h11),規則映射矩陣 結論h的信度值w(h)1=w(H1)1·R11=(0.72,0.09,0.19)。 時間節點3產生論據A3,A3降低了A2前提的可信度,進而降低了h11的可信度,最終h的信度值更新為w(h)3≤=(0.776,0.086,0.138)。 時間節點7產生論據A7,A7提高了A4前提的可信度,進而降低了h12的可信度,最終h的信度值更新為w(h)7=(0.691,0.188,0.121))。 時間節點8產生論據A8,A8降低了A2前提的可信度,進而降低了h11的可信度,最終h的信度值更新為w(h)8=(0.669,0.178,0.153)。 時間節點9產生論據A9,A9降低了A5前提的可信度,進而降低了h12的可信度,最終h的信度值更新為w(h)9=(0.661,0.215,0.124)。 在整個研討中各陳述信度值更新過程如表2所示,其中加粗數字表示當前時間點陳述信度值更新。 表2 陳述信度值更新過程 假設陳述的可接受性判別采用規則一,若閾值α0=0.7,則研討結束時h為不可接受的。 本文針對不確定條件下的群體研討決策問題,構建了基于證據理論的辯論模型。在定義論據內部結構的基礎上,對論據之間的關系進行了分類,實現了辯論空間的形式化描述。為了分析不確定性條件下的辯論推理過程,引入證據理論描述論據的不確定性,應用證據映射方法對辯論過程進行不確定性推理,實現對辯論推演過程的定量化描述。本模型可應用于研討對話的建模,融合不同專家的意見,實現群體決策。 [1] AMGOUD L, PRADE H. Using arguments for making and explaining decisions[J].Artificial Intelligence,2009,173(3/4):413-436. [2] 陳陽, 向東, 趙勇. 基于辯論的群體研討建模與決策方法[J]. 系統工程理論與實踐, 2013, 33(7): 1633-1639. CHEN Y, XIANG D, ZHAO Y. Argumentation-based group discussion modeling and decision approach[J]. Systems Engineering—Theory & Practice, 2013, 33(7): 1633-1639. [3] DUNG P M. On the acceptability of arguments and its fundamental role in nonmonotonic reasoning, logic programming and n-person games[J]. Artificial Intelligence, 1995, 77(2): 321-357. [4] CAMINADA M, AMGOUD L. On the evaluation of argumentation formalisms[J].Artificial Intelligence,2007,171(5/6):286-310. [5] CAYROL C, LAGASQUIE-SCHIEX M C. Bipolarity in argumentation graphs: towards a better understanding[J]. International Journal of Approximate Reasoning,2013,54(7):876-899. [6] 陳俊良, 王長春, 陳超. 一種擴展雙極辯論模型[J]. 軟件學報, 2012, 23(6): 1444-1457. CHEN J L, WANG C C, CHEN C. Extended bipolar argumentation model[J].Journal of Software,2012,23(6):1444-1457. [7] AMGOUD L, VESIC S. A new approach for preference-based argumentation frameworks[J]. Annals of Mathematics and Artificial Intelligence, 2011, 63(2): 149-183. [8] TANG Y, HANG C W, PARSONS S, et al. Towards argumentation with symbolic Dempster-Shafer evidence[C]∥Proc.of the Computational Models of Argument, 2012: 462-469. [9] 熊才權,歐陽勇,梅清.基于可信度的辯論模型及爭議評價算法[J]. 軟件學報, 2014, 25(6): 1225-1238. XIONG C Q, OUYANG Y, MEI Q. Argumentation model based on certainty-factor and algorithms of argument evaluation[J]. Journal of Software, 2014, 25(6): 1225-1238. [10] XIONG C Q, ZHAN Y F, CHEN S B. An argumentation model based on evidence theory[C]∥Proc.of the 10th International Conference on Computer Science & Education,2015:451-454. [11] 熊才權, 李德華. 一種研討模型[J]. 軟件學報, 2009, 20(8): 2181-2190. XIONG C Q, LI D H. Model of argumentation[J]. Journal of Software, 2009, 20(8): 2181-2190. [12] 張鑫, 牟龍華. 基于局部沖突消除的證據合成法則[J]. 系統工程與電子技術, 2016, 38(7): 1594-1599. ZHANG X, MU L H. Evidence combination rule based on local conflict elimination[J]. Systems Engineering and Electronics, 2016, 38 (7): 1594-1599. [13] 韓德強,楊藝,韓崇昭.DS證據理論研究進展及相關問題探討[J].控制與決策,2014, 29(1): 1-11. HAN D Q, YANG Y, HAN C Z. Advances in DS evidence theory and related discussions[J]. Control and Decision, 2014, 29(1): 1-11. [14] SHAFER G. A mathematical theory of evidence[M]. Princeton: Princeton University Press, 1976. [15] LIU W, HUGHES J G, MCTEAR M F. Representing heuristic knowledge in DS theory[C]∥Proc.of the 8th International Conference on Uncertainty in artificial intelligence, 1992: 182-190.






2.3 陳述信度值的更新
2.4 陳述的可接受性判別
3 案例分析







4 結 論