魏子欽, 郭鑫瀅, 黃煜琪, 劉久兵
1.汕頭大學 理學院,廣東 汕頭 515063;2.汕頭大學 商學院,廣東 汕頭 515063
1990年,加拿大華人學者姚一豫教授[1]基于貝葉斯風險決策理論提出決策粗糙集模型,該模型將經典粗糙集中的等價關系拓展為概率包含關系,使其對數據的處理具有容錯能力和敏感性特征,更適合處理代價損失敏感的評估決策問題. 隨著決策粗糙集模型的深入研究,三支決策概念[2]便應運而生,它在傳統接受決策和拒絕決策的基礎上增加了延遲決策,是傳統二支決策的拓展[3]. 由于比較符合人類自然語言信息的處理,三支決策近年來引起了國內外學者的廣泛關注與研究,并在信息過濾[4]、 沖突分析[5]、 概念學習[6]、 數據聚類[7]、 推薦系統[8]、 頻繁模式挖掘[9]、 粒計算[10]、 特征選擇[11]和信息系統[12]等領域得到成功應用.
在三支決策理論與方法中,概率閾值對(α,β)的確定是一個非常重要的研究問題. 從已有的文獻來看,三支決策概率閾值確定方法大多是基于單個決策者給出的代價損失函數來獲得的[2-3,10-15]. 然而,由于單個決策者給出的代價損失函數具有單一性和片面性,且難以反映真實代價問題,而群決策能夠集成每個專家的智慧,能更加真實地反映綜合代價損失. 近年來群決策環境下概率閾值的確定與三支決策方法的研究引起了學者的關注并取得一些成果. Liang等[16]從信息粒度的角度出發,采用區間值信息粒化的方法刻畫群體中專家個體的損失函數矩陣及集成矩陣,提出了一種基于信息粒的三支群決策方法;Sun等[17]在滿足最小風險決策規則的基礎上,構建具有損失函數為語言信息的決策理論粗糙集模型并提出群決策下的三支決策方法;Zhang等[18]基于最優粒度原則提出具有區間值決策理論粗糙集的三支決策框架并將其推廣到群體決策中,進而提出三支群決策方法;Pang等[19]基于多元粒化和三支決策的思想,建立基于區間值直覺不確定語言環境下的多屬性群體決策方法;Liu等[20]采用直覺模糊加權平均算子集成不同決策者提供的區間直覺模糊評價信息,獲得區間直覺模糊綜合損失函數評價結果,基于最優化方法建立一種確定三支決策概率閾值及規則的優化模型;Wang等[21]采用社會網絡分析方法研究專家群體觀點一致性的實現機制,進而提出了一種序貫三支多屬性群決策方法;Liu等[22]采用直覺模糊數相似測度定義了專家群體的一致性指標,設計了基于凸組合的評價更新機制及兩步策略下的直覺模糊三支群決策方法;Liang等[23]構建了基于層次社會網絡分析的評價調整機制,并采用不一致決策者與領導者之間的最大貼近度來建立實現專家一致性模型,從而獲得三支分類規則.
從現有的三支群決策方法可知,大多數研究是從給定專家權重,修改專家評價的角度來考慮的,即采用集成方法來集成不同專家給出的評價信息,從而獲得綜合損失函數評價結果. 當專家群體一致性指標達不到一致性要求時,通常采用修改個體損失評價信息的策略來提高專家群體的一致性. 但是,這種修改策略通常難以保證算法的收斂性,并且具有一定的主觀性[24],而模糊數為處理這種主觀性提供了有效的方法[25]. 因此,本研究采用語言直覺模糊數來刻畫損失函數,從調整專家權重的視角設計提高專家群體綜合損失函數一致性的迭代算法,同時從理論上證明了該算法的收斂性. 采用該算法可獲得具有群體共識的綜合損失函數. 進而根據單一優化模型的方法建立語言直覺模糊信息下的三支群決策閾值確定模型,并獲得三支決策知識.
決策粗糙集模型由2種狀態和3種行動構成[2]. 設狀態集X={C,C},表示對象屬于C和C兩種狀態. 行動集記為A={aP,aB,aN},其中aP,aB和aN分別表示對象屬于接受決策、 延遲決策和拒絕決策的3種行動,即:x∈POS(C)、x∈BND(C)和x∈NEG(C). 這3種行動在2種狀態下對應的損失可采用3×2矩陣表示,具體見表1.
表1 2種狀態3種行動下的決策代價損失矩陣
表1中λPP,λBP和λNP表示對象屬于狀態C時,采取aP,aB和aN3種行動的代價損失. 類似地,當λPN,λBN和λNN表示對象不屬于狀態C時,分別采取3種行動對應的損失. 設Pr(C|[x])為對象x隸屬于狀態C的條件概率,對象x通常用等價類[x]表示,則對象x的決策代價損失函數R(a*|[x])(*=P,B,N)的計算公式為:
R(a*|[x])=λ*PPr(C|[x])+λ*NPr(C|[x])
根據貝葉斯最小風險決策理論,可得以下決策規則[2]:
P 當R(aP|[x])≤R(aB|[x])且R(aP|[x])≤R(aN|[x])時,x∈POS(C);
B 當R(aB|[x])≤R(aP|[x])且R(aB|[x])≤R(aN|[x])時,x∈BND(C);
N 當R(aN|[x])≤R(aP|[x])且R(aN|[x])≤R(aB|[x])時,x∈NEG(C).
上述規則P-N稱之為三支決策[2-3]. 基于Pr(C|[x])+Pr(C|[x])=1,規則P-N通常考慮如下合理情形:
λPP≤λBP≤λNP
λNN≤λBN≤λPN
進一步可簡化為規則P1-N1:
P1 當Pr(C|[x])≥α且Pr(C|[x])≥γ時,x∈POS(C);
B1 當Pr(C|[x])≤α且Pr(C|[x])≥β時,x∈BND(C);
N1 當Pr(C|[x])≤β且Pr(C|[x])≤γ時,x∈NEG(C).
其中α,β和γ可表達為:
其中: 閾值α,β和γ滿足0≤α≤1、 0≤β≤1且0≤γ≤1. 此外,從規則B1中可知,閾值α和β存在兩種情形: (Ⅰ)α>β和(Ⅱ)α≤β.
(Ⅰ)α>β,滿足: (λPN-λBN)(λNP-λBP)>(λBP-λPP)(λBN-λNN)可得α>γ>β,此時規則P1-N1進一步簡化為:
P2 當Pr(C|[x])≥α時,x∈POS(C);
B2 當β N2 當Pr(C|[x])≤β時,x∈NEG(C). (Ⅱ) 當α≤β,滿足: (λPN-λBN)(λNP-λBP)>(λBP-λPP)(λBN-λNN). 此時規則P1-N1簡化為二支決策如下: P3 如果Pr(C|[x])≥γ,x∈POS(C); N3 如果Pr(C|[x])<γ時,x∈NEG(C). 在介紹語言直覺模糊數之前,首先給出直覺模糊數的定義[26]. 定義1設U={x1,x2,…,xn}為某非空論域. 則U上的直覺模糊集F定義為: F={(x,μF(x),νF(x))|x∈U} 基于直覺模糊數的概念,給出語言直覺模糊數的定義[27]. 考慮到語言直覺模糊數在刻畫不確定損失函數方面相比于其他評價更靈活,且更符合人類自然語言的表達. 為此,本研究采用語言直覺模糊數來評價損失函數,進而形成語言直覺模糊三支群決策問題,該問題包括Ω={C,C}?{P,N}2種狀態和A={aP,aB,aN}3種行動. 專家在2種狀態°(°=P,N)下采取3種行動a*(*=P,B,N)將會產生相應的6種損失:λPP,λBP,λNP,λNN,λBN和λPN. 邀請n(n≥2)位專家針對m個對象分別給出語言直覺模糊損失評價. 設E={e1,e2,…,en}是由n個專家組成的集合,X={x1,x2,…,xm}是由m個對象組成的集合,W=(ω1,ω2,…,ωn)T是專家權重向量,其中且0≤ωk≤1. 為了獲得具有群體共識的綜合損失函數與三支決策規則,專家需要提供代價損失函數評價值. 實際中,專家們能基于離散語言術語S={s0,s1,…,sg}采用語言直覺模糊數表達他們的偏好. 設專家ek給出的代價損失函數評價值為k=1,2,…,n;i=1,2,…,m;j表示第j個代價損失函數,且j=1,2,…,6. 其中專家ek針對m個對象xi提出的代價損失函數評價值構成專家評價矩陣Ek,其中為: ekλPP(1)λBP(2)λNP(3)λNN(4)λBN(5)λPN(6)Ek=x1x2?xi?xmλk11λk21?λki1?λkm1 λk12λk22?λki2?λkm2λk13λk23?λki3?λkm3λk14λk24?λki4?λkm4λk15λk25?λki5?λkm5λk16λk26?λki6?λkm6 為了表達方便,將第k個專家的評價矩陣Ek簡記為Ek=(Ek1,Ek2,…,Eki,…,Ekm)T,其中Eki為矩陣Ek中第i個對象對應的6個代價損失函數構成的行向量. 采用最優集成方法將n個專家提供的評價矩陣Ek進行集成,從而獲得具有群體共識的綜合損失函數評價矩陣E,可表達為: λPP(1)λBP(2)λNP(3)λNN(4)λBN(5)λPN(6)E=x1x2?xi?xmλ11λ21?λi1?λm1 λ12λ22?λi2?λm2λ13λ23?λi3?λm3λ14λ24?λi4?λm4λ15λ25?λi5?λm5λ16λ26?λi6?λm6 為了表達方便,專家綜合評價矩陣E可類似地表達為E=(E1,E2,…,Ei,…,Em)T,其中Ei為矩陣E中第i個對象對應的6個代價損失函數構成的行向量. 根據上述問題和表達方式,下面給出語言直覺模糊相似測度,并采用該測度來度量專家個體給出的語言直覺模糊評價矩陣Ek與群體綜合評價矩陣E之間的相似性,進而構建群體一致度指標,且采用該指標度量群體的綜合一致性水平,進而建立基于語言直覺模糊相似度的最優集成模型. 根據海明距離,首先給出語言直覺模糊損失函數距離的定義. 定義3設Eki為第k(k=1,2,…,n)個專家關于第i(i=1,2,…,m)個對象的6個代價損失函數構成的行向量,Ei為n個專家對第i個對象的6個綜合代價損失函數構成的行向量,則Eki與Ei之間的距離測度定義為: 其中f為語言術語集S={s0,s1,…,sg}到實數集R之間的映射. 為了計算方便,假設映射f為f(su)=u/g,f(sv)=v/g. 定義4設Ek為第k(k=1,2,…,n)個專家ek給出的語言直覺模糊評價矩陣,E為群體綜合評價矩陣. 則Ek與E之間的相似測度S(Ek,E)定義為: 基于定義4,構建群體一致度指標GCI. 定義5設S(Ek,E)為專家ek給出的語言直覺模糊評價矩陣Ek和群體綜合評價矩陣E之間的相似測度,則由n個專家構成的群體一致度指標GCI定義為: 根據Lee[28]的研究成果,建立基于第k個專家給出的語言直覺模糊評價矩陣Ek與群體綜合評價矩陣E之間非相似度最小的最優集成模型. 具體為: (1) 其中t>1為整數且c>1是常數. 根據模型(1), 可得命題1[28]. 命題1當專家權重ωk(k=1,2,…,n)和群體綜合評價矩陣E滿足下列關系時,模型(1)達到局部最小值. 基于命題1,設計一種實現語言直覺模糊綜合損失函數一致性的迭代算法,并證明該算法的收斂性. 分析儀表是電廠鍋爐給水、機組循環汽水生產過程中重要的設備,是監測機組循環汽水的水質和水處理系統設備運行狀態的離子定量分析儀表。鍋爐給水及機組循環汽水的水質會直接影響鍋爐、汽輪機的安全運行,也會影響火力發電廠的經濟和社會效益,因此電廠越來越重視鍋爐給水及機組循環汽水分析儀表。 算法1: 基于最優集成模型的綜合損失函數一致性實現算法 輸入: 專家ek的個體評價矩陣Ek(k=1,2,…,n) 輸出: 具有群體共識的綜合損失函數矩陣E W(0)=W, r=0, whiler≥0 if |GCI(r+1)-GCI(r)|≤ε 輸出E(r+1) Break else r=r+1 end end ReturnE(r+1) 為了證明上述算法的收斂性,首先給出命題2. 命題2設f(x)是可導函數且f′(x)在閉區間[c,d]上有界. 則f(x)在[c,d]上是一致連續的,即對于任意x,y∈[c,d]滿足|x-y|<ε,則|f(x)-f(y)|<ε′,其中ε和ε′均為無窮小量,ε>0且ε′>0. 證因為f(x)是可導函數,f′(x)在閉區間[c,d]上有界,即存在一個極大的M>0,使得|f′(x)|≤M,并且對于任意x,y∈[a,b]滿足|x-y|<ε,則可以得到|f(x)-f(y)|=|f′(ξ)||x-y| 根據命題2,可進一步得到命題3. 證對于任意k=1,2,…,n,滿足|xk-yk|<ε,恒有: 根據命題3,可得命題4. 證 根據命題4,容易得到命題5. 證 當算法1的迭代終止條件|GCI(r+1)-GCI(r)|<ε替換為‖W(r+1)-W(r)‖<ε時,該算法可以退化成文獻[29]中的算法;而該文獻驗證了算法的收斂性,并結合命題5可知,上述基于權重迭代的一致性綜合損失函數獲取算法算法1是收斂的. 因此,采用算法1能獲得一致性綜合損失函數矩陣E. 為了方便后續討論,記E為如下: E=(E1,E2,…,Ei,…,Em)T (2) 根據Liu等[15]提出的語言直覺模糊三支決策閾值確定模型,下面建立確定語言直覺模糊三支群決策閾值的單一優化模型且首先給出下面命題. 根據貝葉斯風險決策理論,獲得三支決策規則: 規則P4-N4會涉及到語言直覺模糊排序方法,因此,采用文獻[15]中的排序方法對其進行排序. 首先給出命題7[15]. (3) 具體可化為: 其中: 下面給出基于語言直覺模糊數評價的三支群決策方法,具體步驟如下: 步驟3: 基于一致性綜合損失函數,建立確定語言直覺模糊三支群決策閾值的單一優化模型. i) 當αi>βi,采用三支決策規則,即: P6 若Pr(C|[xi])≥αi時,xi∈POS(C); B6 當βi N6 當Pr(C|[xi])≤βi時,xi∈NEG(C). ii) 當αi≤βi,采用二支決策規則,即: P7 如果Pr(C|[xi])≥αi,xi∈POS(C); N7 如果Pr(C|[xi])<βi,xi∈NEG(C). 假設某投資人面對3個投資項目X={x1,x2,x3},現考慮是否投資發展,這些項目根據以往經驗分為盈利的項目(C)和虧損的項目(C). 投資人根據上述項目可以選擇投資(aP)、 進一步考慮(aB)和不投資(aN)3種決策行動. 為了獲得巨大的經濟效益,投資人聘請了3位投資學專家來做出科學合理的決策. 設上述3個項目就每個項目選擇投資、 進一步考慮以及不投資行動后的代價損失函數由專家基于標度S={s0,s1,s2,s3,s4,s5,s6}給出,具體結果詳見表2-表4. 基于以上信息,投資人將如何做出投資決策?假定3個投資項目xi(i=1,2,3)對應的條件概率分別為Pr(C|[x1])=0.855 5,Pr(C|[x2])=0.125 0和Pr(C|[x3])=0.798 0. 表2 專家e1提供的6個損失函數的評價結果 表3 專家e2提供的6個損失函數的評價結果 表4 專家e3提供的6個損失函數的評價結果 步驟2: 給定誤差值ε=10-15,并設置參數r=0,t=3,c=2,采用算法1來獲取滿足一致性綜合代價損失函數矩陣(表5). 表5 一致性綜合代價損失函數 步驟4: 采用MATLAB求解該模型,并得到三支決策閾值對最優解(表6). 表6 基于本研究方法獲得的三支決策概率閾值和三支決策規則 從上述算例的決策步驟可知,本研究提出的三支群決策方法主要由兩個決策過程構成: 第1個決策過程是采用算法1來獲取滿足一致度指標的綜合代價損失函數矩陣E;第2個決策過程是建立確定語言直覺模糊三支群決策閾值的單一優化模型. 顯然,采用第2個決策過程可以有效地確定一致性閾值(表6). 下面主要討論第1個決策過程中群一致度指標和迭代誤差隨迭代次數的變化趨勢(圖1和圖2). 在此基礎上,探究參數c和t對迭代結果的影響(圖3-圖6). 首先,由圖1和圖2可知,當迭代次數達到第2次時,群一致度指標幾乎趨于穩定且收斂到較高的一致性水平,此時迭代誤差趨近于零. 因此,算法1的計算效率較高且收斂速度較快. 圖1 GCI關于迭代次數的變化曲線 圖2 迭代誤差關于迭代次數的變化曲線 其次,從圖3和圖4可知: 當參數t相同時,改變參數c,對迭代次數和群一致度指標值產生微小的影響,而對迭代誤差值幾乎沒有影響. 另外,迭代次數隨著參數c的增大呈現減小的趨勢;當算法1的迭代誤差達到10-15時,群一致度指標值會隨著參數c的增大呈現增大的趨勢. 例如,當參數c=6,算法1在第7次迭代停止時,群一致度指標值達到最大. 圖3 GCI關于參數c的變化曲線 圖4 迭代誤差關于參數c的變化曲線 最后,圖5和圖6可得類似的結論: 當參數c相同時,迭代次數隨著參數t的增大呈現減小的趨勢;且當算法1的迭代誤差達到10-15時,群一致度指標值會隨著參數t的增大呈現增大的趨勢. 圖5 GCI關于參數t的變化曲線 圖6 迭代誤差關于參數t的變化曲線 總而言之,從圖1-圖6可得,采用算法1得到的迭代結果具有一定的穩定性和準確性. 為了突出本研究提出方法的有效性和優勢,本研究將所提出的方法與基于決策粗糙集的三支決策方法[2]進行比較分析(圖7). 在算例中條件概率分別為Pr(C|[x1])=0.855 5,Pr(C|[x2])=0.125 0,Pr(C|[x3])=0.798 0的前提下,采用本研究提出的方法與文獻[2]的方法所獲得的三支決策結果是完全一致的. a. Pr(C|xi)=0.855 5 本研究針對基于語言直覺模糊數評價損失函數的三支群決策問題,提出了具有群體共識的語言直覺模糊三支決策方法. 該方法采用語言直覺模糊數刻畫損失函數,并構造出專家個體評價矩陣,進而定義了語言直覺模糊相似測度及群體一致性指標. 其次,本研究設計了基于語言直覺模糊相似度的最優集成模型和基于權重迭代的一致性綜合損失函數獲取算法,并證明了該算法的收斂性. 基于該算法,獲得一致性群體綜合評價矩陣,并建立了語言直覺模糊三支群決策閾值的單一優化模型. 最后,采用投資策略的算例說明了所提出方法的有效性.1.2 語言直覺模糊數
2 基于群體共識的語言直覺模糊三支決策方法
2.1 語言直覺模糊三支群決策問題描述
2.2 基于語言直覺模糊相似度的最優集成模型
2.3 基于最優集成模型的綜合損失函數一致性實現算法及收斂性證明
2.4 基于一致性綜合損失函數的三支決策閾值確定模型
3 基于語言直覺模糊數評價的三支群決策方法
4 算例和仿真實驗
5 總結