尹龍軍, 劉 勇
(重慶郵電大學 理學院, 重慶 400065)
三支決策是Yao[1-3]在長期研究粗糙集,特別是概率粗糙集和決策粗糙集過程中,總結和提煉出來的一種符合人類實際認知能力的決策模式.三支決策粗糙集將傳統正域、負域二支決策語義拓廣成正域、負域和邊界域3種決策語義[4-7],從而做出接受、拒絕和延遲決策3種決策,很好地對應了人類的決策思想.三支決策粗糙集通過引進貝葉斯風險理論并計算最小風險代價確定了正域、負域和邊界域的劃分,為選取最優決策提供了理論依據.計算過程中基于最小風險代價的概率閾值計算方法也使得傳統概率粗糙集模型的概率閾值有了理論基礎.
近幾年來,三支決策理論已成為國內外專家學者研究的熱點.劉盾等[8]對三支決策理論提出了新的研究方法和應用領域;杜麗娜等[9]將貝葉斯原理和基于決策粗糙集的三支決策規則引入到模糊綜合評判中,提出了基于三支決策風險最小化的風險投資評判模型;張里博等[10]采用代價敏感三支決策方法求得相應粒度下的最小代價決策.
本文主要在以上研究的基礎上,將被決策者所處的狀態由X和X的補集2種狀態推廣為多種狀態,并提出了一種狀態概率的計算方法,然后利用狀態概率和不同狀態的決策代價計算出最終做出3種決策的決策代價.
定義1.1[11](上下近似集) 給定知識表達系統S=〈U,R,V,f〉,對于每一個子集X?U和不分明關系B、X的上近似集和下近似集分別可以由B的基本集定義如下:
B-(X)={x|(x∈U∧[x]B?X)},
B-(X)={x|(x∈U∧[x]B∩X≠?)},
即當且僅當[x]B?X,x∈B-(X);當且僅當[x]B∩X=?,x∈B-(X);集合BNDB(X)=B-(X)B-(X)稱為X的B邊界;POSB(X)=B-(X)稱為X的B正域;NEGB(X)=U-B-(X)稱為X的B負域.
定義1.2[12]((α,β)-上下近似集) 給定信息表達系統S=〈U,R,V,f〉,對X?U,令0≤β<α≤1,則概率粗糙集的(α,β)-上下近似集可以表示為:
在概率粗糙集中,(α,β)-上下近似集將論域分為3個部分:
POS(α,β)(X)={x∈U|Pr(X|[x])≥α},
BND(α,β)(X)={x∈U|β NEG(α,β)(X)={x∈U|Pr(X|[x])≤β}. 利用粗糙集的3個論域,可以獲得最直觀、簡單的三支決策模型: 當Pr(X|[x])≥α時,接受;當Pr(X|[x])≤β時,拒絕;當β 當α=1,β=0時,稱為Pawlak粗糙集[13-14],Pawlak粗糙集接受條件比較嚴苛,而對于拒絕的條件過于寬松,這種模型在容錯率方面很差,完全不考慮實際應用中可能存在錯誤分類.因此產生了0.5-概率粗糙集,這種模型完全基于多數服從少數的原則,這種方案往往在實際應用中顯得接受條件過于寬松,相對于Pawlak粗糙集和0.5-概率粗糙集,(α,β)-粗糙集則比較靈活,可以通過適當的設定α、β值來控制接受、拒絕和延遲的條件,其決策過程也更為靈活和合理.粗糙集在決策過程中,往往僅考慮閾值形式,當Pr(X|[x]R)≥α時,x∈POS(X);當β 通常情況下,α、β的取值由專家給定,并沒有回答如何給定,劉盾等[12]通過詳細討論α+β>1、α+β=1、α+β<1等條件下的三支決策模型,給出了基于概率粗糙集的三支決策模型. 定義1.3[15-16](三支決策) 設Ω={X,X}表示2種狀態集合,分別表示對象屬于集合X和對象屬于集合X的補集.集合A={aP,aB,aN}對應3種決策動作:接受、拒絕和延遲.決策過程中往往存在不同的代價損失,設λPP、λBP和λNP表示當一個對象屬于集合X時分別采取行動aP、aB、aN時所付出的代價,λPN、λBN和λNN分別表示當一個對象屬于X補集時分別采取行動aP、aB、aN所付出的代價. 因此,對集合[x]中的對象采取3種決策所產生的代價函數分別為: R(aP|[x])=λPPPr(X|[x])+ λPNPr(X|[x]), R(aB|[x])=λBPPr(X|[x])+ λBNPr(X|[x]), R(aN|[x])=λNPPr(X|[x])+ λNNPr(X|[x]). 根據最小風險決策規則: 1) 如果R(aP|[x])≤R(aB|[x])且R(aP|[x])≤R(aN|[x]),則x∈POS(X)選擇行動決策aP; 2) 如果R(aB|[x])≤R(aP|[x])且R(aB|[x])≤R(aN|[x]),則x∈BND(X)選擇行動決策aB; 3) 如果R(aN|[x])≤R(aP|[x])且R(aN|[x])≤R(aB|[x]),則x∈NEG(X)選擇行動決策aN. 由于Pr(X|[x])+Pr(-X|[x])=1,根據實際情況,當一個對象屬于X時,選擇接受的代價一般不應該大于延遲決策和拒絕的代價.同理,當一個對象屬于X的補集時,選擇拒絕的代價一般不應該大于延遲決策和接受的代價,因此有 0≤λPP≤λBP≤λNP, 0≤λNN≤λBN≤λPN. (*) 目前大多數的研究中,主要是在狀態集Ω={X,-X}共2種狀態下,討論分別做出3種決策A={aP,aB,aN}時的代價,從而做出代價最小的決策.本文主要針對被決策者本身處于多種狀態下,利用條件概率及決策代價矩陣,結合參與決策者的可信度(權重),從而獲得3種決策的代價值,最終選取代價最優的決策方案. 2.1多狀態下三支決策代價表設狀態集為Ω={X1,X2,…Xk},決策集為A={aP,aB,aN},對不同狀態分別采取aP、aB、aN共3種決策會導致不同的損失,記λPi、λBi、λNi(i=1,2,…,k)為[x]的真實狀態為Xi時,分別采取aP、aB、aN共3種決策的代價值,見表1. 表 1 多狀態下三支決策代價函數 一般來說XiXj=?(i,j=1,2,…,k,i≠j);λPi、λBi、λNi(i=1,2,…,k)一般不具有(*)式的比較關系. 例1顧客對某企業員工進行評價,評分為1~10分,記為Xi(i=1,2,…,10),企業根據顧客的評價對員工進行考核,記為(aP,aB,aN)=(優秀,合格,不合格).當X1=10時,考核決策為優秀的代價顯然低于考核決策為合格和不合格,即λP1<λB1<λN1.當X3=8時,且決策者傾向于分數較高為優秀,在此時考核決策為優秀的代價將會比考核決策為合格高,同時考核決策為不合格的代價應該高于考核決策為合格,即λP3>λB3,λB3<λN3. 2.2Pr(Xi|[x]R)的獲取以Pr(Xi|[x]R)表示[x]屬于狀態Xi的概率,一般應該滿足 (1) (2) … (3) 3種決策下的代價分別為: (4) (5) (6) 根據三支決策規則: 若R(aP|[x]R)≤R(aB|[x]R)且R(aP|[x]R)≤R(aN|[x]R),則實施決策aP; 若R(aB|[x]R)≤R(aP|[x]R)且R(aB|[x]R)≤R(aN|[x]R),則實施決策aB; 若R(aN|[x]R)≤R(aP|[x]R)且R(aN|[x]R)≤R(aB|[x]R),則實施決策aN. 根據上述的決策模型,以某高校學生評價教師為例,某班級的學生(參與決策者)對任課教師(被決策者)做出評價,需要利用學生(參與決策者)的評價結果對教師(被決策者)做出優秀(aP)、良好(aB)、合格(aN)共3種決策過程.學生(參與決策者)對教師(被決策者)的評價從狀態集Ω={X1,X2,X3,X4}={非常滿意,滿意,一般,不滿意}共4個方面進行模糊評價,設決策代價如表2. 表 2 決策代價函數 選取某一教師的評價結果為 Vji={(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0) (1,0,0,0);(0,1,0,0);(0,1,0,0);(0,1,0,0); (0,1,0,0);(0,1,0,0);(0,1,0,0);(0,1,0,0) (0,1,0,0);(0,1,0,0);(0,1,0,0);(0,0,1,0); (0,0,1,0);(0,0,1,0);(0,0,0,1)}, 即有16人對該教師評價為非常滿意,10人對該教師評價為滿意,3人對該教師評價為一般,1人對該教師評價為不滿意. 設30個學生評價的權重系數分別為 σj={0.81,0.98,0.95,0.8,0.9,0.81,0.99, 0.91,0.93,0.92,0.96,0.90,0.98,0.90,0.97, 0.83,0.93,0.80,0.97,0.87,0.81,0.98,0.95, 0.92,0.96,0.97,0.87,0.95,0.89,0.84}. 利用(1)~(3)式計算得到: Pr(X1|[x]R)=0.533 6, Pr(X2|[x]R)=0.336 1, Pr(X3|[x]R)=0.099 4, Pr(X4|[x]R)=0.030 1. 再利用(4)~(6)式得到3種決策的代價值分別為: R(aP|[x]R)=0.337 05, R(aB|[x]R)=0.262 10, R(aN|[x]R)=0.895 47. 由三支決策的原則,故對該教師的最終評價確定為良好代價最小. 從整個決策過程可以看出,雖然對該教師評價為非常滿意和滿意的人數已經超過86%,但由于代價函數表中λP2和λB1比較高,即認為評價狀態為“滿意”時決策為“優秀”的代價和評價狀態為“非常滿意”時決策為“良好”的代價比較高,即認為評價狀態為“滿意”的情況下更傾向于決策為“良好”,如果決策者認為“滿意”更加傾向于“優秀”的話,只需要調低λP2和調高λB1可以得到不同的決策結論.該模型在實際應用中可以根據參與決策者(評價者)的評價偏向對決策代價進行相應的調整,從而獲得最優的決策.例如在評價過程中,多數評價者認為“滿意”已經是很高的評價了,則只需要將表2的λP2調低,將λB1調高即可. 本文將概率粗糙集與三支決策思想相結合,在X和X的補集2種狀態下,將三支決策代價的研究推廣到X1,X2,…,Xk多種狀態下進行三支決策的代價研究,并在獲取對象的各狀態概率時引入決策者權重,最終利用參與決策者的模糊評價結果對被評價者(被決策者)做出最優決策.現實生活中,各行各業都廣泛應用顧客滿意度調查,而在調查中,往往不是由顧客(參與決策者)直接給出分數,而是從不同的方面對被決策者給出模糊的評價.本模型即可以利用大量的模糊評價來計算三支決策的代價,從而對被評價者(被決策者)做出最優的決策. 致謝重慶郵電大學教改項目(XJG1423)和重慶郵電大學自然科學基金(A2011-22)對本文給予了資助,謹致謝意.2 基于粗糙集的多狀態下的三支決策模型


3 算法實例

4 結束語