梁美社,米據生,張少譜
(1.石家莊鐵道大學 數理系,河北 石家莊 050043;2.河北師范大學 數學科學學院,河北 石家莊 050024)
粗糙集最早是由Pawlak[1]于1982 年提出的。經典的粗糙集模型是建立在等價關系之上,由于等價關系的要求過于嚴苛,為了適應各類復雜數據環境,許多學者提出了包括優勢關系[2]、容差關系[3]、模糊關系[4]、鄰域關系[5]等擴展的粗糙集模型。考慮集合之間的重疊關系,許多研究者給出了該理論的概率推廣[6-8]。概率粗糙集模型是其中一種重要的推廣[9-11]。該模型中的概率近似算子是根據條件概率和閾值(能承受不確定性或分類錯誤的程度)來確定的。當前,概率粗糙集模型大致分為三類:決策理論粗糙集模型、變精度粗糙集模型和貝葉斯粗糙集模型。Yao 在文獻[12]中,基于粗糙隸屬度和粗糙包含度,重新討論了概率粗糙集近似算子,給出了3 個模型的統一框架。近年來,概率粗糙集模型在應用方面取得了很大進展[13-15],Sun 等[16]基于概率粗糙集的三支決策原理,提出了一種改進的Pawlak 沖突分析模型。與原有的Pawlak 沖突分析模型相比,所提出的模型不僅為處理沖突分析問題提供了新的視角和方法,而且克服了原有模型的局限性。基于模糊熵,Ma[17]給出了三支概率粗糙集模型中兩種屬性約簡方法。Yang 等[18]提出了基于模糊關系的概率粗糙集模型,并將其用于醫療診斷系統中。盡管該模型中采用了模糊關系,但真正起作用的是模糊關系的截關系。這意味著它仍然是基于經典二元關系的概率粗糙集模型。
概率理論中的事件一般指樣本空間中的精確指定的元素集合[19]。然而日常生活中,人們也常常遇到模糊的、不清晰的事件[20]。這就需要討論模糊概率近似空間框架下,模糊事件的概率粗糙近似問題。文獻[21]提出了4 種模糊概率近似算子,然后應用貝葉斯決策理論,研究了模糊事件的三支決策問題,指出了決策理論粗糙集與模糊概率粗糙集的關系。作為模糊集理論的重要推廣,直覺模糊集理論是Atanassov[22-23]于1986 年提出的。由于該理論在考慮隸屬度的同時,增加了元素對集合的非隸屬度和猶豫度等信息,因此比模糊集在表達模糊性上更加細膩,在處理不確定性問題方面更具靈活性和實用性。郭智蓮等[24]提出了基于直覺模糊關系的概率粗糙集模型。與文獻[18]類似,利用閾值將直覺模糊關系轉化成經典二元關系,它依然是基于經典二元關系的概率粗糙集模型。當前,在直覺模糊概率近似空間框架下,很少文獻對直覺模糊事件進行概率粗糙近似研究。因此,有必要將概率粗糙集模型進一步推廣到直覺模糊概率近似空間,進而拓展模型的應用。
在現有文獻的基礎上,本文首先定義了直覺模糊條件概率。在直覺模糊概率空間下構造了雙論域廣義直覺模糊概率粗糙集模型,討論了模型的主要性質。最后,將模型應用到臨床診斷系統中。
定義1[22-23]設U={x1,x2,···,xn}是非空有限論域,稱A={〈μA(x),νA(x)〉|x∈U}為U上的直覺模糊集合,其中 μA:U→[0,1],νA:U→[0,1]分別為U中元素a關于A的隸屬度和非隸屬度,且對于任意x∈U都滿足 0≤μA(x)+νA(x)≤1。稱πA(x)=1?μA(x)?νA(x)為x關于A的猶豫度或不確定度。如果對于任意x∈U都有 πA(x)=0,則直覺模糊集合退化成模糊集合。U上全體直覺模糊集記為IFS(U)。
定義2[22-23]對于任意A,B∈IFS(U),有:
1)A?B???x∈U,μA(x)≤μB(x)且 νA(x)≥νB(x);
2)A=B???x∈U,μA(x)=μB(x)且νA(x)=νB(x);
3)~A={〈νA(x),μA(x)〉|x∈U};
4)A∩B??{〈μA(x)∧μB(x),νA(x)∨νB(x)〉|x∈U};
5)A∪B??{〈μA(x)∨μB(x),νA(x)∧νB(x)〉|x∈U};
6)A⊕B={〈μA(x)+μB(x)?μA(x)μB(x),νA(x)νB(x)〉|x∈U};
7)A?B={〈μA(x)μB(x),νA(x)+νB(x)?νA(x)νB(x)〉|x∈U}。
設U、V是兩個非空有限論域,稱IR:U×V→[0,1]×[0,1]是U到V上的直覺模糊二元關系。對于任意x∈U,IR(x)={〈μIR(x,y1),νIR(x,y1)〉,〈μIR(x,y2),νIR(x,y2)〉,···,〈μIR(x,ym),νIR(x,ym)〉|yj∈V,j=1,2,···,m}
表示V上的直覺模糊集合。從粒的角度來看,IR(x)可以看成對象x的一個直覺模糊粒,而{IR(x)|x∈U}可看成U上的一個直覺模糊粒結構。
設U是一個非空有限論域,R是U×U上的一個等價關系,則稱(U,R)為一個近似空間。于是R產生了U上的一個劃分U/R={[xi]R|xi∈U},[xi]R稱為含xi的等價類。?X?U,X關于R的下近似和上近似分別定義為={(x∈U|[x]R?)X},={x∈U|[x]R∩X≠?}。稱序對為X關于等價關系R的粗糙集[1]。
設U是一個非空有限論域,R是U×U上的一個等價關系,P是定義在由U的子集構成的 σ代數上的概率測度,則稱(U,R,P)為一個概率近似空間。?X?U,0≤β<α≤1,X關于近似空間(U,R,P)及閾值 α、β 的概率粗糙下近似和上近似分別定義為

其中P(X|[x]R)表示[x]R中元素屬于X的概率。稱序對為X關于(U,R,P)及閾值 α、β的概率粗糙集[8]。
定義3[18]設U、V是兩個非空有限論域,稱R:U×V→[0,1]是U到V上的模糊二元關系。?λ∈[0,1],稱Rλ為R的 λ截關系,即Rλ={(x,y)∈U×V|R(x,y)≥λ}。?x∈U,令Rλ(x)={y∈V|R(x,y)≥λ}。
定義4[18]設U、V是兩個非空有限論域,R是U到V上的模糊二元關系。P是定義在由V的子集構成的 σ代數上的概率測度。稱(U,V,R,P)為U到V上的模糊概率近似空間。?λ∈[0,1],0≤β<α≤1,Y?V,則Y關于(U,V,R,P)及閾值 λ、α、β的下、上近似分別為

根據上下近似,很容易計算Y關于(U,V,R,P)及閾值 λ、α、β的模糊概率正域、負域以及邊界域,即

如果P(Y|Rλ(x))=|Y∩Rλ(x)|/|Rλ(x)|,其中|Rλ(x)|表示集合的Rλ(x)基數,R是U到V上的經典等價二元關系,令 α=1,β=0,則定義4 中模糊概率粗糙集將退化為經典粗糙集。
定義5[24]設U、V是兩個非空有限論域,稱IR 是U到V上的直覺模糊二元關系。?λ1,λ2∈[0,1],稱為 IR關于(λ1,λ2)的截關系,即={(x,y)∈U×V|μIR(x,y)≥λ1,νIR(x,y)≤λ2}。?x∈U,為對象x的截關系類,其中={y∈V|μIR(x,y)≥λ1,νIR(x,y)≤λ2}。
定義6[24]設U、V是兩個非空有限論域,稱IR 是U到V上的直覺模糊二元關系。P是定義在由V的子集構成的 σ代數上的概率測度。稱(U,V,IR,P)為U到V上的直覺模糊概率近似空間。?λ1,λ2∈[0,1],0≤β<α≤1,Y?V,則Y關于(U,V,IR,P)及閾值 λ1、λ2、α、β的下、上近似分別為

根據上、下近似,很容易計算Y關于(U,V,IR,P)及閾值 λ1、λ2、α、β的直覺模糊概率正域、負域、以及邊界域,即

雖然上述直覺模糊概率粗糙集采用了直覺模糊關系,但真正起作用的是直覺模糊關系的(λ1,λ2)截關系,即將直覺模糊關系轉化成經典二元關系后的經典概率粗糙集模型。若Y∈IFS(V)為V上的直覺模糊集合,條件概率公式將無法計算,直覺模糊集合Y的概率粗糙下、上近似也將無法計算。其次,令V={y1,y2,y3,y4},IR∈IFS(V),其中 IR={〈0.7,0.21〉,〈0.8,0.1〉,〈0.69,0.2〉,〈0.71,0.21〉}。若取(λ1,λ2)=(0.7,0.2),則根據定義5 有 IR(0.7,0.2)={y2}。若取(λ1,λ2)=(0.7,0.21),則 IR(0.7,0.21)={y1,y2,y4}。隸屬度和非隸屬的極小改變,會導致截關系的結果出現很大差異,即直覺模糊關系的(λ1,λ2)截關系不具有魯棒性。文獻[24]中指出,同一疾病的不同癥狀表現強度是不同的,因此選取一組(λ1,λ2)參數所得的結果也不近合理。
為了解決這一問題,下面我們給出一種新的雙論域上的廣義直覺模糊概率粗糙集模型。
一個直覺模糊集合可以看作一個直覺模糊事件,根據文獻[25]可以定義直覺模糊事件的概率。
定義7[25]設U是非空有限論域,P是定義在由U的子集構成的 σ代數上的概率測度。對于任意直覺模糊集(直覺模糊事件)A∈IFS(U),A的 直覺模糊概率P?(A)定義如下:

顯然 0≤P?(A)≤1,且對于任意A,B∈IFS(U),若A?B,則P?(A)≤P?(B)。若?x∈U,P(x)=1/|U|,當A是一個經典集合時,則P?(A)=P(A)=|A|/|U|。
例1 設U={x1,x2,x3,x4},若對于任意x∈U,P(x)=1/|U|。A是U上的直覺模糊集合且A={〈0.7,0.1〉,〈0.2,0.6〉,〈0.7,0.0〉,〈0.1,0.8〉},則根據定義7 計算可知:

如果兩個直覺模糊事件A、B∈IFS(U)是相互獨立的,則直覺模糊條件概率定義如定義8。
定義8設U是非空有限論域,P是定義在由U的子集構成的 σ代數上的概率測度。對于任意直覺模糊集(直覺模糊事件)A、B∈IFS(U),若P?(B)≠0,A關于B的直覺模糊條件概率P?(A|B)定義為

例2設A,B∈IFS(U),其中A={〈0.7,0.1〉,〈0.2,0.6〉,〈0.7,0.0〉,〈0.1,0.8〉},B={〈0.8,0.1〉,〈0.6,0.1〉,〈0.3,0.6〉,〈0.3,0.6〉}若 ?x∈U,P(x)=1/|U|,則

如果A和B退化成經典集合,那么上述直覺模糊條件概率則退化成經典集合的條件概率,即

性質1?A,B,C∈IFS(U),如果P?(A)≠0,則:
1)P?(?|A)=0,P?(U|A)=1;
2)如果B?C,則P?(B|A)≤P?(C|A)。
證明根據定義2、7,結論1)和2)顯然成立。
定義9設(U,V,IR,P)為U到V上的直覺模糊概率近似空間。A∈IFS(V),令 0≤β<α≤1,則A關于(U,V,IR,P)及閾值 α、β 的下、上近似分別為

投資人們也開始意識到,共享單車盈利模式短期無解,而巨頭們認為,共享單車很難單獨存活,只有進入到巨頭的大生態之內,才有其商業回報上的價值和意義,餓了么就是一例。
根據上、下近似,可以計算A關于(U,V,IR,P)及閾值 α、β的直覺模糊概率正域、負域,以及邊界域,即

如果直覺模糊關系 IR 和直覺模糊集A分別退化成模糊關系和模糊集合,則(α,β)-廣義直覺模糊概率粗糙集退化成文獻[21]中(α,β)-模糊概率粗糙集;如果直覺模糊關系 IR和直覺模糊集A分 別退化成經典等價關系和經典集合,則(α,β)-廣義直覺模糊概率粗糙集退化成文獻[8] 中(α,β)-概率粗糙集。
性質2設(U,V,IR,P)為U到V上的直覺模糊概率近似空間。對于A,B∈IFS(V),0≤β<α≤1,有下列結論成立:

證明根據定義8、9 易證結論1)、2)。下面來證明結論3)~6)。

結論5)證明過程和結論4)相同。

若 β=1?α,就得到了一種特殊的(α,β)-廣義直覺模糊概率粗糙集,這時只需要確定參數 α一個閾值。
定義10設(U,V,IR,P)為U到V上的直覺模糊概率近似空間。?A∈IFS(V),令0.5<α≤1,則A關于(U,V,IR,P)及閾值α 的下上近似分別為

根據上、下近似,可以計算A關于(U,V,IR,P)及閾值 α的直覺模糊概率正域、負域,以及邊界域,即

如果直覺模糊關系 IR 和直覺模糊集A分別退化成模糊關系和模糊集合,則 α?廣義直覺模糊概率粗糙集退化成文獻[21]中 α?模糊概率粗糙集;如果直覺模糊關系 IR 和直覺模糊集A分別退化成經典等價關系和經典集合,則 α?廣義直覺模糊概率粗糙集退化成經典的 α?概率粗糙集。
當只關心那些在一定程度上支持直覺模糊事件的對象時,可以使用 α?廣義直覺模糊概率粗糙集。這時只需要確定一個閾值 α。類似的,也能得到性質3。
性質3設(U,V,IR,P)為U到V上的直覺模糊概率近似空間。對于A,B∈IFS(V),0.5<α≤1,有下列結論成立:

根據定義8、10,類似性質2 易證性質3,這里就不再重復了。
本節將討論雙論域上的廣義直覺模糊概率粗糙集在醫療診斷上的應用。
例3有一個醫療診斷實例,其中U={x1,x2,···,x9}為一組患者集合,V={y1,y2,···,y5}為一組癥狀集合。每個患者x∈U關于癥狀y∈V的隸屬度和非隸屬度如表1 所示。

表1 患者與癥狀之間的直覺模糊關系Table 1 Intuitionistic fuzzy relationship between patients and symptoms
假設A為某種疾病,它的臨床診斷表現為A={〈0.7,0〉,〈0.2,0.6〉,〈0,0.9〉,〈0.7,0〉,〈0.1,0.8〉}設癥狀集合上的概率分布函數為P(y)=1/|V|(?y∈V),根據定義8,疾病A關于每個患者xi∈U(即信息粒度IR(xi),i=1,2,···,9)的直覺模糊條件概率分別為P?(A|IR(x1))=0.57,P?(A|IR(x2))=0.06,P?(A|IR(x3))=0.51,P?(A|IR(x4))=0.52,P?(A|IR(x5))=0.80,P?(A|IR(x6))=0.74,P?(A|IR(x7))=0.33,P?(A|IR(x8))=0.09,P?(A|IR(x9))=0.28。
令α=0.7,β=0.5,根據定義9 有如下結果:

因此可以得到以下結論:在給定閾值α=0.7,β=0.5的情況下,患者x5、x6一定感染了疾病A,需要立即進行治療;患者x2、x7、x8、x9一定沒有感染疾病A,暫時不需要進行治療;患者x1、x3、x4可能感染了疾病A,需要進一步檢查確診。
若令 α=0.55,根據定義10 有如下結果:

此時,可以得到以下結論:在給定閾值α=0.55的情況下,患者x1、x5、x6一定感染了疾病A,需要立即進行治療;患者x2、x7、x8、x9一定沒有感染了疾病A,暫時不需要進行治療;患者x3、x4可能感染了疾病A,需要進一步檢查確診。
另外,還考慮下面一個醫療診斷問題,數據來源于文獻[26]。
例4假設有四名患者,記為U={Al,Bob,Joe,Ted},癥狀集合V={T,H,S,C,CP},其中T 表示溫度,H 表示頭痛,S 表示胃痛,C 表示咳嗽,CP 表示胸痛。診斷結果集合D={Vf,Ma,Ty,St,Ch},其中Vf 表示病毒性感冒,Ma 表示瘧疾,Ty 表示傷寒,St 表示胃病,Ch 表示胸肺病。表2 為患者與癥狀之間的直覺模糊關系,表3 為疾病與癥狀之間的直覺模糊關系。下面我們來確定每位患者的診斷結果。

表2 患者與癥狀之間的直覺模糊關系Table 2 Intuitionistic fuzzy relationship between patients and symptoms

表3 疾病與癥狀之間的直覺模糊關系Table 3 Intuitionistic fuzzy relationship between diseases and symptoms
由于每種疾病的主要表現癥狀各不相同,根據這一特點,令P(y)=μV(y)/∑y∈VμV(y)。表2 中,用A1={〈0.8,0.1〉,〈0.6,0.1〉,〈0.2,0.8〉,〈0.6,0.1〉,〈0.1,0.6〉}表示患者Al 在每種癥狀下的直覺模糊集合;表3 中,用Vf={〈0.4,0.0〉,〈0.3,0.5〉,〈0.1,0.7〉,〈0.4,0.3〉,〈0.1,0.7〉}表示疾病Vf 在每種癥狀下的直覺模糊集合,其他以此類推。根據定義8,計算診斷結果中病毒性感冒關于每位患者的直覺模糊條件概率:

計算其他疾病關于每位患者的直覺模糊條件概率,結果如表4 所示。

表4 疾病關于患者的直覺模糊條件概率Table 4 Intuitionistic fuzzy conditional probability of diseases about patients
設閾值 α=0.7,β=0.5。據定義9 可知,Vf 關于閾值α、β的下、上近似為。根據上、下近似,Vf 關于閾值 α、β的直覺模糊概率正域、負域,以及邊界域分別為POS0.7(Vf)=?,NEG0.5(Vf)=U,BN(0.7,0.5)(Vf)=?。也就是說,所有患者均都沒有患有疾病Vf(病毒性感冒)。類似的,計算其他疾病關于閾值 α、β的直覺模糊概率正域、負域,以及邊界域如下:
POS0.7(Ma)={Al,Joe,Ted},NEG0.5(Ma)={Bob},BN(0.7,0.5)(Ma)=?;
POS0.7(Ty)=?,NEG0.5(Ty)={Al,Bob,Ted},BN(0.7,0.5)(Ty)={Joe};
POS0.7(St)={Bob},NEG0.5(St)={Al,Joe,Ted},BN(0.7,0.5)(St)=?;
POS0.7(Ch)=?,NEG0.5(Ch)=U,BN(0.7,0.5)(Ch)=?
由上面的計算可知,Al 一定患有疾病Ma(瘧疾);Bob 一定患有疾病St(胃病);Joe 一定患有疾病Ma(瘧疾),可能患有疾病Ty(傷寒);Ted 一定患有疾病Ty(傷寒)。
將計算結果與其他文獻進行比較,結果如表5所示。與其他方法不同的是,由于條件概率的加入,根據不同的閾值,患者Joe 一定患有疾病Ma(瘧疾),可能患有疾病Ty(傷寒)。這樣的診斷結果更加符合實際,因為臨床癥狀表現可能不是由單一疾病引起的。因此,需進一步檢查,從而對癥治療。

表5 不同方法的結果比較Table 5 Comparison of results of different methods
已有的雙論域直覺模糊概率粗糙集模型通過設置兩個閾值 λ1、λ2,討論了經典集合的概率粗糙下、上近似。從概率角度出發,一個直覺模糊集合就是一個直覺模糊事件。本文首先給出了直覺模糊條件概率的定義。隨后,在直覺模糊概率空間下構造了雙論域廣義直覺模糊概率粗糙集模型,討論了模型的主要性質。最后,將模型應用到臨床診斷系統中,并與已有文獻中的結果進行比較。結果表明,所提出的概率粗糙集模型進一步豐富了概率粗糙集理論,更加符合實際應用。下一步,考慮直覺模糊條件概率具有單調性,將討論廣義直覺模糊概率粗糙集中的屬性約簡問題。另外,由于直覺模糊集具有接受、拒絕和猶豫的語義,將該模型與三支決策模型相結合,繼續拓展該模型在其他領域的應用也是我們未來的研究內容。