駱公志,陳佳馨
(南京郵電大學管理學院,江蘇 南京210003)
信息時代的發展促使信息來源日益增多,數據形式也越來越復雜,因此有學者提出多源信息系統MsIS(Multi-source Information System)[1]的概念,以幫助決策者做出正確選擇。目前多源信息系統被廣泛應用于粒計算[2]、深度學習[3]和風險評估[4]等領域,同時如何在多源信息系統中獲取有用的知識也成為研究熱點。
經典粗糙集中的等價關系并不能有效處理存在多種屬性值的信息表,而覆蓋關系粗糙集彌補了這一缺陷[5]。之后,不斷有學者在此基礎上對覆蓋粗糙集進行改進:Zhang等[6]通過建立基于覆蓋關系的直覺模糊粗糙集模型,深入探討了多屬性決策問題;Wang等[7]利用矩陣研究了覆蓋粗糙集中的最大描述和最小描述的相關問題;Han等[8]基于局部有限覆蓋近似空間,提出了H-粗糙集算子和K-拓撲粗糙集算子。
為分析有多粒度結構的信息表,Qian等[9,10]構造了多粒度粗糙集模型,并在此基礎上引入決策理論,提出了多粒度決策粗糙集的概念。考慮到決策過程中可能存在少數服從多數的情況,Xu等[11]建立了廣義多粒度粗糙集并在此基礎上引入雙量化決策關系,對模型進行了改良;Sang等[12]將多源信息系統和廣義多粒度粗糙集結合,獲取了新模型的上、下近似。有學者針對實際應用中粒度重要性的差異,對多粒度粗糙集進行了擴展,Ji等[13]基于粒度加權和粗糙集理論在直覺模糊系統中進行決策研究;Guo等[14]從決策樹學習的角度,創造性地提出了3種加權多粒度區間值決策理論粗糙集。
多源覆蓋信息系統中的數據具有一定復雜性,本文引入誘導覆蓋粗糙集,構造了多源覆蓋信息系統下的廣義多粒度粗糙集MCS-GMRS(Generalized Multi-granulation Rough Set of Multi-source Covering information System)模型。文獻[12]認為每個信息系統重要性相同,并未考慮到實際決策過程中,由于信息來源不同,每個信息系統對決策的支持程度會有所差異,因此本文對每個信息系統的屬性賦予一定權重值,并定義了權重的計算方法,以避免因依據專家經驗確定權重而產生主觀性誤差,進而提出了多源覆蓋信息系統下的加權廣義多粒度粗糙集MCS-WGMRS(Weighted Generalized Multi-granulation Rough Set of Multi-source Covering information System)模型,并通過理論和實驗分析對其相關性質進行了驗證。
定義1[5]設U為論域,C={X|X?U}是U的子集族,若C≠?,且∪C=U,則稱C是論域U上的一個覆蓋,(U,C)為覆蓋近似空間。
定義2[5]若(U,C)為一覆蓋近似空間,對?x∈U,Cx=∩{Cj|Cj∈C,x∈Cj},則Cov(C)={Cx|x∈U}被稱為由C誘導的覆蓋。
定義3[5]若Δ={C1,C2,…,Cm}是論域U上的一個覆蓋族,對任意目標集X?U,對象x∈U有Δx=∩{Cix|Cix∈Cov(Ci),x∈Cix},那么Cov(Δ)={Δx|x∈U}被稱為由Δ誘導的覆蓋。
定義4[5]若IS=(U,AT∪DT,V,f)為一覆蓋信息系統,A?AT為屬性子集,CA(x)為對象x∈U在屬性A下產生的覆蓋類,則目標集X關于A的下、上近似分別如式(1)和式(2)所示:
(1)
(2)
定義5[15]設ISi=(U,AT∪DT,Vi,fi),對?i∈N*,則稱MS=(IS1,IS2,…,ISm)為一多源信息系統,ISi為一多源信息系統的第i個信息系統。
定義6[12]設MS=(IS1,IS2,…,ISm)為一多源信息系統,ISi=(U,AT∪DT,Vi,fi),A?AT為屬性子集,D/DT={D1,D2,…,Dn}為決策類,φ∈(0.5,1],對?X?U,定義多源信息系統下的廣義多粒度粗糙集(MS-GMRS)的下、上近似分別如式(3)和式(4)所示:

(3)

(4)
其中,x∈U在信息系統ISi下關于集合X和補集XC的支持特征函數分別如式(5)和式(6)所示:
(5)
(6)
定義7設MCS=(IS1,IS2,…,ISm)為一多源覆蓋信息系統,ISi=(U,AT∪DT,Vi,fi),A?AT為屬性子集,CISi(x)為誘導覆蓋類,D/DT={D1,D2,…,Dn}為決策類,φ∈(0.5,1],對?X?U,多源覆蓋信息系統下的廣義多粒度粗糙集(MCS-GMRS)的下、上近似分別如式(7)和式(8)所示:

(7)

(8)
其中,x∈U在信息系統ISi下關于集合X的支持特征函數如式(9)和式(10)所示:
(9)
(10)
定義8設MCS=(IS1,IS2,…,ISm)為一多源覆蓋信息系統,ISi=(U,AT∪DT,Vi,fi),A?AT為屬性子集,CISi(x)為誘導覆蓋類,D/DT={D1,D2,…,Dn}為決策類,φ∈(0.5,1],對?X?U,多源覆蓋信息系統下的廣義樂觀多粒度粗糙集MCS-OMRS(generalized Optimistic Multi-granulation Rough Set of Multi-source Covering information System)和多源覆蓋信息系統下的廣義悲觀多粒度粗糙集MCS-PMRS(generalized Pessimistic Multi-granulation Rough Set of Multi-source Covering information System)的下、上近似分別如式(11)~式(14)所示:

(11)

(12)

(13)

(14)

(15)



(16)

(17)
其中,x∈U在信息系統ISi下關于集合X的支持特征函數如式(18)和式(19)所示:
(18)
(19)
規則1在MCS-WGMRS模型中,對?X?U,決策規則如下所示:
(P)If∑{ωi|CISi(x)?X}≥φ,decidex∈POS(X);
(B)If∑{ωi|CISi(x)∩X≠?}>1-φand ∑{ωi|CISi(x)?X}<φ,decidex∈BND(X);
(N)If∑{ωi|CISi(x)∩X≠?}≤1-φ,
decidex∈NEG(X)。
由規則1可知,如果滿足CISi(x)?X的信息系統的屬性權重和大于或等于φ,則決定x∈POS(X);如果滿足CISi(x)∩X≠?的信息系統的屬性權重和大于1-φ且滿足CISi(x)?X的信息系統的屬性權重和小于φ,則決定x∈BND(X);如果滿足CISi(x)∩X≠?的信息系統的屬性權重和小于或等于1-φ,則決定x∈NEG(X)。


(20)

(21)

(22)

(23)





由定義10和定義11可證。

(1)當ω1=ω2=…=ωm=1/m時,有:




(2)當閾值φ1≤φ2時,則有:



□
由上述定理可知,φ的取值會影響上、下近似計算結果,在實際應用中決策者根據相關情境調整閾值可以得到不同的決策結果。

(24)
(25)
(26)
目標集X的分類質量定義如式(27)~式(29)所示:
(27)
(28)
(29)

αWPM≤αWGM≤αWOM,γWPM≤γWGM≤γWOM
由定義10、定義11和定理1可證。
企業環境成本對經濟效益的重要性日益凸顯,其環保投資效率成為客戶決定是否與其開展合作的關鍵因素,因此客戶會在投資或合作前對環保投資效率進行評估。由于評估者將環保投資效率分為多個等級,所以可能會出現多個評估結果,進而產生覆蓋信息。
表1所示為一個關于企業環保投資效率評估的多源覆蓋信息決策系統實例。其中MCS=(IS1,IS2,IS3,IS4)表示4個評估機構;U={x1,x2,x3,x4,x5,x6,x7,x8}為對象集,表示待評估的8個企業;屬性集AT={a1,a2,a3},分別表示評估指標“經濟效率”“環境效率”和“社會效率”,其取值為{1,2},表示效率等級為“低”“高”。令A={A1,A2,A3}={{a1},{a2},{a3}},D/DT={D1,D2}={x1,x2,x4,x5,x6,x8}為決策類集合,xi,i=1,2,…,8的取值為{0,1},分別代表客戶選擇“不合作”“合作”,并取D1為目標集X,閾值φ=0.6。
(1)計算在信息系統IS1、IS2、IS3和IS4下每個對象的誘導覆蓋類,計算結果如表2所示。

Table 2 Induced coverage relationship表2 誘導覆蓋類
(2)根據定義計算每個信息系統的屬性權重:
(3)當φ=0.6時,根據定義計算目標集X在相關模型的上、下近似:

Table 1 Multi-source coverage information decision system for enterprise environmental protection investment efficiency evaluation表1 企業環保投資效率評估多源覆蓋信息決策系統

(4)計算目標集X的近似精度和分類質量:
由計算結果可得:




αWPM≤αWGM≤αWOM,γWPM≤γWGM≤γWOM
因此可驗證定理1和定理2。
(5)通過實例進一步討論φ的取值對上、下近似及分類質量的影響。
當φ=0.7時:
當φ=0.8時:
(6)計算結果表明,隨著φ值的減小,MCS-WGMRS模型的下近似集變大,對目標集的分類也越精確。因此,根據多源覆蓋信息系統合理調整φ值的大小,可以降低噪聲數據的影響,使模型具有較強的容錯能力,并能提高MCS-WGMRS對目標集的分類精度,幫助決策者采取更加有效準確的決策方案。
(7)為進一步驗證MCS-WGMRS模型的有效性,當φ=0.6 時,計算目標集X在MCS-GMRS模型的上、下近似和相關度量參數,可得:
本文利用誘導覆蓋關系處理覆蓋信息的優勢,提出了多源覆蓋信息系統下的廣義多粒度粗糙集(MCS-GMRS)。考慮到實際應用中數據來源的不同,對每個信息系統的屬性賦予權重值,并在MCS-GMRS基礎上構建了多源覆蓋信息系統下的加權廣義多粒度粗糙集(MCS-WGMRS),所提出的計算權重的自適應性方法可以一定程度上避免由于專家判斷失誤產生的影響。本文給出了模型完整的上、下近似,詳細討論了MCS-WGMRS模型的相關定理和決策規則,并結合實例分析驗證了MCS-WGMRS模型的分類能力更強,具有更高容錯性,是一種處理多源覆蓋信息的有效途徑。MCS-WGMRS是對多粒度粗糙集的進一步推廣,未來應從屬性約簡、機器學習等角度對該模型進行深入剖析。