徐智明 劉 宏 馬 琳 陳小衛
(1.92819部隊 大連 116600)(2.海軍駐航天一院軍代室 北京 100076)(3.海軍軍訓器材研究所 北京 100841)(4.海軍航空工程學院 煙臺 264001)
粗糙集理論[1]是分析和處理各類信息的有效工具,已成當前研究的熱點,被廣泛知識發現、數據挖掘、決策分析等領域中[2~4]。在多屬性決策中,屬性值往往具有偏好關系,基于等價關系的經典粗糙集則難以滿足需要。于是,Greco等[5~7]對粗糙集理論進行擴充,利用優勢關系來代替等價關系,提出了基于優勢關系的粗糙集,為多屬性決策提供了一種新方法。
然而在多屬性決策過程中,屬性值往往難以用精確數來表達。區間型多屬性決策則是多屬性決策的一種特殊情況。在區間信息系統上基于優勢關系的粗糙集方法已有研究。文獻[8]將屬性值具有偏好關系的區間值信息系統稱區間序信息系統,并定義了幾種優勢關系;文獻[9]針對條件屬性和決策屬性都為區間數的多屬性決策問題,定義了三種優勢關系;文獻[10]研究了不完備區間信息上基于優勢關系的粗糙集方法;文獻[11]針對前面定義的幾種優勢關系的不足,假定各屬性都服從給定區間數上的均勻分布,提出了一種概率優勢關系,但表達形式過于復雜,同時該假定也缺乏依據。考慮到區間數多屬性決策中,通過可能度[12~13]能較好的表達區間數比較的優于程度,本文將可能度的概念引入到優勢關系中,提出一種基于可能度的優勢關系,通過對可能度α∈[0.5,1]的變化,來調節優勢關系的“優于”程度,能較好的克服當前區間序信息系統上的幾種優勢關系的不足。
定義1[8]區間值信息系統是一個四元組S=(U,A,V,f),其中,U= {x1,x2,…,xn}為對象的非空有限集合,A為非空屬性集合;V=∪a∈AVa,Va為屬性a的值域,f:U×A→V為一信息函數,表示對每一個a∈A,x∈U,f(x,a)∈Va,其中,Va是一個區間數,定義如下
f(x,a)=[aL(x),aU(x)]={p|aL(x)≤p≤aU(x),aL(x),aU(x)∈R}
表示在屬性a下對象x的區間值。特別的aL(x)=aU(x)時,f(x,a)退化為一個實數。因此單值信息系統是區間值信息系統的特殊形式。
定義2[8]對區間值信息系統S=(U,A,V,f),若所有屬性都具有優勢關系,則稱之為區間序信息系統。
定義3設區間序系統S=(U,A,V,f),B?A,幾種優勢關系定義如下[8~11]:
1)上優勢關系:

對定義3的幾種優勢關系進行分析,可以發現這幾種優勢關系存在入一定的缺陷,具體如下:
1)下上優勢關系的定義則過于嚴格。如[4.9,100]和[2,5],不滿足下上優勢關系,但實際上可認為[4.9,100]應優于[2,5]。
2)上下優勢關系的定義過于寬松。根據上下優勢關系,[2,3[2.999,100],同時又有[2.999,100[2,3],這也不合理,將會使得信息系統知識獲取中出現誤分類的問題。
3)上優勢關系和下優勢關系的定義則介于前兩者之間,但仍會產生不合理結果。如根據上優勢關系,[1,3[2.98,2.99],這不符合事實。同理,根據下優勢關系,[2,[1.999,100],這也不符合事實。
4)上上下下優勢關系為同時滿足上優勢和下優勢關系的特例,但難以實現部分區間數的比較,從而導致分類的遺漏。如[1,2]和[0.9,10]無法比較,而[0.9,10]應優于[1,2]。
因此,有必要引入一種新的區間序信息系統的優勢關系。
為了比較區間數的大小,文獻[13]定義了可能度的概念。
定義4當a,b同為區間數或有一個區間數時,設a=[aL,aU],b=[bL,bU],且記la=aU-aL,lb=bU-bL,則稱

為a≥b的可能度。
可能度反映了區間數a≥b的可能性。通過可能度,能夠實現任何兩個區間數進行比較。因此,可將其引入到區間序信息系統中去。
對區間信息系統S=(U,A,V,f),對任意xi,xj∈U,a∈A,f(xi,a)=[aL(xi),aU(xi)],f(xj,a)=[aL(xj),aU(xj)],令=aU(xi)-aL(xi),=aU(xj)-aL(xj)。若f(xi,a)和f(xj,a)不同為實數,則
>>

>
若f(xi,a)和f(xj,a)同為實數,則
>

>
>
1)若=0,當且僅當aU(xj)≤aL(xi),即f(xj,a)≤f(xi,a)肯定成立。
>
>
3)若0<<1,則f(xi,a)與f(xj,a)相交或包含。
>
特別的,f(xi,a)=f(xj,a)時=0.5。即兩個區間數相等時,一個數優于另外一個數的可能度為0.5。
>
定義5設區間值信息系統S=(U,A,V,f),B?A,給定可能度α∈(0,1],則可定義α-可能度優勢關系和α-優勢類:
>

>
在區間序信息系統中引入可能度α后,可以通過閾值α∈(0,1]的調節來改變滿足優勢關系的可能程度,這樣就提高了信息處理的靈活性。
>
定理1給定區間序信息系統S=(U,A,V,f),B?A,
>
1)若α∈(0,0.5],則是自反的,但不是傳遞的和對稱的;
>
2)若α∈[0.5,1],則是傳遞的,但不是自反的和對稱的。
自然災害與氣象問題對橋梁工程施工有著直接影響,火災與爆炸這些安全事故受到工程施工現場環境的影響。針對這些工程環境風險,施工企業可以利用購買工程施工保險的方法轉移風險。有意識地將風險與施工企業的經濟效益聯系在一起,在安全事故發生后,盡最大可能降低施工企業的損失。另外,要在施工過程中對一切安全因素進行有效監控,24小時監控施工現場的火災發生影響因素與爆炸影響因素。安排專人負責工程環境風險管理,加強施工現場的監督力度,用規范的施工操作,預防工程環境事故的發生。
>
證明:(1)由α∈(0,0.5],則=0.5≥α,?a∈B,則(xi,xi)∈,故是自反的。同時可以驗證不滿足自反性和對稱性。
>
(2)由可能度的定義可知,α≥0.5時,對xi,xj,xk∈U,a∈B,若≥α≥α,則≥α,則可證明是傳遞的。同時可以驗證不滿足自反性和對稱性。
>
不失一般性,和有以下性質:
>
定理2給定區間序信息系統S=(U,A,V,f),B?A,則
>

>
證明:1)~3)可由優勢關系和優勢類的定義直接證明。
>
4)由定義,={(xi,xj)∈U×U≥α2,?a∈B},即對任意(xi,xj)∈,有≥α2,?a∈B。由題設條件α1≤α2,則≥α2≥α1,?a∈B,即(xi,xj)∈,由于(xi,xj)是任意的,則?。
>
5)由4)和α-優勢類的定義可直接得到。
>
若在屬性a下對象xj優于xi,則≥。有互補性知,≥0.5。由于α表示對象“優于”的最小可能程度,為保證分類的合理性,應取α∈[0.5,1]。
定義6設區間序信息系統S=(U,A,V,f),對給定的α∈[0.5,1],對任意B?A,X?U,上下近似定義如下:

由定義6,能得到如下性質。
定理3區間序信息系統S=(U,A,V,f),B?A,α∈[0.5,1],則


證明:1)、2)、3)可由定義直接證明。
設有區間序信息系統S=(U,A,V,f),其中對象集U={x1,x2,…,x8},屬性集A={a1,a2,a3,a4,a5,a6},所有屬性均為效益型屬性。區間序信息表如表1所示。

表1 區間序信息表
利用2.2節中五種優勢關系對表1數據進行分類。由分類結果可知,下上優勢關系雖然得到的分類準確性高,但過于嚴格,使得分類中含有的信息過少。如對象x1與x8,f(x1,a4)=[6,12],f(x8,a4)=[11,12],計算在a4下x8優于x1的可能度=0.857,即x8應劃分到x1的優勢類。但由下上優勢關系,x8不能分到x1的優勢類。而α-可能度優勢關系而上下優勢關系的定義過于寬松,雖然得到的分類信息量多,但容易引入不合理的信息。如對f(x1,a5)=[7,10],f(x2,a5)=[9,12],計算在a5下x2優于x1的可能度=0.833,即x2優于x1的概率大。而利用上下優勢關系x1優于x2,這顯然不合理。上優勢關系和下優勢關系的定義則介于前兩者之間,但仍會產生不合理結果,同時也會遺漏部分有用信息。上上下下優勢關系為同時滿足上優勢和下優勢關系的特例,但難以實現部分區間數的比較,從而導致遺漏的問題。如對象x2和x6,由于f(x2,a1)=[6,14],f(x6,a1)=[12,13],采用上上下下優勢關系則無法比較。計算在a1下x6優于x2的可能度=0.778,即x6優于x2的概率大。由α-可能度優勢關系可知,x6優于x2,即上上下下優勢關系產生了漏分的問題。
從上面分析可以看出,以往的五種優勢關系的缺點在于沒有對“優于”的程度進行合理的定義,從而造成分類中出現不合理或則遺漏信息的現象。下面采用本文提出的α-可能度優勢關系進行計算,分別令α=0.5,0.6,計算結果如下

由計算結果可看出,α-可能度優勢關系能夠通過對α的變化來調節“優于”的寬松程度,這樣就可以避免分類過寬和過窄而帶來的不合理性。同時通過定義的α-可能度能夠實現任意兩個區間數的比較,這也避免分類中遺漏的問題。
基于優勢關系的粗糙集方法為多屬性決策提供了一種新的思路。在現實世界中,由于決策問題的復雜性和不確定性,屬性值難以直接用精確數來描述,而往往采用區間數的形式來表示。區間序信息系統是單值信息系統的擴展,針對區間序信息系統上的優勢關系的研究對決策分析具有極其重要的意義。本文總結如下:
1)當前區間序信息系統上的幾種優勢關系存在著過寬或過窄的問題,從而導致分類出現不合理或遺漏的現象。針對這一問題,本文可能度的概念引入到優勢關系中,提出了一種新的優勢關系—α-可能度優勢關系,進而研究了α-可能度優勢關系的基本性質以及與其他優勢關系的聯系,并定義了基于α-可能度優勢關系的粗糙集模型。通過對可能度α∈[0.5,1]的變化,來調節優勢關系的“優于”程度,能較好的克服這些不足。
2)α表示一個對象優于另一對象的最小可能程度,能夠反映決策者主觀愿望,因此,可由決策者直接給定。
[1]Pawlak Z.Rough set[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[2]H.L.Li,M.H.Chen.Induction of multiple criteria optimal classification rules for biological and medical data[J].Computers in Biology and Medicine,2008,38:42-52.
[3]J.F.Liu,Q.H.Hu,D.R.Yu.A weighted rough set based method developed for class imbalance learning[J].Information Sciences,2008,178:1235-1256.
[4]L.X.Shen,H.T.Loh.Applying rough sets to market timing decisions[J].Decision Support Systems,2004,37:583-597.
[5]S.Greco,B.Matarazzo,R.Slowinski.A new rough set approach to multicriteria and multiattribute classification[J].Lecture Notes in Artificial Intelligence,1998,1424:6067.
[6]S.Greco,B.Matarazzo,R.Slowinski,Rough sets theory for multicriteria decision analysis[J].European Journal of Operational Research,2001,129:147.
[7]S.Greco,B.Matarazzo,R.Slowinski,Rough sets methodology for sorting problems in presence of multiple attributes and criteria[J].European Journal of Operational Research,2002,138:247-259.
[8]QIAN Yuhua,LIANG Jiye,DANG Chuangyin.Interval ordered information systems[J].Computers and Mathematics with Applications,2008,56(8):1994-2009.
[9]DEMBCZYNSKI K,GRECO S,SLOWINSKI R.Rough set approach to multiple criteria classification with imprecise evalu-ations and assignments [J].European Journal of Operational Research,2009,198(2):626-636.
[10]YANG X B,YU D J,YANG J Y,et al.Dominance-based Rough se t approach to incomplete interval-valued information system [J].Data & Knowledge Engineering,2009,68(11):1331-1347.
[11]楊青山,王國胤,張清華,等.基于優勢關系的區間值粗糙集擴充模型[J].山東大學學報(理學版),2010,45(9):7-13.
[12]沈麗容,黃洪.基于貝葉斯和可信度的糖尿病診療系統研究[J].計算機與數字工程,2011(11).
[13]Nakahara Y.User oriented ranking criteria and its application to fuzzy mathematical programming problems[J].Fuzzy Sets and Systems,1998,94:275-286.
[14]Nakahara Y,SaSakiM,Gen M.on the linear programming problems with interval coefficients[J].International Journal of Computer Industrial Engineering,1992,23:301-304.