999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于信息粒化的區(qū)間值信息系統(tǒng)不確定性度量方法

2021-08-12 08:53:00甘秀娜王月波
計算機應(yīng)用與軟件 2021年8期
關(guān)鍵詞:定義方法

甘秀娜 李 明 王月波

1(石家莊鐵路職業(yè)技術(shù)學院組織人事部 河北 石家莊 050041)2(石家莊鐵道大學四方學院經(jīng)濟管理系 河北 石家莊 051132)3(河北銀行股份有限公司信息技術(shù)部 河北 石家莊 050000)

0 引 言

信息系統(tǒng)的不確定性度量是目前信息科學領(lǐng)域的研究熱點。粗糙集是波蘭學者Pawlak[1]提出的一種信息分析理論,尤其在處理不確定性數(shù)據(jù)方面表現(xiàn)出了良好的性能,因此目前廣泛用于數(shù)據(jù)的不確定性度量[2]。

區(qū)間值信息系統(tǒng)是一種較為常見的信息系統(tǒng)形式,其廣泛存在于醫(yī)療和金融領(lǐng)域[3]。針對這種類型的信息系統(tǒng),Yao等[4]將傳統(tǒng)的粗糙集理論推廣至區(qū)間值信息系統(tǒng)中,提出了上下近似的定義,建立了區(qū)間值粗糙集模型。在文獻[4]的基礎(chǔ)上,Dai等[5-7]利用區(qū)間值粗糙集模型提出區(qū)間值信息系統(tǒng)的多種不確定性度量方法,其方法都是利用區(qū)間值粗糙集上下近似來度量近似對象集的粗糙度,然后用粗糙度去表示區(qū)間值信息系統(tǒng)的不確定性度量結(jié)果。譚佳德等[8]做了進一步改進,提出了基于覆蓋方法的區(qū)間值信息系統(tǒng)不確定性度量,并提出對應(yīng)的屬性約簡算法。

近年來,Liang等[9]指出傳統(tǒng)的基于粗糙集上下近似的不確定性度量存在一定的局限性,即隨著信息系統(tǒng)屬性的增加,不確定性度量逐漸降低,而粗糙度可能會存在不變的情形,進一步利用粒計算的知識粒度方法進行度量可以改善這一局限[9]。粒計算是著名學者Zadeh[10]提出的一種信息計算理論,Liang等[11]將該理論進一步引入粗糙集模型中。苗奪謙等[12]利用粒計算方法進行信息系統(tǒng)的不確定性分析,Zhang等[13]利用粒計算模型對信息系統(tǒng)進行信息粒化,然后利用粒化結(jié)果進行不確定性度量。同樣地,Chen等[14]利用信息粒化方法進行鄰域信息系統(tǒng)的不確定性度量,Qin等[15]進行不完備信息系統(tǒng)的不確定性度量,徐風等[16]在模糊鄰域信息系統(tǒng)進行信息粒化,并設(shè)計出一種不確定性度量方法。

針對區(qū)間值信息系統(tǒng)的不確定性度量,本文首先將通過實例方法驗證粗糙度度量的缺陷,然后在目前粒計算度量方法的研究成果上,將信息粒化的方法引入?yún)^(qū)間值信息系統(tǒng)中,定義了區(qū)間值信息系統(tǒng)下的信息粒結(jié)構(gòu),并進一步地提出區(qū)間值信息系統(tǒng)的知識粒度度量方法,理論分析證明了該方法在信息系統(tǒng)不確定性度量方面的有效性。同時基于區(qū)間值信息系統(tǒng)的信息粒結(jié)果,本文進一步地提出一種區(qū)間值信息系統(tǒng)的粗糙熵度量,理論證明了粗糙熵的嚴格單調(diào)性,同樣可以用于區(qū)間值信息系統(tǒng)的不確定性度量。最后通過實驗分析驗證了所提出的知識粒度和粗糙熵均優(yōu)于傳統(tǒng)的粗糙熵度量。

1 區(qū)間值信息系統(tǒng)與不確定性度量

區(qū)間值信息系統(tǒng)是一種常見的信息系統(tǒng)類型,該信息系統(tǒng)中,屬性值以一種區(qū)間值的數(shù)據(jù)來表示。

設(shè)區(qū)間數(shù)為[R]={r=[r-,r+]|r-,r+∈R,r-≤r+},其中R表示實數(shù)域,對于常數(shù)?a∈R,可表示成區(qū)間值形式為a=[a,a]。

對于a,b∈[R],那么有:

(1)a=b?a-=b-,a+=b+。

(2)a≤b?a-≤b-,a+≤b+;a

定義1[4]設(shè)區(qū)間數(shù)a,b∈[R],a關(guān)于b的概率定義為:

(1)

根據(jù)定義1,區(qū)間數(shù)滿足如下關(guān)系[4]:

(1)a,b∈[R],0≤P(a,b)≤1。

(2)a∈[R],P(a,a)=1。

(3)a,b∈[R],P(a,b)+P(b,a)=1。

定義2[4]設(shè)區(qū)間數(shù)a,b∈[R],a與b之間的相似度定義為:

S(a,b)=1-|P(a,b)-P(b,a)|

(2)

根據(jù)定義2,區(qū)間數(shù)滿足如下關(guān)系[4]:

(1)a,b∈[R],S(a,b)=S(b,a)。

(2)a,b∈[R],0≤S(a,b)≤1。

(3)a,b∈[R],S(a,b)=1?a=b。

設(shè)區(qū)間值信息系統(tǒng)表示為IS=(U,A),其中:U為信息系統(tǒng)的論域;A為信息系統(tǒng)的屬性集。

定義3[6]考慮區(qū)間值信息系統(tǒng)IS=(U,A),設(shè)θ∈(0,1]和屬性子集B?A,定義屬性子集B在論域U上誘導(dǎo)的相似關(guān)系為:

(3)

(4)

區(qū)間值信息系統(tǒng)上的相似關(guān)系對論域誘導(dǎo)出的相似類,可以進一步建立區(qū)間值信息系統(tǒng)的粗糙集模型。

(5)

(6)

式中:θ近似度反映的是在閾值θ下,屬性集B對對象集X的近似逼近程度;θ粗糙度則與θ近似度相反,反映的是屬性集B近似逼近的不確定性程度,因此θ粗糙度也被學者們用來度量區(qū)間值信息系統(tǒng)的不確定性[6]。

2 區(qū)間值信息系統(tǒng)不確定性度量方法

2.1 傳統(tǒng)區(qū)間值信息系統(tǒng)不確定性度量的局限性

雖然粗糙度是度量信息系統(tǒng)的一種重要的方法,但是近年來,一些學者指出該種度量方法存在一定的不足,隨著屬性的變化,粗糙度不一定滿足嚴格單調(diào),從而不能很好地進行信息系統(tǒng)的不確定性評估[9]。下面通過一個例子來說明。

例1表1所示為一個區(qū)間值信息系統(tǒng),其中:U為信息系統(tǒng)的論域;{a,b,c,d,e}為信息系統(tǒng)的屬性集。

表1 區(qū)間值信息系統(tǒng)

設(shè)P={a,b},Q={a,b,c},并且θ=0.4,對于X={x2,x5}有:

根據(jù)定義4有:

但是,對象在屬性集Q下的相似類均小于在屬性集P下的相似類,因此屬性集Q的不確定性要小于屬性集P,而θ粗糙度值是一樣的,因此該度量方法不能很好地反映區(qū)間值信息系統(tǒng)的不確定性程度。

2.2 區(qū)間集信息系統(tǒng)信息粒化模型

本節(jié)將在文獻[9,11]信息系統(tǒng)的粒化模型基礎(chǔ)上,將信息粒化模型推廣至區(qū)間值信息系統(tǒng)中,提出相應(yīng)的知識粒度度量方法。

(7)

性質(zhì)1設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),給定θ∈(0,1]和屬性子集P,Q?A,若P?Q,則有:

(8)

證畢。

性質(zhì)2設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),設(shè)屬性子集P?A,若0<θ1≤θ2≤1,則有:

(9)

證畢。

下面在區(qū)間值信息系統(tǒng)粒化模型的基礎(chǔ)上,進一步研究信息系統(tǒng)的知識粒度度量。

定義7設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),給定θ∈(0,1],設(shè)Gθ:2A→(-∞,+∞)是一個映射函數(shù),Gθ被稱為知識粒度需滿足如下3個條件:

(1) 非負性:?B?A,Gθ(B)≥0。

接下來將定義一種知識粒度的表達形式。

定義8設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),|U|=n,給定θ∈(0,1],對于屬性子集B?A在論域U下的知識粒度Gθ(B)定義為:

(10)

可以看出,定義8中區(qū)間值信息系統(tǒng)的知識粒度定義滿足定義7的3個基本條件。

證畢。

性質(zhì)4設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),|U|=n,給定θ1,θ2∈(0,1]以及屬性子集P,Q?A,則滿足:

亦即Gθ1(P)≤Gθ2(Q),則(1)成立,同理(2)成立。

證畢。

性質(zhì)4的(1)表明,隨著區(qū)間值信息系統(tǒng)的信息粒化更加精細時,其區(qū)間值信息系統(tǒng)的知識粒度是逐漸減小的,并且性質(zhì)4的(2)表明知識粒度是嚴格單調(diào)性變化的,因此利用知識粒度進行區(qū)間值信息系統(tǒng)的不確定性度量是適用的。

性質(zhì)5設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),|U|=n,那么滿足:

(1) 若P?Q?A且θ∈(0,1],那么Gθ(Q)≤Gθ(P)。

(2) 若0<θ1≤θ2≤1且B?A,那么Gθ2(B)≤Gθ1(B)。

證畢。

例2區(qū)間值信息系統(tǒng)如表1所示。設(shè)P={a,b},Q={a,b,c},并且θ=0.4,根據(jù)例1有:

比較例1可以發(fā)現(xiàn),從P至Q隨著屬性的增加,知識粒度的結(jié)果發(fā)生了變化,因此知識粒度更加嚴格單調(diào)。

2.3 基于熵的區(qū)間值信息系統(tǒng)不確定性度量

通過信息系統(tǒng)的粒化模型,可以將信息系統(tǒng)的論域分解成一個個信息粒,通過這些信息粒,學者們提出了信息系統(tǒng)的熵模型[11],并利用這些熵的方法去進行信息系統(tǒng)的不確定性度量。本節(jié)將這些方法進一步推廣,提出區(qū)間值信息系統(tǒng)下的熵模型,并構(gòu)造相應(yīng)的不確定性度量方法。

(11)

區(qū)間值信息系統(tǒng)下的粗糙熵滿足性質(zhì)6-性質(zhì)8。

0≤Eθ(B)≤nlog2n

(12)

則有

證畢。

性質(zhì)7設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),|U|=n,給定θ1,θ2∈(0,1]以及P,Q?A,則:

即Eθ1(P)≤Eθ2(Q),所以(1)成立,同理(2)也成立。

證畢。

性質(zhì)7的(1)表明,隨著區(qū)間值信息系統(tǒng)的信息粒化更加精細時,其區(qū)間值信息系統(tǒng)的粗糙熵是逐漸減小的,即粗糙熵滿足單調(diào)性,并且性質(zhì)7的(2)表明粗糙熵滿足嚴格單調(diào)性變化的。

性質(zhì)8設(shè)區(qū)間值信息系統(tǒng)IS=(U,A),|U|=n,那么:

(1) 若P,Q?A且P?Q,對于θ∈(0,1]有Eθ(Q)≤Eθ(P)。

(2) 若0<θ1≤θ2≤1,對于B?A有Eθ2(B)≤Eθ1(B)。

證畢。

例3區(qū)間值信息系統(tǒng)如表1所示。設(shè)P={a,b},Q={a,b,c},并且θ=0.4,根據(jù)例1有:

上述結(jié)果同樣表明粗糙熵具有更嚴格的單調(diào)性。

3 實驗與結(jié)果分析

本節(jié)將通過實驗來驗證本文方法的有效性,表2所示的是實驗中的區(qū)間值信息系統(tǒng),其中數(shù)據(jù)集1-數(shù)據(jù)集3選取自UCI機器學習數(shù)據(jù)集庫,所有非區(qū)間值的屬性已進行刪除,數(shù)據(jù)集4-數(shù)據(jù)集5是本文實驗隨機生成的人工數(shù)據(jù)集。

表2 實驗數(shù)據(jù)集

實驗將每個數(shù)據(jù)集按照屬性依次增加的順序計算信息系統(tǒng)的粗糙度、知識粒度和粗糙熵的結(jié)果,這些結(jié)果表示的是不同度量方法對信息系統(tǒng)不確定性度量的值。如圖1-圖5所示,其中區(qū)間值信息系統(tǒng)的θ值選取為0.7。

(a) 粗糙度

(a) 粗糙度

(a) 粗糙度

(a) 粗糙度

(a) 粗糙度

圖1中,隨著屬性數(shù)量的增加,三種不確定性度量值均是不斷降低的,這主要是由于屬性的增加意味著可獲取的知識越來越多,那么信息系統(tǒng)的不確定性程度則越來越小。比較圖1中粗糙度、知識粒度和粗糙熵的結(jié)果可以發(fā)現(xiàn),在屬性由1增加至2時,粗糙度的值保持不變,而知識粒度和粗糙熵的值均是減小的,說明屬性由1增加至2時,信息系統(tǒng)的不確定性發(fā)生了減小,但是粗糙度并沒有刻畫出這種變化。產(chǎn)生這種現(xiàn)象的主要原因是由于屬性由1增加至2時,雖然對象的相似類發(fā)生了變化,但是信息系統(tǒng)決策類的近似程度并沒有發(fā)生變化。正如本文例1展示的那樣,發(fā)生變化的相似類不改變粗糙集的上下近似集,因此粗糙度不能很好地反映信息系統(tǒng)不確定性程度。相反,屬性由1增加至2時,知識粒度和粗糙熵的值是降低的,因此知識粒度和粗糙熵的評估程度要更好一些。在圖2數(shù)據(jù)集的不確定性度量中,當屬性由2增加至3時,粗糙度保持不變,而知識粒度和粗糙熵是減小,其原因與圖1也是一樣的。同樣地,在圖3中,屬性由1增加至5,粗糙度的不確定性度量結(jié)果保持不變,其余兩種度量方法的度量值是降低的,均表現(xiàn)出了信息系統(tǒng)不確定性的變化。此外觀察圖3可以發(fā)現(xiàn)一個有趣的結(jié)果,在數(shù)據(jù)集屬性由20增加至21時,三種度量結(jié)果表現(xiàn)一致,均大幅度減小,這說明屬性21的增加使得信息系統(tǒng)的不確定性大幅度降低,從而證明知識粒度和粗糙熵能達到粗糙度同樣的度量效果。在圖3中屬性32增加至33,粗糙度和知識粒度均大幅度減小,粗糙熵也有一定幅度的減小。在圖4中屬性由1增加至2,圖5屬性由1增加至5和屬性由9增加至12,這些情形粗糙度度量值均未發(fā)生變化,而另外兩種度量方法均表現(xiàn)出了信息系統(tǒng)不確定性的改變。

綜合以上實驗結(jié)果,表明本文所提出的區(qū)間值信息系統(tǒng)知識粒度度量和粗糙熵度量不僅可以改善傳統(tǒng)粗糙度度量的局限,而且還能表現(xiàn)出粗糙度同樣的不確定性度量性能。由于知識粒度度量和粗糙熵度量均具有嚴格的單調(diào)性,因此實際應(yīng)用中可以任意選擇其中一種進行應(yīng)用。

4 結(jié) 語

不確定性度量是數(shù)據(jù)挖掘和知識發(fā)現(xiàn)等領(lǐng)域的重要研究內(nèi)容,粗糙集和粒計算理論是進行信息系統(tǒng)不確定性度量的強有力工具。針對區(qū)間值信息系統(tǒng),本文揭示了傳統(tǒng)粗糙集中粗糙度在進行不確定度量時的不足,同時提出一種區(qū)間值信息系統(tǒng)的知識粒化模型。通過定義區(qū)間值信息系統(tǒng)上的粒結(jié)構(gòu),進一步地提出知識粒度度量,理論分析證明了該度量隨知識粒化的單調(diào)性,可以用作區(qū)間值信息系統(tǒng)的不確定性度量。同時基于該信息粒化模型,通過信息熵的角度提出了區(qū)間值信息系統(tǒng)的粗糙熵度量,同樣證明了可以用作信息系統(tǒng)的不確定性度量。實驗分析表明,所提出的兩種度量方法均改善了區(qū)間值信息系統(tǒng)傳統(tǒng)粗糙度度量的局限性。

猜你喜歡
定義方法
永遠不要用“起點”定義自己
海峽姐妹(2020年9期)2021-01-04 01:35:44
定義“風格”
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
山的定義
主站蜘蛛池模板: 91视频99| 国内精品一区二区在线观看| 亚洲精品不卡午夜精品| 色悠久久久| 91精品国产自产在线观看| 99国产精品国产| 亚洲精品福利视频| 国产欧美精品专区一区二区| 日韩毛片在线视频| www中文字幕在线观看| 久久香蕉欧美精品| 亚洲三级色| 国产成本人片免费a∨短片| 国产精品视频3p| 亚洲性一区| 亚洲乱强伦| 中文字幕亚洲乱码熟女1区2区| 欧美一区二区自偷自拍视频| 国产精品部在线观看| 日韩激情成人| 国产aⅴ无码专区亚洲av综合网| 国产在线91在线电影| 国产三级成人| 国产一级毛片yw| 69视频国产| 久久精品国产免费观看频道| 国产亚洲精品97在线观看| 欲色天天综合网| 国产青青草视频| 丁香六月激情综合| 亚洲a免费| 亚瑟天堂久久一区二区影院| 成人自拍视频在线观看| 日韩亚洲高清一区二区| 精品一区二区久久久久网站| 不卡无码网| 91色爱欧美精品www| 台湾AV国片精品女同性| 国产欧美高清| 亚洲成人网在线播放| 鲁鲁鲁爽爽爽在线视频观看| 久99久热只有精品国产15| 国产免费观看av大片的网站| 真实国产乱子伦视频| 日韩第九页| 国产精品视频3p| 国产性猛交XXXX免费看| 在线观看精品自拍视频| 欧美不卡视频一区发布| 亚洲无码高清视频在线观看| 色噜噜综合网| 久久香蕉国产线| 日本成人不卡视频| 国产欧美性爱网| 999在线免费视频| 园内精品自拍视频在线播放| 色哟哟国产精品| 看你懂的巨臀中文字幕一区二区| 久久99国产综合精品1| 97国产成人无码精品久久久| 97se亚洲综合不卡| 日韩欧美中文| 日韩精品一区二区三区免费在线观看| 91福利在线看| 午夜不卡视频| 日本三级欧美三级| 欧洲日本亚洲中文字幕| 久久九九热视频| 日韩一区二区三免费高清| 亚洲色成人www在线观看| 在线观看国产网址你懂的| 97视频在线精品国自产拍| 国产玖玖视频| 老司国产精品视频| 国产精品刺激对白在线| 精品无码一区二区三区电影| 四虎永久免费地址| 久久中文无码精品| 久久婷婷国产综合尤物精品| 国产成人精品高清不卡在线| 天堂在线视频精品| 精品福利视频导航|