李 敬,王利東,李曉慶
(大連海事大學(xué) 數(shù)學(xué)系, 遼寧 大連 116026)
?
基于優(yōu)勢度的序信息系統(tǒng)屬性重要性度量
李 敬,王利東,李曉慶
(大連海事大學(xué) 數(shù)學(xué)系, 遼寧 大連 116026)
屬性約簡在某種指標(biāo)下最大限度保留信息系統(tǒng)的主要信息,使所獲得的知識簡化,其有利于獲取有效的決策規(guī)則.針對序信息系統(tǒng)約簡問題,本文構(gòu)建了兩種基于優(yōu)勢度的屬性重要性度量方法及探索其相關(guān)數(shù)學(xué)性質(zhì),并將其應(yīng)用于企業(yè)發(fā)展能力信息系統(tǒng)獲得屬性約簡集合.實例分析表明了所構(gòu)建方法能有效地利用數(shù)據(jù)的分布信息來反映出對象之間的差別程度,更客觀體現(xiàn)出屬性的重要程度.
序信息系統(tǒng); 優(yōu)勢度; 屬性約簡
在實際生活中,描述物體需要使用多個特征指標(biāo),相對而言它們并非同等重要的,甚至有些特征是可以忽略的.這種現(xiàn)象在信息系統(tǒng)里稱為屬性約簡,它可以確定屬性子集且保持該系統(tǒng)的分類能力不變,從而簡化信息系統(tǒng).在實際問題進行決策的過程,如教學(xué)質(zhì)量評估,本科專業(yè)評估和風(fēng)險分析等所面對的信息系統(tǒng)的屬性值往往是有序的.因此,研究序信息系統(tǒng)的屬性重要性度量及屬性約簡具有實際意義.
屬性重要度函數(shù)的構(gòu)建對于屬性約簡是至關(guān)重要的,設(shè)計高效的屬性重要度函數(shù)利于知識獲取[1].經(jīng)典的粗糙集理論在屬性重要性度量和知識獲取等問題研究中發(fā)揮著重要角色,但它以等價關(guān)系為根基,具有一定的局限性.
Greco S, Matarazzo B, Slowinski R等用優(yōu)勢關(guān)系替換經(jīng)典粗糙集的不可分辨關(guān)系(等價關(guān)系),提出了優(yōu)勢粗糙集理論(DRSA)[2].國內(nèi)外學(xué)者利用該理論研究序信息系統(tǒng)的屬性約簡問題,并取得了豐富的研究成果[3-6].在文獻[7]中,徐偉華和張文修從矩陣角度給出了序決策信息系統(tǒng)約簡算法.針對不協(xié)調(diào)序決策信息系統(tǒng),徐偉華和張文修利用優(yōu)勢關(guān)系對條件屬性和決策屬性進行劃分,并先后提出分配和近似約簡的方法及相關(guān)判定定理[8]、分布約簡方法及相關(guān)判定定理[9].為減少決策規(guī)則不確定性,方連花和李克典將文獻[10]中決策屬性劃分改為基于等價關(guān)系劃分,并建立相應(yīng)的基于等價-優(yōu)勢關(guān)系的約簡方法.袁修久和何華燦先后建立了不協(xié)調(diào)決策表的上、下近似約簡方法[11-12],并指出了它們與經(jīng)典粗糙集約簡方法之間的不同之處.陳娟、王國胤和胡軍在不協(xié)調(diào)序信息系統(tǒng)中提出正域約簡的概念,并給出基于屬性重要性的正域約簡算法[13].莫京蘭、呂躍進和李金海從矩陣角度給出基于β優(yōu)勢關(guān)系的近似約簡的概念及約簡方法[14].近來,擴展形式序信息系統(tǒng)的屬性約簡已引起廣泛關(guān)注.王虹和石慧娟將分配約簡方法擴展到區(qū)間型不協(xié)調(diào)序決策信息系統(tǒng)屬性約簡中[15].吳磊、楊善林和郭慶給出了直覺模糊數(shù)型決策系統(tǒng)的屬性約簡方法[16].楊習(xí)貝,張艷芹等分別研究了不完備區(qū)間型序信息系統(tǒng)和直覺模糊序信息系統(tǒng)上粗糙集模型及約簡問題[17-18].徐偉華詳細(xì)分析了序信息系統(tǒng)與粗糙集研究現(xiàn)狀并指出未來發(fā)展的幾個方向[19].
基于優(yōu)勢關(guān)系的粗糙集理論(DRSA)在一定程度上彌補了經(jīng)典粗糙集的不足[2].但其僅考慮對象之間的偏序關(guān)系,沒有體現(xiàn)對象間的差別程度.例如在下文表3.1.1中,若將對象x5在可持續(xù)增長率指標(biāo)上的值改為10,可發(fā)現(xiàn)它不會影響優(yōu)勢粗糙集中類的變化,因此不能有效體現(xiàn)出數(shù)據(jù)分布特性.如果充分考慮樣本(方案)在指標(biāo)上的序關(guān)系以及相差程度,可以更好地利用數(shù)據(jù)包含著的客觀信息.本文在基于優(yōu)勢粗糙集等相關(guān)研究基礎(chǔ)上,建立基于優(yōu)勢度和排序熵的序信息系統(tǒng)屬性重要性度量及約簡方法.
本章將介紹有關(guān)序信息系統(tǒng)的基本概念.
1.1序信息系統(tǒng)
定義1.1.1[20]信息系統(tǒng)I≤=(U,AT,F)是一個三元集合,其中,U={x1,x2,…,xm}為論域,AT={a1,a2,…,an}為屬性集,F:{fl∶U→V1(l≤n)}為對象與屬性的關(guān)系集,Vl為屬性al的有限值域.稱≥a為相對于屬性a具有優(yōu)勢,x≥ay表示x在a上的值大于或等于y.x≥Ay??a∈AT,x≥ay.
信息系統(tǒng)中屬性值間具有優(yōu)勢關(guān)系時,稱信息系統(tǒng)為序信息系統(tǒng).
1.2 優(yōu)勢關(guān)系與優(yōu)勢類
定義1.2.1[2]I≤=(U,AT,F)為一個序信息系統(tǒng),Vl為屬性al的有限值域,且為偏序的.對于任意的屬性子集B?AT,記

(1)

(2)



(3)

(4)

屬性約簡的一個關(guān)鍵問題是建立屬性質(zhì)量的評價函數(shù).粗糙集、優(yōu)勢粗糙集和模糊粗糙集使用依賴性函數(shù)評價屬性的重要性.本節(jié)在文獻[20-22]基礎(chǔ)上,采用保序原則進行評價屬性的重要性和屬性約簡.
2.1基于優(yōu)勢度的屬性重要性度量
注意到公理模糊集[21]中的隸屬測度能有效反映出樣本之間的差別程度,故將其引入作為樣本的優(yōu)勢度計算公式,進一步確定屬性的重要性的度量.
定義2.1.1[21]信息系統(tǒng)I≤=(U,AT,F)是一個序信息系統(tǒng),定義優(yōu)勢度公式為

(5)
由定義2.1.1直接可以得到以下結(jié)論:
性質(zhì)2.1.1 設(shè)I≤=(U,AT,F)為序信息系統(tǒng).R≤,S≤為I≤的兩個劣勢關(guān)系,則有:



依據(jù)式(5)計算優(yōu)勢度及刪除屬性后的優(yōu)勢度,進而引入屬性重要性定義.

依據(jù)屬性的重要性可以進一步進行屬性約簡.
2.2基于排序熵的屬性重要性度量及屬性約簡
信息熵表征了信源整體的統(tǒng)計特征,是總體的平均不確定性的量度,也是確定權(quán)重的一個重要工具.為反應(yīng)出基于優(yōu)勢關(guān)系的有序分類的不確定性,胡清華等學(xué)者定義了升序和降序排序熵[6,20].
定義2.2.1[6,20]設(shè)I≤=(U,AT,F)為序信息系統(tǒng),信息系統(tǒng)就屬性B而言的升序排序熵定義為:

以及降序排序熵定義為:

.
例如在表2.2.1中,可以看出在屬性a1下,數(shù)據(jù)無差別,可提供的對象間差別信息少,因此升序排序熵為0.而在屬性a2下,差別明顯,體現(xiàn)在此升序排序熵為1.1428.可見,升序/降序排序熵反映了對象集根據(jù)屬性提供的信息進行排序的一致性程度.
本章結(jié)合定義2.1.1, 2.2.1,定義新的向下降序排序熵:
定義2.2.2I≤=(U,AT,F)是一個序信息系統(tǒng),定義如下向下降序熵為:

根據(jù)定義2.2.2可推得如下性質(zhì):
性質(zhì)2.2.1 設(shè)I≤=(U,AT,F)為序信息系統(tǒng).R≤,S≤為I≤的優(yōu)勢關(guān)系.若|U/R≤|=|U/S≤|,則RH≤(R≤)=RH≤(S≤).
性質(zhì)2.2.2 設(shè)I≤=(U,AT,F)為序信息系統(tǒng).R≤,S≤為I≤的兩個優(yōu)勢關(guān)系,若R≤≤S≤,則RH≤(R≤)≤RH≤(S≤).
定義2.2.3 定義屬性a相對于屬性集B的重要性:
SigB(a)=RH≤(B-a)-RH≤(B) .
SigB(a)越大,說明a相對于屬性集B的重要性越大.屬性依據(jù)屬性的重要性可以進一步進行屬性約簡和權(quán)重確定.
在企業(yè)發(fā)展能力和專業(yè)評估等領(lǐng)域綜合評價中,各方案在某一評價指標(biāo)上的值之間常常都存在偏序關(guān)系,即評價信息表可以形成序信息表.指標(biāo)權(quán)重是確定影響因素的重要程度,與之相隨的一個問題是屬性約簡.本文以企業(yè)發(fā)展能力綜合評價為例,采用公式(5)考慮樣本(方案)在指標(biāo)上的序關(guān)系以及相差程度,并結(jié)合優(yōu)勢度和排序熵度量屬性的重要性.
3.1 實例簡介
本節(jié)采用文獻[22]所選取的反映企業(yè)發(fā)展能力的信息表,如表3.1.1所示,其包括四項評價指標(biāo)AT={a1,a2,a3,a4},六家參評企業(yè)U={x1,x2,x3,x4,x5,x6}.評價指標(biāo)均是效益型指標(biāo),每個企業(yè)關(guān)于評價指標(biāo)的數(shù)值分別用3,2,1表示,即指標(biāo)取值越大,表明企業(yè)的在該項指標(biāo)上發(fā)展能力越好.根據(jù)定義2.1.1-2.1.2及定義2.2.1-2.1.3,可得到各個指標(biāo)的重要性,見表3.1.2.
從表3.1.2可以看出刪除a2后變化性最小,即a2的重要性最小,約簡集可定義為{a1,a3,a4}.實驗結(jié)果和文獻[22]結(jié)論一致,屬性重要性最小.所構(gòu)建的兩類方法能夠反映對象集根據(jù)屬性提供的信息進行排序的一致性程度.例如在表3.1.1中將f(x5,a3)=3改為f(x5,a3)=10,這種變化對文獻[22]的屬性約簡過程沒有影響,但它會體現(xiàn)在優(yōu)勢度上.若在表3.1.1中將f(x2,a3)=2改為f(x2,a3)=2.01,這種變化對文獻[22]的屬性約簡過程可產(chǎn)生影響,利用優(yōu)勢度可減少結(jié)果易于受到噪聲影響.

表3.1.1 企業(yè)發(fā)展能力信息表[22]

表3.1.2 指標(biāo)重要性結(jié)果
本文在結(jié)合優(yōu)勢度和排序熵的基礎(chǔ)上,構(gòu)建了基于優(yōu)勢度的屬性重要性度量和基于排序熵的屬性重要性度量及屬性約簡方法.同時,對這兩種度量方法的一些數(shù)學(xué)性質(zhì)加以研究.此外,將所構(gòu)建方法應(yīng)用于企業(yè)發(fā)展能力信息評價中,獲得每個屬性的重要性及屬性約簡集.該方法有效地利用數(shù)據(jù)的分布信息反映出對象之間的差別程度,是文獻[22]的屬性約簡的一個推廣.
[1]楊習(xí)貝,戚湧,宋曉寧,祁云嵩,楊靜宇.決策單調(diào)約簡的啟示[J].瓊州學(xué)院學(xué)報, 2014, 21(5):17-25.
[2]GrecoS,MatarazzoB,SlowinskiR.Roughsetstheoryformulti-criteriadecisionanalysis[J].EuropeanJournalofOperationalResearch, 2001, 129: 1-47.
[3]菅利榮,劉思峰,方志耕等.基于優(yōu)勢粗糙集的教學(xué)研究型大學(xué)學(xué)科建設(shè)績效評價[J].管理工程學(xué)報,2007, 21(3): 132-136.
[4]鄧維斌,王國胤.基于優(yōu)勢關(guān)系粗糙集的電信客戶價值評價方法[J].計算機應(yīng)用研究, 2015, 32(6):1634-1636.
[5]劉力凱,王國胤,鄧維斌.優(yōu)勢關(guān)系粗糙集的移動用戶換機預(yù)測方法[J].小型微型計算機系統(tǒng), 2015, 36: 1789-1794.
[6]胡清華,于達(dá)仁.應(yīng)用粗糙計算[M].北京: 科學(xué)出版社, 2012.
[7]徐偉華,張文修.基于優(yōu)勢關(guān)系下不協(xié)調(diào)目標(biāo)信息系統(tǒng)的知識約簡[J].計算機科學(xué), 2006, 33(2):182-184.
[8]徐偉華,張文修.基于優(yōu)勢關(guān)系下信息系統(tǒng)分配約簡的矩陣算法[J].計算機工程, 2007, 33(14):182-184.
[9]徐偉華,張文修.基于優(yōu)勢關(guān)系下不協(xié)調(diào)目標(biāo)信息系統(tǒng)的分布約簡[J].模糊系統(tǒng)與數(shù)學(xué), 2007, 21(4):124-131.
[10]方連花,李克典.基于優(yōu)勢-等價關(guān)系下不協(xié)調(diào)目標(biāo)信息系統(tǒng)的分布約簡[J].模糊系統(tǒng)與數(shù)學(xué), 2013, 27(3):182-189.
[11]袁修久,何華燦.優(yōu)勢關(guān)系下的相容約簡和下近似約簡[J].西北工業(yè)大學(xué)學(xué)報(自然科學(xué)版), 2006, 24(5):604-608.
[12]袁修久,何華燦.優(yōu)勢關(guān)系下廣義決策約簡和上近似約簡[J].計算機工程與應(yīng)用, 2006, 42(10):4-7.
[13]陳娟,王國胤,胡軍.優(yōu)勢關(guān)系下不協(xié)調(diào)信息系統(tǒng)的正域約簡[J].計算機科學(xué), 2008, 35(13):216-218.
[14]莫京蘭,呂躍進,李金海.不完備序信息系統(tǒng)的模型擴展及其屬性約簡[J].南京大學(xué)學(xué)報(自然科學(xué)版),2015, 51(2): 430-437.
[15]王虹,石慧娟.基于優(yōu)勢關(guān)系的不協(xié)調(diào)區(qū)間值目標(biāo)信息系統(tǒng)的分配約簡[J].模糊系統(tǒng)與數(shù)學(xué), 2014, 28(4):152-158.
[16]吳磊,楊善林,郭慶.優(yōu)勢關(guān)系下直覺模糊目標(biāo)信息系統(tǒng)的上近似約簡[J].模式識別與人工智能, 2014, 27(4):300-304.
[17]YangXB,YuDJ,YangJY,WeiLH.Dominance-basedroughsetapproachtoincompleteinterval-valuedinformationsystem[J].Data&KnowledgeEngineering, 2009, 68(11):1331-1347.
[18]ZhangYQ,YangXB.Intuitionisticfuzzydominance-basedroughsetapproach:modelandattributereductions[J].JournalofSoftware, 2012, 7(3):551-563.
[19]徐偉華.序信息系統(tǒng)與粗糙集介紹及研究綜述[J].瓊州學(xué)院學(xué)報, 2014, 21(5):12-16.
[20]HuQH,GuoMZ,YuDR,LiuJF.Informationentropyforordinalclassification[J].ScienceinChinaSeriesF:InformationSciences, 2010, 53(6):1188-1200.
[21]LiuXD,PedryczW.Axiomaticfuzzysettheoryanditsapplications[M].Heidelberg:Springer, 2009.
[22]呂躍進,張旭娜,韋碧鵬.基于優(yōu)勢關(guān)系粗糙集的模糊綜合評價的權(quán)重確定[J].統(tǒng)計與決策, 2011, 20:1002-6487.
MeasureofAttributeImportanceBasedonDominantDegreefortheOrderedInformationSystem
LI Jing, WANG Li-dong, LI Xiao-qing
(Department of Mathematics, Dalian Maritime University, Dalian Liaoning, 116026, China)
Attribute reduction can preserve main information for the information system with respect to some indexes, from which some simplified knowledge can be obtained for decision makers. In order to address the attribute reduction in ordered information system, two methods of attribute reduction are proposed based on dominance degree. In addition, the mathematical properties of dominance degree and dominance sort entropy are studied in the current research. The proposed methods effectively reflect the degree of difference between objects by using dominance degree. An example is experimented on the information system of business development and shows that the proposed method is effective for attribute reduction.
ordered information system; dominance degree; attribute reduction
2015-09-07
國家自然科學(xué)基金(61203283);遼寧省自然科學(xué)基金(2014025004);中央高校基本科研業(yè)務(wù)項目(3132014036,3132014324)
李敬(1992-), 女, 山東濟南人, 大連海事大學(xué)數(shù)學(xué)系2015級應(yīng)用數(shù)學(xué)碩士研究生,研究方向為多屬性決策,數(shù)據(jù)處理與信息提取.
王利東(1979-), 男,遼寧喀左人, 大連海事大學(xué)數(shù)學(xué)系副教授,博士,研究方向為粒計算,多屬性決策.
TP18,O236
A
1008-6722(2015) 05-0017-05
10.13307/j.issn.1008-6722.2015.05.05