李 萍,劉 輝
(阜陽師范學院 信息工程學院,安徽 阜陽 236041)
條件信息熵在大學生宿舍衛生質量評價中的應用
李 萍,劉 輝
(阜陽師范學院 信息工程學院,安徽 阜陽 236041)
大學生宿舍衛生管理,是高校學生管理中一個非常重要的問題.宿舍衛生質量評價對提高大學生宿舍衛生管理具有重要的指導意義,而現有的宿舍衛生質量評價體系指標冗雜.利用條件信息熵對宿舍衛生質量評價指標進行分析,找出影響宿舍衛生質量的重要屬性,進而對這些指標進行約簡.通過實驗表明該方法用于大學生宿舍衛生質量評價中,簡化了宿舍衛生測評體系.
粗糙集;屬性約簡;宿舍衛生;質量評價;信息熵
大學生的宿舍衛生情況對大學生的身心發展起著潛移默化的作用,大學生宿舍衛生的管理是高校學生管理中一個較為重要的問題.現如今,獨生子女家庭出來的學生已成為大學學生宿舍的主體,養尊處優的生活環境對他們上大學后的獨立生活具有負面影響,培養學生養成生活習慣是宿舍管理工作的首要內容.對大學生宿舍衛生質量進行客觀科學的評價,能夠反應出大學生在宿舍生活中所存在的問題.目前,在對學生宿舍衛生質量進行評價時,所要考慮的因素較多,比如地面清潔情況、床鋪整潔情況、物品擺放情況、安全防護情況、空間設計情況、門窗墻壁情況、垃圾清理情況以及衛生間環境等等,各種各樣可能的因素的存在對使得我們的工作量加大,并且使得問題復雜量[1-2].然而,這些所有可能的影響因素并不是缺一不可了,去掉其中的某個或者某些因素并不會影響學生宿舍衛生質量的最終評價結果.因此通過一些科學的方法保留影響質量評價的主要因素,去掉對質量評價影響較小甚至沒有影響的那些因素,對科學有效的宿舍衛生質量評價具有重要意義.
粗糙集理論是一種應用范圍廣,實用性強的數學理論,所處理的數據具有不完整性和不確定性的特點,該理論的最大特點是不存在任何人為因素,完全依賴數據自身特點,對所涉及的問題進行的處理較為客觀[3,4].屬性約簡理論是粗糙集的核心內容,屬性約簡的主要思想是以不改變所給定的信息系統分類能力為前提,根據數據自身的特點對條件屬性集進行約簡,為了達到簡化信息系統的目的,除去冗余的條件屬性,降低信息系統復雜度.盡量求找較優或者次優的條件屬性約簡,因為求解信息系統的最小屬性約簡是一個NP問題.本文利用條件信息熵的概念對大學生宿舍衛生質量的評價指標進行約簡,其目的就是建立合理且擁有最少評價指標的宿舍衛生質量評價體系,通過實驗表明,將它應用于大學生宿舍衛生質量評價中,得出較滿意的結果.
通常用四元組S=(U,A=C∪D,V,f)表示一個信息系統,其中U={x1,x2,…,xk}稱為論域;A為屬性集,可分為條件屬性集C和決策屬性集為屬性a的所有可能的取值范圍;f:U×C∪D→V.可把U上任意一種屬性或幾種屬性構成的集合看成是U上的一個隨機變量[5].
定義1 把屬性集P和屬性集Q在U上的劃分分別記為 X={X1,X2,…,Xn},Y={Y1,Y2,…,Yn},定義 P 的劃分及 Q 的劃分在U上的子集的概率分布分別表示為


定義3 把屬性集Q相對于屬性集P的條件信息熵H(Q|P)定義為

定義2 屬性集P的熵H(P)定義為
其中,p(Yj|Xi)=|Yj∩Xi|/|Xi|,i=1,2,…,n,j=1,2,…,m.
定義4 設R?C,則在屬性集R中,定義任一屬性a相對決策屬性D的屬性重要度SGF(a,R,D)為:

SGF(a,R,D)值的大小直接關系到屬性a在R中對于決策屬性D的重要程度,值越大表示元素a在R中對于D來說越重要,基于一種改進的條件信息熵的屬性約簡算法及時聯合應用了條件信息熵和屬性重要度的概念,分層次,分等級的利用兩者的大小順序來完成約簡的過程,具體算法如下:
輸入:決策表系統,記為S=(U,C∪D,V,f);記R為條件屬性集的約簡結果,并且對其初始化R=C.
輸出:較原始決策表系統的一個更優的條件屬性約簡結果R.
s1:計算出S中C對于D的正域POSCD的值,以及D關于每一個條件屬性a的條件熵H(D|a)的值計算出來;
s2:對于R中的每個屬性a,計算出a對于決策屬性D的重要度SGF(a,R,D);
s3:依據SGF(a,R,D)的升序,對條件屬性ai進行排序(當SGF(a,R,D)的值相同時,依據H(D,ai)的值由大到小對ai排序);
s4:利用s3中排列好的條件屬性集{ai},依次比較POSR-{ai}D與POSCD,若POSR-{ai}D=POSCD,則ai是冗余的,可刪除,令R=R-{ai},循環終止,轉s2,若{ai}中所有元素都無法滿足POSR-{ai}D=POSCD,則算法結束.
對某一高校某個班級宿舍衛生進行調查,建立宿舍衛生質量評價系統,通過對評價指標進行分析,進一步借助于本文提供的條件信息熵的方法,按照各個指標相對于最終評價結果的重要度,對宿舍衛生評價指標進行約簡.在本文所調查的大學生宿舍衛生質量評價系統中有29個評價對象和11評價指標(地面清潔c1、床鋪整潔c2、物品擺放c3、安全防護c4、空間設計 c5、門窗墻壁c6、垃圾清理 c7、衛生間 c8、衛生工具c9、節能c10以及總體印象c11),通過對這11個評價指標進行打分(每項總分10分),加到一起作為總分,對宿舍衛生質量分為5個等級.總分在60分以下為不合格記為1、總分在60分以上70分以下為合格記為2、總分在70分以上80分以下為中等好記為3、總分在80分以上85分以下為良好記為4、總分在85分以上為優秀記為5,這樣就得到了一個只含有數據的決策表系統如表1所示.應用本文的條件信息熵的概念對該衛生質量評價系統進行條件屬性約簡,最終的各個衛生質量指標的約簡結果如表2,為宿舍衛生評價等級,即為最終的衛生評價結果也就是決策屬性.
從最終的實驗結果可以看出,僅僅通過地面清潔、門窗墻壁和垃圾清理就可對各個寢室衛生質量等級做出相同區分,因此這三個指標就可看成是區分各寢室衛生質量等級的重要指標,在以后的檢查重可簡化調查程序,降低復雜度.通過使用一種改進的條件信息熵屬性約簡方法,對該宿舍衛生質量評價體系中的評價指標進行約簡,在原始的決策表中有11個評價指標,通過本文提供的方法,在不影響宿舍衛生質量評價結果的前提下,通過約簡看出,僅使用地面清潔、門窗墻壁和垃圾清理3個評價指標就能達到最終的衛生質量等級的劃分.在以后的宿舍質量測評中能夠減輕工作量,節省時間和空間.并且,整個的簡化過程完全由數據自己說話,較為客觀,結果更具說服力.

表1 大學生宿舍衛生檢查表

表2 約簡結果
本文利用條件信息熵的概念對大學生宿舍衛生質量評價體系中的評價指標集進行分析處理,根據每個評價指標對宿舍衛生最終的評價結果的重要度對各個評價指標進行可操作的約簡,去除一些冗余的評價指標,減少測評人員認為的評價指標權重分配的主觀影響,增加了宿舍衛生質量評價系統的客觀性及合理性.因此,該方法可簡化宿舍衛生質量評價的過程,減少評價工作量,進而簡化了宿舍衛生管理工作.
〔1〕郭素芳.大學生宿舍文化建設略談[J].雁北師范學院學報2005,21(4):112-113.
〔2〕鄭碧云,等.淺析大學生寢室衛生管理[J].藥學教育,2013,29(4):17-19.
〔3〕Plawk.Z,Rough Sets-Theoretical Aspects of Reasoning about Data[M].Kluwer Academic Publishers.1991.
〔4〕王國胤.Rough集理論與知識獲取[M].西安:西安交通大學出版社,2001.
〔5〕王國胤,于洪,楊大春.基于條件信息熵的決策表約簡[J].計算機學報2002,25(7):759-766.
〔6〕李明,黃文濤,劉智云.關于決策表約簡的 CEBARKNC算法改進[J].計算機應用2006,26(4):864-866.
G451
A
1673-260X(2017)10-0044-02
2017-06-06
阜陽師范學院信息工程學院院級項目(2016FXXZK01);阜陽師范學院教學研究項目(2014JYXM41);阜陽師范學院校級項目(2013FSKJ09)