[摘 要] 依據信息粒度理論,提出一種對數據屬性進行約簡的改進算法,對該算法進行分析,并將其應用于企業競爭力指標體系的構建,精煉了評價指標,提高了評價的可操作性和科學性#65377;
[關鍵詞] 信息粒度;屬性重要度;屬性約簡;指標體系
[中圖分類號]F272;F224.0[文獻標識碼]A[文章編號]1673-0194(2008)15-0098-03
0 引 言
在評價企業競爭力水平時,為了提高評價的全面性和準確性,管理部門制訂的評價指標體系往往過于復雜,這將導致企業評價成本提高,另外也容易掩蓋重要指標#65377;因此,為使評價過程更加科學#65380;全面#65380;高效,管理部門迫切需要一套優化后的評價指標體系#65377;對多指標進行取舍和融合,形成更為科學#65380;合理的指標體系的過程實質上為知識約簡過程#65377;
目前已有關于信息粒度的應用研究,如文獻[1]研究了屬性權重的確定方法,但在計算過程中將核core(A)看作是約簡#65377;其實核是所有約簡的交集[2],所以核不一定是該問題的約簡,因此本文在文獻[1]的基礎上,結合約簡的定義,進一步提出了一種基于信息粒度的屬性約簡算法,并將改進后的算法應用于企業競爭力評價指標體系的優化,說明了算法的有效性#65377;
1 信息粒度及其屬性約簡算法
1. 1信息粒度
人類在處理較復雜問題時,往往會將整體劃分成不同的塊,每一個塊就是一個信息粒,這種簡化過程和粗集理論中等價關系的劃分原理是一致的,因此,粗集理論中的等價關系可以看作是一種信息粒度#65377;本文將采用文獻[3-4]中的觀點描述信息粒度#65377;
定義1設U為一個論域,R為屬性(關系)集合,X是對象在R上粒化形成的一個信息粒,X的粒度為G(X)= |X| / |U|#65377;
定義2設U為一個論域,R為屬性(關系)集合,關系R的粒度定義為G(R) = |R| / |U|2(其中|R|表示R?哿U的基數),R= ?準時定義G(R)=1#65377;
命題1設U為一個論域,R為屬性(關系)集合,U / R={X1,X2, …,Xn}表示對象在R上粒化形成的一組信息粒,則G(R)
定義3設U為一個論域,R為屬性(關系)集合,R的分辨度定義為D(R)=1-G(R),R= ?準時D(?準)=0#65377;
定義4設S=(U,A)為一個信息系統,?準≠C?哿A, a?埸C,屬性a相對于屬性集C的重要性定義為:
定義5設S=(U,A)為一個信息系統,屬性a∈A,當SGFA(a)>0時,稱a是A中必要的,反之稱a是A中不必要的,A中所有必要屬性的集合稱為A的核,記為core(A)#65377;
定義6[5]設S=(U,A)為一個信息系統,Q?哿A,Q為A的一個約簡,當符合U/Q=U/A且Q中所有元素都是必要的#65377;
1. 2基于信息粒度屬性約簡的改進算法
由定義5求出屬性集A的核core(A),因為核是所有約簡的交集,所以核是求約簡的起點,根據定義6,逐一選擇核之外的屬性a[ j]加入到核集中,如果SGF(core(A)∪{a[j ]})(a[ j ])>0,則a[ j ]為core(A∪{a[ j ]})中必要的,對必要的a[ j ]驗證U/{core(A)∪{a[ j ]} = U/A是否成立,即加入a[ j ]后系統的粒度是否等于整個屬性集A的粒度,如果成立則得到系統的一個屬性約簡{core(A)∪{a[ j ]}#65377;
算法描述如下:
輸入:信息系統S=(U,A),其中U為論域,A為屬性集#65377;
輸出:該信息系統的一個屬性約簡,表示為Red(A)#65377;
step1計算A的信息粒度G(A)#65377;
step2計算核core(A)#65377;即將所有符合SGFA(a[i])>0的屬性a[i]加入到核中#65377;
step3Red(A):=core(A),對屬性集A-Red(A)重復操作:
(1) 對?坌a[ j ]∈A-Red(A),計算屬性a[ j ] 對屬性集{core(A)∪{a[ j ]}}的重要度SGF(core(A)∪{a[ j ]})(a[ j ])#65377;
(2) 選擇滿足 SGF(core(A)∪{a[ j ]})(a[ j ])>0的屬性a[ j ],判斷U/{core(A)∪{a[ j ]}} = U/A是否成立,若成立,則得到系統的一個約簡Red(A):=Red(A)∪{a[ j ]},算法終止,輸出Red(A)#65377;
1. 3算法的復雜性
屬性約簡的復雜性主要由信息系統的屬性數所決定#65377;計算SGFA(a[i]) 及判斷其是否大于0各需| A|次,計算一次SGFA(a[i])的時間復雜度為O(| A||U| 2),所以求核的時間復雜度為 O(| A| 2|U| 2)#65377;
按此算法求約簡,共需計算| A|次SGF(core(A)∪{a[ j ]})(a
[ j ]),計算一次SGF(core(A)∪{a[ j ]})(a[ j ])的時間復雜度為O(
| A||U| 2),判斷其是否大于0及判斷U/{core(A)∪{a[ j ]}} = U/ A是否成立各需計算| A|次,所以求約簡的時間復雜度為O(| A| 3|U| 2)#65377;
綜上可知,此算法的最壞時間復雜度為O(| A| 3|U| 2)#65377;
2 應用實例
目前已有學者采用粗集理論中基于分辨矩陣的屬性約簡算法對企業競爭力評價指標進行優化研究[6],為了說明改進算法的有效性和可操作性,本文仍以文獻[6]中的實例為研究對象,選擇6家來自國內外的大型石油企業的2004年度報表數據,為節省篇幅,本文將原始數據表中的規模實力的8項子指標(表1)作為研究對象進行系統優化#65377;
設石油企業集U={中石化, 中石油, 中海油, BP, EXXON, SHELL},簡記為U={u1,u2,u3,u4,u5,u6},指標集合A={總資產, 石油儲量, 天然氣儲量, 原油產量, 天然氣產量, 煉油能力, 乙烯能力, 加油站數},簡記為A={a1,a2,a3,a4,a5,a6,a7,a8},按以上算法對系統進行處理:
step1對原始數據表按文獻[5]中的方法進行離散化處理,剔除冗余屬性,得系統簡化表2,故A={a1,a2,a3,a4,a5,a6}#65377;為計算方便,可列出對象U按指標屬性的粒化表,表3為按屬性集A及其去除單個屬性后對系統進行粒化后的結果#65377;
step2計算屬性集A的核core(A)#65377;
通過粒化表,知U/A= {{1},{2},{3},{4},{5},{6}},G(A)=1/6,D(A)=5/6,U/(A-{a1})= {{1},{2},{3},{4},{5},{6}},G(A-{a1})=1/6,D(A-{a1})=5/6,所以SFGA(a1)=0,同理計算得SGFA(a2)=14/15,SGFA(a3)=0,SGFA(a5)=0,SGFA(a6)=14/15,所以core(A)={ a2,a6}#65377;
step3計算屬性集A的一個約簡#65377;
按上述方法計算SGF (a1)=3/14,又U/{core(A){a1}}=U/{a1,a2,a6}={{1},{2},{3},{4},{5},{6}}=U/A,所以Red(A)=core(A)∪{a1}={a1,a2,a6},得到屬性集A的一個約簡R1={a1,a2,a6},其實一個信息系統的約簡可能有多個,經計算,本例R2={a3,a2,a6}與R3={a5,a2,a6}均為屬性集A的一個約簡,不妨取R1={a1,a2,a6}為規模實力的衡量指標,這與文獻[6]計算結果一致,說明了該算法的有效性#65377;
3 結束語
本文從信息粒度的角度出發,對信息系統中的屬性重要度進行度量,提出一種基于信息粒度屬性約簡的改進算法,并將該算法應用于企業競爭力評價指標的約簡#65377;本文的創新點在于:文獻[6]的算法隨著問題規模增大,用于存放分辨矩陣的空間和算法執行時間的開銷都很大,本文所提出的改進算法則無需存放矩陣,減少了算法的計算量,能實現評價指標體系快速#65380;有效約簡#65377;
主要參考文獻
[1] 周輝,魯燕飛,等. 基于知識粒度的屬性權重方法[J]. 統計與決策,2006(10).
[2] 何國建,陶宏才. 一種基于粗集理論的屬性約簡改進算法[J]. 計算機應用,2004(11).
[3] 耿志強,朱群雄,李芳. 知識粗糙性的粒度原理及其約簡[J]. 系統工程與電子技術,2004(8).
[4] 苗奪謙,范世棟. 知識的粒度計算及其應用[J]. 系統工程理論與實踐,2002(1).
[5] 劉清. Rough集及Rough推理[M]. 北京:科學出版社,2001.
[6] 張立凡,李東. 基于屬性約簡的石油企業競爭力指標體系構建[J]. 工業技術經濟,2006(10).
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”