摘要:嘗試將遺傳約簡算法應(yīng)用于高技術(shù)企業(yè)信用評價指標體系構(gòu)建。首先,建立高技術(shù)企業(yè)信用評價初始指標體系,并采用等頻率法實現(xiàn)連續(xù)屬性離散化;然后,運用遺傳約簡算法求解最小約簡,從而剔除冗余指標,獲得約簡后的高技術(shù)企業(yè)信用評價指標體系。實證分析結(jié)果證明了遺傳約簡算法在高技術(shù)企業(yè)信用評價指標體系構(gòu)建中的可行性和適用性。
關(guān)鍵詞:高技術(shù)企業(yè);信用評價;指標體系;粗糙集;屬性約簡;遺傳約簡算法
中圖分類號:F27文獻標志碼:A文章編號:1673-291X(2010)25-0029-04
引言
高技術(shù)企業(yè)是研究開發(fā)為社會提供高科技含量的產(chǎn)品與服務(wù)、以迅速的技術(shù)進步為標志的特殊類型的現(xiàn)代企業(yè),與傳統(tǒng)企業(yè)相比,高技術(shù)企業(yè)在技術(shù)成果轉(zhuǎn)化時的一個顯著特點是具有更高的不確定性,即高風險、高收益,這種不確定性在一定程度上加劇了信息非對稱性的影響,從而導致高技術(shù)企業(yè)面臨融資障礙 [1]。對高技術(shù)企業(yè)信用狀態(tài)進行科學評價,有助于降低合約雙方的交易成本、減少信息非對稱性、弱化信用風險,有助于拓寬高技術(shù)企業(yè)融資渠道,有助于提升其自主創(chuàng)新能力。
粗糙集(Rough Set,RS) [2~3]是一種刻畫不完整性和不確定性的數(shù)學工具,能有效分析和處理不精確、不一致、不完整等各種不完備信息,還可以對數(shù)據(jù)進行分析和推理,從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律,從而有效進行知識庫的約簡和規(guī)則的提取,已成功應(yīng)用于機器學習、決策分析、過程控制、模式識別與數(shù)據(jù)挖掘等領(lǐng)域。知識(屬性)約簡問題是粗糙集理論的一個核心問題,是指在保持知識庫分類能力不變的條件下,刪除其中不相關(guān)或不重要的冗余知識 [3]。一般地,一個知識庫中的知識約簡不是唯一的,計算知識約簡的復雜性是隨著決策表的增大呈指數(shù)增長的,是一個典型的NP完全問題 [4]。現(xiàn)有的約簡算法,主要是從粗糙集的核出發(fā),采用啟發(fā)式搜索的方法構(gòu)造所含條件屬性最少的約簡,即最小約簡 [5]。在啟發(fā)式屬性約簡算法中,遺傳約簡算法突破了以往決策表屬性約簡大多是串行搜索的局限,利用遺傳算法適合復雜優(yōu)化問題的并行處理的特點,大大提高了決策表屬性約簡結(jié)果的準確性和算法的效率 [6]。有鑒于此,本文嘗試將遺傳約簡算法應(yīng)用于高技術(shù)企業(yè)信用評價指標體系構(gòu)建。首先,建立高技術(shù)企業(yè)信用評價初始指標體系,并采用等頻率法實現(xiàn)連續(xù)屬性離散化;然后,運用遺傳約簡算法求解最小約簡,從而剔除冗余指標,獲得約簡后的高技術(shù)企業(yè)信用評價指標體系。實證分析結(jié)果證明了遺傳約簡算法在高技術(shù)企業(yè)信用評價指標體系構(gòu)建中的可行性和適用性。
一、粗糙集基本概念 [7]
定義1:一個信息系統(tǒng)S可表示為:S=(U,A,V,f),其中,U={x1,x2,…,xn}是對象的非空有限集合,稱為論域A={a1,a2,…,am};是屬性的非空有限集合,稱為屬性集;V表示屬性的值域集,V=∪Va,Va是屬性a∈A的值域;f:U×A→V表示從U×A 到V的信息映射,它為每個對象的每個屬性賦予一個信息值,即?坌a∈A,x∈U,f(x,a)∈Va。當A=C∪D,C∩D=φ時,稱S為決策表,C和D分別稱為條件屬性集和決策屬性集。
定義2:設(shè)P是定義在論域U上的一個等價關(guān)系簇,關(guān)系R∈P,如果IND(P\{R})=IND(P),則稱關(guān)系R在P中是絕對不必要的(多余的);否則,稱關(guān)系R在P中是絕對必要的。如果每個關(guān)系R∈P在P中都是絕對必要的,則稱關(guān)系簇P是獨立的;否則,稱P是相互依賴的。
定義3:設(shè)P和Q是定義在論域U上的兩個等價關(guān)系簇,且Q?奐P,如果Q是獨立的,且IND(Q)=IND(P),則稱Q是P的一個約簡。一般情況下,一個信息系統(tǒng)的約簡不止一種,這些約簡均維持了與原有條件屬性相同的分類能力。
二、實證分析
1.初始指標體系及原始數(shù)據(jù)
本文參照國家財政部統(tǒng)計評價司的企業(yè)績效評價指標體系和中國工商銀行企業(yè)資信評估指標體系,結(jié)合高技術(shù)企業(yè)特點,遵循指標選取的系統(tǒng)性、科學性、客觀性、可比性及可操作性等原則,從償債能力、營運能力、盈利能力及其他等四個方面構(gòu)建高技術(shù)企業(yè)信用評價初始指標體系(見表1)。
選取10家高技術(shù)上市公司組成實驗樣本集A={Ai|i=1,2,…,10},行業(yè)涉及醫(yī)藥制造業(yè)、航空航天器制造業(yè)、電子及通信設(shè)備制造業(yè)、電子計算機及辦公設(shè)備制造業(yè)、醫(yī)療設(shè)備及儀器儀表制造業(yè)等。樣本區(qū)間選定為2007年,財務(wù)數(shù)據(jù)來源于國泰安數(shù)據(jù)庫,自主創(chuàng)新能力和發(fā)展前景由專家用語言值來描述。利用云理論,把語言值用相應(yīng)的三個數(shù)字特征(Ex,En,D)來表征,即用一個云對象來表示,這樣,Ex值就可作為語言值型指標的定量表示值(具體算法參見文獻 [8])。高技術(shù)企業(yè)信用評價初始指標原始數(shù)據(jù)(見表2)。
2.指標約簡
(1) 償債能力指標約簡范例
步驟1:連續(xù)屬性離散化。
由于粗糙集理論只能對數(shù)據(jù)庫中的離散屬性進行處理,而絕大多數(shù)現(xiàn)實的數(shù)據(jù)庫兼具離散屬性和連續(xù)屬性,所以,在運用屬性約簡算法之前,須先將連續(xù)屬性離散成有限個語義符號[9]。本文采用等頻率法對償債能力指標數(shù)據(jù)進行離散,得出(如下頁表3所示)的信息決策表。
步驟2:求解最小約簡。
本文借助粗糙集分析軟件ROSETTA,運用遺傳約簡算法求解最小約簡。選定父代初始種群規(guī)模為70,交叉概率為0.8,變異概率為0.05,最大進化代數(shù)為100,得出6個最小約簡:{I13,I15,I17}、{I11,I12,I17}、{I13,I16,I17}、{I12,I13,I17}、{I11,I14,I17}、{I13,I14,I17}。根據(jù)專家意見,不妨選取I11、I14、I17作為償債能力指標。
(2)其余指標約簡結(jié)果
重復(1)節(jié)步驟1和步驟2,同理可得其余指標的約簡結(jié)果。營運能力指標約簡后為I21、I24、I25,盈利能力指標約簡后為I32、I35、I36,其他指標約簡后為I41、I42。綜合以上結(jié)果,即可獲得約簡后的高技術(shù)企業(yè)信用評價指標體系(見表4)。
3.高技術(shù)企業(yè)信用評價
為消除各指標的量綱和統(tǒng)一各指標的變化范圍和方向,首先對指標值進行極值歸一化處理(具體算法參見文獻[10]);然后,采用根據(jù)指標所提供的信息量確定指標權(quán)重的客觀賦權(quán)法——熵權(quán)法[11]計算各指標的熵值和權(quán)重,結(jié)果(見表5)。
由線性加權(quán)法計算得出10家高技術(shù)上市公司的信用評價值結(jié)果(見表6)。
由表6可知,10家高技術(shù)上市公司信用狀態(tài)的優(yōu)劣排序為:A10>A5>A7>A3>A6>A1>A2>A8>A9>A4
結(jié)束語
運用粗糙集遺傳約簡算法求解最小約簡,從23個初始指標中剔除了12個冗余指標,獲得約簡后的高技術(shù)企業(yè)信用評價指標體系,從而在保持知識庫分類能力不變的條件下,減少了后續(xù)綜合評價的計算量。在運用屬性約簡算法之前,須進行連續(xù)屬性離散化,現(xiàn)有的離散化方法包括等距離法、等頻率法、最小信息熵法、層次聚類法、遺傳算法及SOM網(wǎng)絡(luò)法等,上述方法都會或多或少地損失部分信息,如何構(gòu)造、選擇合適的離散化方法值得進一步研究。本文主要從財務(wù)因素角度構(gòu)建了高技術(shù)企業(yè)信用評價指標體系,建立包含信用記錄、管理者素質(zhì)等因素的、更為全面的高技術(shù)企業(yè)信用評價指標體系有待于今后進一步研究。
參考文獻:
[1] 熊波,陳柳.非對稱信息對高新技術(shù)企業(yè)融資的影響[J].中國管理科學,2007,(3):136-141.
[2] Pawlak Z.Rough sets[J].International Journal of Computer Information Science,1982,(5):341-356.
[3] Pawlak Z.Rough set theory and its application to data analysis[J].Cybernetics and Systems,1998,9(7):661-688.
[4] Wong S K M,Ziarko W.On optimal decision rules in decision tables [J].Bulletin of Polish Academy of Sciences,1985,(11-12):693-
696.
[5] 陶志,等.基于遺傳算法的粗糙集知識約簡方法[J].系統(tǒng)工程,2003,(4):116-122.
[6] Wróblewski J.Finding minimal reducts using genetic algorithms[R].Warsaw University of Technology: ICS Research Report,1995:
16-95.
[7] 王國胤.Rough集理論與知識獲取[M].西安:西安交通大學出版社,2001.
[8] 焦躍,李德毅,楊朝暉.一種評價C3I系統(tǒng)效能的新方法[J].系統(tǒng)工程理論與實踐,1998,(12):68-73.[9]于錕,劉知貴,黃正良.粗糙集理論應(yīng)用中的離散化方法綜述[J].西南科技大學學報,2005,(4):32-36.
[10]張目,周宗放.基于多目標規(guī)劃和支持向量機的企業(yè)信用評估模型[J].中國軟科學,2009,(4):185-190.
[11]邱菀華.管理決策與應(yīng)用熵學[M].北京:機械工業(yè)出版社,2002.
Construction of Credit Evaluation Index System for High-tech Enterprises Based on Rough Set
ZHANG Mu,ZHOU Zong-fang
(School of Management and Economics,University of Electronic Science and Technology of China,Chengdu 610054,China)
Abstract: This paper attempts to apply genetic reduction algorithm in construction of credit evaluation index system for high-tech enterprises.Firstly,an initial credit evaluation index system of high-tech enterprises is constructed.And then,the discretization of continuous attributes is realized by means of the equal frequency scaler.Secondly,using genetic reduction algorithm,the minimal reduction is solved and those redundant indices are removed.Thus,a reduced index system is obtained.Finally,the empirical analysis results show that genetic reduction algorithm is feasible and suitable in construction of credit evaluation index system for high-tech enterprises.
Key words: high-tech enterprise; credit evaluation; index system; rough set; attribute reduction; genetic reduction algorithm
[責任編輯 吳高君]