宋彥蓉,張寶元
(中央財經大學 統計與數學學院,北京100081)
現代化最基本的解釋是達到現代社會所需要的水平。在這一范疇下,現代化包含著四個層面的豐富內涵,分別是經濟層面、政治層面、社會層面和文化層面。基本實現現代化,步入中等收入國家的行列,是中國未來幾十年要努力實現的目標。因此合理評價各地區的現代化水平十分必要,從而能夠根據地區實際來制定合理可行的現代化戰略。本文將就地區現代化這一具體背景,探討三種客觀賦權法的特點。
在綜合評價中,對指標進行賦權的方法分為兩大類,主觀賦權法和客觀賦權法。其中主觀賦權法對評價者依賴程度太大,需要選擇并邀請相關領域的專家,再由專家根據主觀判斷來確定各個指標的權重。而客觀賦權法是依據數據本身的性質來確定各個變量的權重,雖然不會受到人為因素干擾,但是有時計算得到的權重會與實際重要程度發生偏離。不同的客觀賦權法的思想不同,因此在選取權重時所關注到的數據的特點不同。原始數據往往包含兩種信息:一種是各指標變異程度上的差異信息,這種信息可以通過各指標的標準差大小反映出來,另一種是各指標間的相互影響程度上的差異,可以用復相關系數等表現出來。因此不同的客觀賦權方法分別體現了對這兩種信息的使用。其中熵值法、變異系數法是根據數據信息量大小賦權,而復相關系數法則是根據指標間信息的重復性大小賦權。
本文針對客觀賦權中以信息量大小為依據和避免信息重復性為依據的賦權方法進行探討,并結合各地區現代化水平的具體實例,對評價的一致性和差異性進行分析。
綜合評價系統是指運用多個指標對多個參評單位進行評價的綜合指標體系,其基本思想是將多個指標轉化為一個能夠反映綜合情況的指標來進行評價??陀^賦權法是根據原始數據之間的關系通過一定的數學方法來確定權重,其判斷結果不依賴于人的主觀判斷,有較強的數學理論依據。常見的客觀賦權法有:熵值法、復相關系數法、主成分分析法、因子分析法、變異系數法、灰色關聯度法、坎蒂蕾賦權法、加權平方和法。客觀賦權法依據的是數據本身的性質。表1中關于比較常用的幾種客觀賦權法進行了簡要的介紹,也對客觀賦權法自身存在的優缺點進行了說明。
本文為對比客觀賦權方法評價的一致性,因此分別選擇了信息量權數法中存在問題較少的變異系數法和熵值法,以及屬于獨立權數法的復相關系數法對地區現代化水平同時進行評價。
變異系數法是依據指標差異的大小來實現指標賦權,是一種客觀賦權的方法?;驹硎牵涸谠u價指標體系中,指標取值差異越大的指標,也就是越難以實現的指標,這樣的指標更能反映被評價單位的差距。
由于評價指標體系中的各項指標的量綱不同,不宜直接比較其差別程度,需要消除各項評價指標的量綱不同的影響,通過各項指標的變異系數來衡量各項指標取值的差異程度。各項指標的變異系數公式如下:


各項指標的權重為:

表1 幾種客觀賦權法介紹

在信息論中,熵是對不確定性的一種度量。信息量越大,不確定性就越小,熵也就越??;信息量越小,不確定性越大,熵也越大。根據熵的特性,通過計算熵值來判斷一個事件的隨機性及無序程度,也可以用熵值來判斷某個指標的離散程度,指標的離散程度越大,該指標對綜合評價的影響越大。
設X為全國n個地區m個指標的樣本矩陣,X=(Xij)nxm,因本文中運用的地區綜合現代化評價指標中無負值也無負向指標,因此不需要對數據進行正向化處理也不需平移,僅需對初始矩陣進行無量綱化處理,設X*為處理后的樣本矩陣。



鑒于綜合現代化是兩次現代化的協調發展,因此,綜合現代化應包括經濟發展、社會發展和知識發展三個方面。本文借鑒中國現代化戰略研究課題組與中國科學院中國現代化研究中心提出的指標體系,并在該指標體系的框架基礎上調整部分具體指標。由地區現代化的涵義,該指標體系包括經濟發展、社會發展和知識發展三個一級指標。本文的二級指標選取如下,經濟發展由人均國民生產總值(GNP)、居民消費水平、第三產業增加值比重、第三產業勞動力比重等四個二級指標構成,其中本文將原指標體系中的“人均PPP”替換為“居民消費水平”,因為本文考察的是2010年當年的地區現代化水平,不存在時間上的縱向比對,同一時間全國各地區的居民消費物價水平基本一致,而人均實際購買力(PPP)反映的是居民能夠購買商品的情況不是真實的消費情況,居民實際消費的增多會刺激地區經濟的發展和人們生活品質與理念的提升,因此更能反映現代化水平,再基于數據的可獲得性,因此本文用居民消費水平(全年人均消費額)這一指標來體現居民的經濟水平;社會發展由城鎮人口占比、醫療服務(每萬人擁有衛生技術人員數)、人口平均預期壽命、生態效益(能源使用效率)四項二級指標構成;知識發展由知識創新經費投入、知識創新專利產出、高等教育普及率、因特網普及率等四個二級指標構成,其中本文將原二級指標中的“大學普及率”替換為“高等教育普及率”包含了大專在內,因為高等??平逃囵B的是職業技術人才,對社會現代化的貢獻與一般大學相當?,F代化指標體系層次、指標意義與計算方法詳見表2所示。


表2 地區現代化指標體系說明
本文通過SPSS軟件和EXCEL2007實現對數據的分析。
(1)變異系數法
首先,本文基于已經均值化的數據,求各個指標的變異系數,再用各變異系數占變異系數總和的比重作為各個二級指標的權重,一級指標的權重為二級指標權重之和。賦權與計算結果見表3所示。

表3 變異系數法下指標權重分布
從表3中可以看出,由于知識創新經費投入和知識創新專利產出的變異系數較大,故相對于其他指標而言權重較大,二者權重之和達到了0.453,在這樣的權重下對各地區的現代化水平進行排名和評價會使得知識創新水平成為評價的主要方面,這與實際中該指標的重要程度不是非常吻合。在實際中,對地區現代化發展而言,三項一級指標的重要程度相當,而不是主要以知識發展來衡量。變異系數法賦權會拉大原來地區間的差異。指標變異大的,相應的權重越大,而指標變異大說明在該指標下不同地區間的差異較大,因此變異系數法給大的差異賦予了大權重,凸顯了地區間差距較大的指標作用。變異系數法用于綜合評價,可以使參與評價的各地區尤其是排名靠后的地區關注到存在明顯差距的指標,先從這些指標方面改進,促進均衡發展。在原數據中,知識創新專利產出授權量最多的是江蘇省達到138382項,企業創新經費總投入達899.89億元,而最少的省份是西藏省,專利授權僅有124項,創新經費僅為1637萬元。
故變異系數賦權法更容易關注到差異較大的指標,同時對參與評價的表現靠后的地區樣本積極改進最為劣勢的指標有較好的督促作用。
(2)熵值法
熵值法與變異系數法比較相似,二者都是根據數據本身所含的信息量大小來賦權。指標所含信息量越大,則權重越大。但是二者對指標信息量的提取方式不同,因此所得出的指標信息量相對大小的結論也會不一致。本文基于地區現代化水平的實例作出分析。表4即為熵值法下各指標的賦權情況。

表4 熵值法下指標權重分布
綜合表3和表4可以發現,在該例下,熵值法對指標變異的程度相對于變異系數法更加敏感。在熵值法下,知識創新經費和知識創新專利產出的權重之和接近0.7,說明這兩項在評價中的重要程度達到總體的70%,高于變異系數法下的45.3%。因此,若采用熵值法賦權,變異大信息量大的指標非常重要,甚至在評價中起到決定性作用。熵值法更加體現了忽視共性,重視差異的思想。但是,相應地,在存在個別指標差異較大,多數指標變異較小,而實際中各指標的重要程度差距不大的情況下,熵值法容易出現與實際嚴重背離的情況。
(3)復相關系數法
復相關系數雖然也是利用指標本身的數據信息,但是與熵值法和變異系數法存在顯著的不同,復相關系數依據的是信息的重復性而不是指標的變異性。某評價指標如果和其它評價標重復的信息越多,說明該指標的變化越能被其它指標的變化所解釋,因而該指標在綜合評價中所起的作用較小,所以應賦以其較小的權重。作為客觀賦權法中另一種重要思想的體現,本文將其與依據信息量的熵值法和變異系數法作一對比。復相關系數法下各指標的對應權重見表5所示。

表5 復相關系數法下指標權重分布
本文利用SPSS軟件,以每一項二級指標為因變量,其余11項指標為自變量建立了12個多元線性回歸模型,基于每個模型求出該指標關于其他指標的復相關系數。不難看出地區現代化指標間的相關性非常強,基本都在0.9以上,復相關性最弱的指標生態效益與其余指標的復相關性也達到0.8713,接近0.9。在該例下,各個指標間的復相關性都很強,因此各個指標的權重基本相等,說明指標的重要性相同。各指標的權重基本在0.08左右,三項一級指標的權重基本相同。在此種情況下,復相關系數的賦權結果與實際更加貼近。正如知識創新經費投入和知識創新專利產出這兩項指標信息的重復性較高,都反映的是知識創新方面的能力,雖然在各地區之間差異很大,但是基于反映的是同一方面的信息,因此總權數也只能占相應的比例,而不會被凸顯出來。
因此,復相關系數法賦權更加關注全面性,兼顧到發展的各個方面,通常與實際情況貼近。因為實際情況中要側重的指標往往與其他指標的相關性較小,因此在復相關系數法下該指標的權重會相應變大;若該指標與其他指標相關性較大,說明實際中所要側重的方面已經有多個指標的信息可以體現,總權重也不會很小。在綜合評價中,用復相關系數進行賦權,有助于全面地評價地區現代化水平,各個方面的重要性相同,為提高現代化水平,可以通過改進劣勢,也可以通過優勢的進一步提升來實現。
基于上述分析,三種方法下各指標的權重差異較大。復相關系數法中不同指標的賦權值比較平均,而變異系數法和熵值法下知識創新經費和專利產出由于變異大權重很大,尤其是熵值法下這兩項指標的權重更大,對綜合評價地區的現代化水平起到了決定性作用?;诟鞯貐^的各項指標值,乘以相應的權重,得出了各地區在不同賦權法下的總指數,總指數為正向指數,可直接根據總指數的大小對各地區的現代化水平進行綜合排名。排名結果見表6所示。

表6 不同賦權方法下各地區排名情況
由表6可以看出,變異系數法和熵值法下的排名基本一致,僅有微小變動,但變動幅度不超過3名。比如河北省知識創新方面做的相對其余指標較好,因此在熵值法更大的賦權比重下排名由變異系數法下的17名提升到第15名,而在賦權比較均衡的復相關系數法下河北省的綜合排名僅為22名。復相關系數法與另兩種方法的排名結果存在一些差異,但是總體上排名的趨勢相似,相對靠后的地區仍然靠后,名次仍在一定范圍內波動。
為了更加嚴謹地說明三種方法評價結果是否一致,本文通過非參數的kendall秩相關系數檢驗了變異系數法和熵值法下的排名結果的相關性,如表7所示。

表7 kendall非參數相關系數檢驗結果
由表7的檢驗結果可知在地區現代化水平評價中,三種賦權方法的評價結果差異不大,通過了一致性檢驗。雖然指標賦權差異較大,但結果一致,因為地區現代化評價指標體系中的各指標具有很強的相關性,某一指標大,其余的指標一般也較大,因此各指標權重大小在地區現代化評價中的作用不明顯。
由于結果具有一致性,本文綜合三種賦權法下的排名進行分析。江蘇、廣東以及浙江的現代化水平較高,超過了北京、上海。同時,從區域來看,地區現代化水平較高的集中在東部地區。東部11省市中除海南省現代化水平較為落后外,其余均屬于全國靠前的水平。地區現代化水平較高的前9名均為東部地區省市。而西部地區普遍較為落后,西部包含西南和西北地區?,F代化水平最落后的9個省區中除海南省外均屬于西部地區。在西部地區中,現代化水平最好的是四川省,四川位于西南地區和西北地區的交匯之地,西部的中心,南接云南、貴州、重慶,北連青海、甘肅、陜西,具有較好的地理優勢。西部地區要提升現代化水平,可以加強四川輻射作用,東部地區帶動作用,縮小東西部的差距。
在地區現代化水平評價中,分別通過復相關系數法、熵值法以及變異系數法對各個指標進行賦權,并根據不同的權重計算結果進行排序,發現雖然復相關系數法下各指標權重與熵值法、變異系數法存在較大不同,但是三種方法下地區現代化的排序結果基本一致。
現代化水平中,較高的前9名均為東部地區,較落后的后9名除海南均為西部地區。差距非常明顯。加上中部地區,可以明顯發現中國現代化水平呈現明顯的兩極分化,并且從東到西為顯著的階梯狀分布。西部要跟上東部地區的步伐,仍有較長的道路要走。四川為西部地區中現代化水平最高的地區,為全國前40%,且處于整個西部地區的地理中心。應當加強四川對周邊省市的輻射作用。
[1]馬崇明.中國各地區現代化進程的分析與評價[J].統計與決策,2003,(10).
[2]黃永興,宗陽國.地區現代化水平的模型分析[J].安徽工業大學學報(自然科學版),2005,(4).
[3]閻小妍,孟虹,湯明新.綜合評價中不同賦權方法的比較探討[J].中國衛生質量管理,2006,(4).
[4]譚斌,毛軍.幾種客觀賦權的企業競爭能力綜合評價方法應用實例[J].統計教育,2006,(2).
[5]葉宗裕.關于多指標綜合評價中指標正向化和無量綱化方法的選擇[J].浙江統計,2003,(4).
[6]趙雪媛,李冬紅.一種客觀賦權法在業績評價中的運用[J].山西財經大學學報,2002,(1).
[7]中國現代化戰略研究課題組.中國現代化報告2004——地區現代化之路[M].北京:北京大學出版社,2005.