李晴 陳鵬宇



摘? 要:為了研究指標無量綱化方法對熵權法評價結果的影響,以期刊學術影響力評價為例,采用熵權TOPSIS法,對比分析了標準化和均值化兩種方法對評價結果的影響。結果顯示,兩種方法所得熵權和評價結果均存在一定差異。其中,均值化方法可以保持原始數據的差異信息,評價結果更符合實際,更利于有效區分評價對象。標準化方法改變了原始數據的差異信息,有可能導致評價結果偏離實際。因此,該文建議在使用熵權法時,采用均值化方法處理原始數據。
關鍵詞:無量綱化方法? 熵權? 期刊? 學術影響力
中圖分類號:G304? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1672-3791(2019)03(a)-0184-03
在多指標綜合評價中,指標權重的確定是一項重要的工作。權重的確定方法很多,一般可分為主觀賦權法、客觀賦權法和組合賦權法3類。熵權法是目前常用的一種客觀賦權法,其根據樣本數據信息確定指標權重,避免了主觀性傾向的影響。熵權法以信息熵評價某項指標在不同評價對象中的差異程度[1],若某項指標的數據變幅很大,說明該指標提供的信息量大,相應的信息熵小,賦予的權重大;反之亦然。若某項指標的數據全部相等,說明該指標對評價對象無法提供區別信息,相應的信息熵最大,權重為零。
在多指標綜合評價中,評價指標的量綱往往不同,在計算熵權前,需要對指標進行無量綱化處理。研究發現無量綱化方法對數據的差異信息存在影響[2-3]。標準化會消除各指標變異程度上的差異,均值化則可以保留各指標變異程度的信息[2]。由于熵權與數據的差異信息密切關系,因此有必要分析指標無量綱化方法對熵權的影響,以選擇合適的方法。為此,該文以期刊學術影響力評價為例,結合TOPSIS法,研究標準化和均值化兩種指標無量綱化方法對熵權以及評價結果的影響,并提出相應的建議。
1? 研究方法
1.1 熵權TOPSIS法
熵權法常常與TOPSIS法結合用于評價與決策[4-5]。該文同樣采用熵權TOPSIS法作為評價方法。當然,這里TOPSIS法僅作為一個算例,也可以與其他評價方法相結合。熵權TOPSIS法的基本步驟如下。
(1)假設有m個評價對象;n個評價指標,建立評價指標矩陣R={rij},其中rij為第i個評價對象的第j個評價指標值。
(2)對評價指標矩陣R進行無量綱化處理,將其轉化為無量綱矩陣R′={r′ij},其中rij為第i個評價對象的第j個評價指標的無量綱化值。
(3) 計算評價指標的信息熵。計算公式如下:
1.3 變異系數
為了對比標準化和均值化兩種方法對熵權以及評價結果的影響,需要對數據的差異程度進行衡量。該文采用變異系數作為衡量數據差異程度的參考依據,計算公式如下:
標準差雖然能衡量數據的離散程度,但是如果數據量綱不同的情況下,不適合進行比較。若除以平均值,則可以消除數量級和量綱的影響。
2? 實證研究——以期刊學術影響力評價為例
期刊評價是一項復雜的工作,一般需要考慮多個指標才能盡可能全面評價期刊質量的優劣。期刊的引用情況反映了該期刊在學術交流中的地位和作用,是期刊學術影響力的重要體現。選擇與期刊引用相關的計量指標,包括總被引頻次、影響因子、即年指標、他引率、引用刊數、學科影響指標、學科擴散指標作為評價指標[6]。以7種管理科學期刊為例,數據來源于《2012年版中國科技期刊引證報告》(擴刊版),具體如表1所示。
各指標均為正向指標,分別對表1中的數據進行標準化和均值化處理,計算處理前后各指標的變異系數,如表2所示。從表2中可以看出,標準化處理后,各指標的變異系數均發生了改變,都表現為增大。這說明標準化處理放大了數據的差異信息,以他引率指標為例,未處理前的變異系數僅為0.013,從表1中也可以看出,各期刊的他引率比較接近,在0.93~0.98之間,說明數據差異程度較小。但是標準化處理后,變異系數增大到了0.564,數據的差異信息被放大。均值化處理后,各指標的變異系數與處理前保持一致,說明均值化不會改變數據的差異信息。
按熵權的計算步驟,計算各指標的信息熵和熵權如表3所示。對比標準化和均值化的計算結果可知,標準化后各指標的信息熵值均低于均值化的結果。這與表2中標準化對數據差異信息的放大是對應的。差異信息越強,信息熵值越小。相應的,熵權計算結果也存在較大差異。以他引率指標為例,標準化對應的信息熵為0.89757,熵權為0.06223,均值化對應的信息熵幾乎為1,熵權幾乎為0,這與表2中的變異系數也是對應的。均值化對應的變異系數為0.013,接近于0,所以對應的信息熵值接近于1。標準化對應的變異系數為0.564,所以對應的信息熵值更小。
為了進一步對比兩種方法的合理性,還需對比最終的評價結果。按熵權TOPSIS法的計算步驟,計算各期刊的綜合評價值及排序,結果如表4所示。從表4中可以看出,各期刊綜合評價值存在一定差異,但排序基本一致,僅數理統計與管理和研究與發展管理兩種期刊的排序不一致。
根據表1的數據對比兩種期刊,數理統計與管理有4個指標值相對更大,其中引用刊數和學科擴散指標大0.73倍,即年指標大0.41倍,總被引頻次稍大。其余3個指標相對更小,其中影響因子小0.35倍,另外2個指標稍小。單從這些數據來看,數理統計與管理的排序應大于研究與發展管理,即均值化對應的排序結果更符合實際。
客觀賦權的一個重要目的在于有效區分評價對象[7],以利于排序和決策。因此,計算表4中綜合評價值的標準差、平均值和變異系數如表5所示。從表5中可以看出,均值化方法對應的標準差和變異系數均大于標準化方法,說明均值化處理后,綜合評價值的差異程度更利于有效區分評價對象。
綜上所述,均值化方法可以保持原始數據的差異信息,評價結果更符合實際,更利于有效區分評價對象。標準化方法改變了原始數據的差異信息,有可能導致評價結果偏離實際。因此,該文建議采用均值化方法處理原始數據。
3? 結論
為了研究指標無量綱化方法對熵權法評價結果的影響,該文以期刊學術影響力評價為例,采用熵權TOPSIS法,對比分析了標準化和均值化兩種方法對評價結果的影響。所得結論如下。
(1)均值化方法可以保持原始數據的差異信息,而標準化方法改變了原始數據的差異信息,這是導致兩種方法熵權計算結果存在差異的主要原因。
(2)由于熵權計算結果不一致,均值化和標準化方法的評價結果存在差異,以均值化方法的評價結果更符合實際。標準化方法由于改變了原始數據的差異信息,有可能導致評價結果偏離實際。
(3)該文實例中,均值化方法對應的標準差和變異系數均大于標準化方法,說明均值化方法更利于有效區分評價對象。建議在使用熵權法時,采用均值化方法處理原始數據。
參考文獻
[1] 俞立平,武夷山.學術期刊客觀賦權評價新方法——指標難度賦權法[J].現代圖書情報技術,2011(4):64-70.
[2] 葉宗裕.關于多指標綜合評價中指標正向化和無量綱化方法的選擇[J].浙江統計,2003(4):24-25.
[3] 張衛華,趙銘軍.指標無量綱化方法對綜合評價結果可靠性的影響及其實證分析[J].統計與信息論壇,2005,20(3):33-36.
[4] 李艷,張巧良,王正軍.熵權TOPSIS法在垃圾滲濾液處理方案優選中的應用[J].統計與決策,2017(10):85-87.
[5] 李煜華,劉立佳,胡瑤瑛.基于熵值TOPSIS模型的Kindle創意產品優化評價[J].統計與決策,2016(20):183-185.
[6] 程慧平.基于主成分分析與熵權TOPSIS方法的期刊學術影響力研究[J].情報科學,2015,33(12):77-82.
[7] 李剛,李建平,孫曉蕾,等.主客觀權重的組合方式及其合理性研究[J].管理評論,2017,29(12):17-26,61.