潘強敏
(浙江省統計局,浙江杭州 310025)
研究探索
指數的統計理論研究和實證分析
潘強敏
(浙江省統計局,浙江杭州 310025)
本文運用統計學中常用的綜合指數、可變結構指數和不平等度指數理論,以勞動工資統計并結合國民經濟核算資料為實證,分析論證了統計常用指數的局限性,提出科學應用指數的新思路,意在從統計指數的角度不斷改進完善相關統計方法和統計制度,使包括指數在內的統計數據能夠更加全面準確地反映經濟社會發展的實際水平。
指數;局限性;改進
統計學中的指數是綜合運用絕對數、相對數的一種方法,對指數進行科學構建研究在經濟統計分析中有著非常重要的理論和現實意義。本文以勞動工資統計結合國民經濟核算,闡述常用的指數編制和運用,并實證分析統計常用指數的局限性,提出科學運用指數的新思路,研究其變動趨勢和綜合發展水平,使統計數據全面準確反映經濟社會和地區發展的實際水平。
1.綜合指數編制。綜合指數編制有簡單綜合和加權綜合兩類。所謂簡單綜合指數就是把價格或實物量直接相加對比。從勞動工資統計制度看,各單位支付給勞動者的勞動報酬以及其他根據文件規定支付的工資,無論是計入成本還是不計入成本的,無論是以貨幣形式支付的還是以實物形式支付的,均應列入工資總額的范疇。以表1為例:如某單位以甲乙丙三項物品作為實物形式支付工資的一部分,可以計算簡單綜合物量指數和簡單綜合價格指數。

表1 按基期及報告期分的實物物量和單價比較表
簡單綜合物量指數

簡單綜合價格指數

這種簡單指數用于不同的物量品種在數學理論上可以操作但是無經濟意義的計算結果在實際工作中沒有任何應用價值,既不能代表這家單位支付職工實物形式的工資報酬報告期比基期增長10.4%,也不能代表9.3%的實物形式的工資報酬增長水平。為此,綜合指數都必須是加權的,所用權數,是以指數化因素而言的。一般情況下,價格指數這類質量指標用物量這類數量指標作權數,而物量指標指數則用價格指標作權數,通過加權,就把不能同度量的價格P和物量Q都過渡到能同度量的價值量指標PQ。因此,綜合指數中的權數又稱同度量因素,它不僅起到加權的作用,還能起到同度量的作用。同度量因素時期的選擇,一般有兩種:一是固定在基期,二是固定在報告期。即兩個比較常用的用基期的指標作權數計算價格指數和物量指數的拉氏指數和用報告期的指標作權數計算價格指數和物量指數的派氏指數。
通過案例分析顯示,按照拉氏或派氏編制的指數均忽略了價格和物量因素間的相互關系,夸大了質量因素的變動作用。以表1為例,計算得到:

結果顯示:綜合指數分析中相對數和絕對數的矛盾。
2.可變結構指數。可變結構指數是指兩個不同的平均數相比得出的指數受兩個因素影響,一個是現象本身水平變動的影響,另一個是現象內部結構變動的影響。要分析這兩個因素對可變結構指數的影響,一是假定現象內部結構沒有變化,僅考慮現象本身水平的變動,即計算固定結構指數;二是假定現象水平沒有變化,僅考慮現象內部結構的變動,即計算結構影響指數,這三個指數形成了一個指標體系,并能夠進行指數體系的因素分析。其公式表示為:
可變結構指數=/;
固定在報告期的固定結構指數=/;
固定在基期的結構影響指數=/
即可變結構指數=固定結構指數×結構影響指數
從勞動工資統計看,現有勞動工資統計報表中涉及按行業、職業、結構、地區分的勞動工資總額、從業人員等歷年主要指標,根據這些基礎指標以及相關經濟社會綜合指標,可以計算出一系列的相關增速,這是指數最直接的形象表述,如增長10%,就是指數為110%,下降10%,就是指數為90%。因此,從業人員增速,平均工資增速;全社會勞動生產率增速;從業人員與人口之比、平均工資行業之比、地區之比、職業之比、勞動者報酬占GDP比重、平均工資和城鄉居民收入之比的變動等都是指數,其中,利用簡單算術平均數計算的平均工資指數是最常用的指數。然而,運用常規統計方法得出的指數結果常常遇到一些困惑。以按經濟類型分的2014年浙江省平均工資數據為例:2014年,浙江全社會單位就業人員年平均工資48145元,比2013年增長8.6%,其中,非私營單位就業人員和私營單位就業人員年平均工資分別為61572元和38689元,增長8.8%和9.6%。
結果顯示:全社會平均工資增速均低于私營和非私營增速。

表2 按經濟類型分的浙江省全社會單位就業人員平均工資變化情況單位:億元,萬人、元、%
3.不平等度指數。目前,常用的對行業、地區、城鄉所有制收入差異進行衡量的不平等度指數有泰爾指數、基尼系數等。泰爾指數或稱泰爾熵標準作為衡量收入差距(或者稱不平等度)的指標,是由泰爾(Theil,1967)利用信息理論中的熵概念來計算收入不平等而得名。假設U是某一特定事件A將要發生的概率,P(A)=U。這個事件發生的信息量為E(U)肯定是U的減函數。用公式表達為:E (U)=log(1/u)。當有n個可能的事件1,2,…,n時,相應的概率假設分別為U1,U2,…,Un,Ui≥0,并且∑Ui=1。
熵或期望信息量可被看作每一件的信息量與其相應概率乘積的總和:

顯然,n種事件的概率Ui越趨近于(1/n),熵也就越大。在物理學中,熵是衡量無序的標準。如果Ui被解釋為屬于第i單位的收入份額,E(U)就是一種反映收入分配差距不平等的尺度。收入越平均,E(U)就越大。如果絕對平均,也就是當每個Ui都等于(1/n)時,E(U)就達到其最大值logn。泰爾將logn—E(U)定義為不平等指數——也就是泰爾指數:

基尼系數是國際上用來綜合衡量平均收入分配差異狀況的一個重要分析指標。根據基尼系數性質,在計算平均工資基尼系數中,我們設平均工資分布曲線(洛倫茨曲線)和平均工資絕對無差異曲線之間的面積為A,實際平均工資曲線右下方的面積為B。如下圖:

以A除以(A+B)的值表示不平等程度,我們稱這個數值為平均工資基尼系數,該系數值域為(0,1)。如果基尼系數越逼近零,表示平均工資平衡度越高;如果系數越逼近1,表示平衡度越差。用GI,I=1,2,…,N表示全省按行業分的N個組成部分的工資總額,PI表示各行業的年平均從業人員數,AI=GI/PI為各行業的平均工資。定義I的編號以AI從小到大的次序排列。設GI=GI/G,PI=PI/P,其中G 和P分別表示GDP之和與人口之和,即G=∑GI,P= ∑PI,設累計變量GIS=∑GI(S=1,…N),PIS=∑PI(S= 1,…N)。
在平面坐標中,(PIS,GIS)集合點順序連接的曲線即為洛倫茨曲線。在圖中,洛倫茨曲線和45度線之間的面積A和45度線下的面積(A+B)之比就是平均工資基尼系數,即G=A/(A+B)連接點(P (I-1)S,G(I-1)S)到點(PIS,GIS),由基尼系數的原理定義:

根據上述泰爾指數和基尼系數計算原理,以2005年以來行業平均工資數據為數值,得出浙江省近年來行業泰爾指數和基尼系數(表3計算結果直接取自2015年62期浙江統計分析《浙江行業工資差異分析》羅斌一文)。

表3 浙江省近年來泰爾指數和基尼系數

續表
結果顯示:無論是泰爾指數還是基尼系數,浙江行業間工資差異均呈現整體逐步縮小趨勢。
1.綜合指數方面。以表1數據的計算可以看出,從相對數分析,L>P,說明物量變動對實物總額的影響要大于價格變動所產生的影響,即物量變動因素指數大于價格變動因素指數。但是從絕對數分析說明價格的變動帶來的影響要大于物量變動到來的影響,所以分析報告期相比于基期的工資總額中實物價值的變動,究竟是由價格變動還是物量變動起主要因素就產生了截然不同的結果。
2.可變結構指數方面。表2顯示,由于全社會就業人員平均工資以上年為100的指數為108.6,均低于非私營和私營平均工資指數108.8和109.6,數據一經公布,一些百姓表示不解。確實,從理論上計算,這樣的計算沒有任何問題,但是從實際看,解釋這個結果產生的原因就有點復雜,更進一步分析,其實是我們采用簡單算術計算平均工資所產生的缺陷。表2顯示,在工資總額中,2014年非私營和私營占比分別為52.8%和47.2%,在從業人員中,2014年非私營和私營占比分別為41.3%和58.7%,比重的較大反差以及簡單算術計算極易受到極端數值的影響,代表性也會打折扣,由此計算的一系列衍生指標包括指數也會受到影響。
3.不平等度指數。從表3數據以及泰爾指數、基尼系數的編制原理分析看,由于泰爾指數對高工資水平人群工資變化比較敏感,因此,泰爾指數下降主要反映了高工資行業人群工資變化大幅縮小了整體工資差異。而由于基尼系數對中間工資水平人群工資變化比較敏感,因此,基尼系數下降
主要反映了中等工資水平人群工資變化對行業工資差異的影響。因此,僅用某個指數來判斷行業工資差異程度有失偏頗,同樣在判斷地區及其他結構差異程度也存在這樣的問題。
1.采用幾何平均數的加權形式完善綜合指數的計算分析。由于其絕對數和相對數分析結果可能所產生的矛盾,本文引入幾何平均數概念對同度量因素的綜合指數編制進行完善,即在編制質量指標指數時,以基期和報告期數量指標的幾何平均數作為同度量因素,而在編制數量指標時,以基期和報告期質量指標的幾何平均數作為同度量因素。由于對于同一組數據,幾何平均數介于算術平均數和調和平均數之間,其取值處于相加性結構指數之間,所以一般情況下采用幾何平均數的加權形式會更加合理并符合實際。根據這一思路仍以表1數據計算可以得出:

結果顯示:無論是相對數還是絕對數有IP 2.結合運用中位數或者眾數等改善可變結構指數的計算分析。針對根據表2計算得出的全社會平均工資指數均低于非私營和私營平均工資指數這一原因,主要是由于職工結構發生較大變化。其實,在平均數集合中,還有調和平均數、幾何平均數、中位數、眾數以及平方均數等,如果計算平均工資能夠結合運用中位數或者眾數,或者像一些比賽評分中去掉高分組和低分組,那么計算得出總體指數均高于或者低于分結構指數這樣的情況就不太會出現,平均數更有代表性,指數變動也更加反映實際,老百姓也更容易接受。 3.結合發展水平指標改善不平等度指數的計算分析。以泰爾指數和基尼系數為代表的指數不僅可以衡量地區、行業、居民收入分配差距,在實際應用中還可以用來分析其他綜合性指標的分布發展程度(本文僅以基尼系數為例展開分析,其余不平等指數的分析方法同樣適用)。由于勞動工資統計數據的局限性,本文引入人均GDP基尼系數概念并結合人均GDP以評價浙江11個市的發展平衡程度。利用基尼系數的計算方法可以得到各市人均GDP基尼系數(詳見表4)。 表4 2014年各市人均GDP基尼系數 表5 2014年各市人均GDP單位:元 從表4分析看,11市發展的內部平衡程度有較大差異,其中,溫州、臺州的基尼系數較高,列全省第一和第二,表明溫臺地區內部發展不平衡的現象比較突出,而相對應的嘉興、湖州、舟山等地區內部發展比較均衡,人均GDP基尼系數均<0.1。表5顯示,人均GDP水平較高的是杭州、寧波等地,但溫州、麗水的人均GDP相對較低,最高的杭州是最低溫州的2.2倍。表4、5比較后可以看出,各地人均GDP水平和基尼系數的數值排序并不是同步的。但溫州市兩個指數的排序是一致的,是否具有特殊性,需要進一步研究。 根據浙江省提出“翻四番”的目標將人均GDP目標值設定為10.4萬元,權數為0.7;基尼系數目標值設定為0.15,權數為0.3(由于權數對水平測算會產生一定的影響,因此權數的設定需要在實際操作中不斷論證完善)。根據表4、5的數據計算得到用人均GDP和人均GDP基尼系數兩指標結合的各市發展均衡水平。 表6 2014年各市發展均衡水平 表6比較客觀反映了11市的發展均衡水平,隨著我國國民經濟核算體系的不斷完善,GDP數據更趨全面準確,以不平等度指數結合平均水平來判別地區發展均衡水平不失為一個行之有效的方法。 (責任編輯:牛域寧)

