王 平 王 芳
中圖分類號:F234.2 文獻標識碼:A
內容摘要:據國家統計局公布的數據,2006年我國在崗職工年平均工資為21001元。年均遞增12%,是改革開放以來我國職工實際工資收入水平增長最快的時期。這條正面新聞卻引發了激烈爭論。本文從統計學的角度探討了產生這場爭論的原因,即在運用平均指標進行分析時應注意的幾個問題,并給出了解決方法。
關鍵詞:平均工資 算術平均數 中位數 組平均數
據悉,2002年,我國在崗職工年平均工資為12422元,到2006年達到21001元。扣除價格上漲因素,年均遞增12%,比同期人均國內生產總值年均遞增9.2%高2.8個百分點,是改革開放以來我國職工實際工資收入水平增長最快的時期(中國新聞網消息7月2日)。這一消息卻引發了激烈爭論。
從各大門戶網站的留言看,幾乎所有的網友都對這條新聞有置疑,有人認為這是“真實的謊言”,有人認為這是“不漲反降”,也有人質疑“是不是又在放衛星”。《人民日報》的人民論壇雜志就職工對當前工資的滿意度進行了一項調查,調查結果顯示:對當前工資狀況不滿意的人達96.5%。為什么民眾感覺卻與此統計結果反差如此之大呢?原因就在于“職工工資總額和職工平均工資”的增長,并不一定意味著大多數普通職工實際收入的增長,反而有可能意味著他們相對收入的下降。也就是說在這里國家統計局單純用“平均工資”這個算術平均數來反映全體勞動者的工資水平是不合適的,或者說計算“平均工資”的方法是不適合的,因此出現了上面所說的爭議。本文擬以“平均工資”為例討論在運用平均數時應注意的幾個問題。
總體的同質性是運用平均指標的基本前提
平均數又稱平均指標,是社會經濟統計中廣泛使用的一種綜合指標。它反映同類社會經濟現象在一定時間、地點、條件下的一般水平。平均數按計算方法不同又可分為數值平均數和位置平均數,其中數值平均數又分為算術平均數、調和平均數和幾何平均數;而位置平均數又包括眾數和中位數。平均分析是利用上述平均指標來研究總體各單位的共性,并以此來反映現象的一般水平。只有當總體各單位在被研究的標志上具有同類性,才能使所計算出來的平均指標正確反映總體單位的共同特征,具有代表性。如果將不同質的總體單位硬攪在一起計算平均指標,就會抹煞其本質差別。例如本文提到的平均工資的統計結果和老百姓的感覺反差很大,其中的一個原因就在于計算平均工資的這個總體不具備同質性,因此掩蓋不了同類型人員收入的差異性,造成“虛構的平均數”。
按照我國職工工資統計相關規定,工資統計的對象,是全民所有制和集體所有制企業、事業單位,各種合營單位,各級國家機關、黨政機關和社會團體等“體制內人員”,而外來務工者、以及在民營企業等新型經濟組織的職工這些低收入群體則沒有資格參與統計。而在以上參與統計的總體中,行業與行業之間、行業內部員工之間的收入差距明顯,據統計,目前我國的電力、電信、石油、金融、保險、水電氣供應、煙草等行業共有職工833萬人,不到全國職工人數的8%,但工資和工資外收入總額估算卻相當于全國職工工資總額的55%。由于單位的經濟類型、隸屬關系等多種因素影響,行業內部也存在較大差異。如工資水平較高的銀行業,高的單位年平均工資超過百萬元,低的單位年平均工資在4萬元以下。
對于這樣一個非同質總體,很顯然用“平均工資”這一個指標來反映總體水平,其代表性可想而知。而且據發改委的報告,目前我國居民收入狀況不僅既有的差距懸殊,而且這種懸殊還在繼續全面地擴大—不僅城鄉之間在擴大,城鎮和農村內部也在擴大,不僅行業之間在擴大,地區之間同樣在擴大……這種背景下,抹平、雜糅了如此之多差距的“平均工資”,究竟能見證多少均衡價值。
算術平均數易受極端值的影響
目前我國的“平均工資”,“平均住房面積等平均指標都是采用的算術平均數來計算的。算術平均數等于總體標志總量除以總體單位總量,也就是對總體的某個標志計算算術平均時,把所有標志值相加,然后再除以標志值個數,根據資料是否分組,又分為簡單算術平均和加權算術平均。很顯然,根據以上計算公式,每個標志值的大小都對算術平均數的大小有影響,這時總體中如果出現極大值,將會使算術平均數偏大,而極小值將會使算術平均數偏小,從而掩蓋總體的真實水平。這一點其實也是總體同質性的一個具體體現。

而我國“平均工資”的計算也存在這個問題,例如差點導致中行油破產的陳久霖,年薪是2350萬元,就算他下面的工人一分工資也沒有,這家企業的的工資總額和平均工資也高的驚人。如果從這個角度理解,上面所提到的“職工工資總額和平均工資連續兩位數增長”,很可能意味著極少數人工資的迅猛增長,多數人的工資處于停滯狀態。
實際操作時如何避免極端值對算術平均數的影響呢?有兩個辦法,其一在計算算術平均數時先去掉極端值,再求平均。這種方法在平時各種比賽評分時經常采用,如去掉一個最高分,去掉一個最低分,再算最后平均得分。而在計算我國平均工資時如何確定極端值,也存在這一問題,因此可以考慮第二種方法。我們經常用的平均指標有三個:算術平均數、眾數和中位數。眾數是總體中出現次數最多的標志值,而中位數是把總體標志值按照大小順序排列后處在中間位置的數,因此它不易受極端值的影響,當總體出現極端值時,用中位數能比較真實地反映總體的一般水平。所以我們可以考慮用計算中位數的方法來計算“平均工資”、“平均房價”等易出現極端值的指標。實際上國際上統計方法比較先進的國家像美國都是采用中位數來反映平均工資,而在我國的一些省市如上海在公布各行業的平均工資時,也都是采用中位數,這樣它能避免平均工資虛增,從而更客觀地反映工資的一般水平。
用組平均數補充說明總平均數
總平均數雖然是以同質總體為基礎計算的,但在總體單位之間還存在很大的差別,并對總平均數有重要的影響作用。特別對于分組資料而言,總體平均數除了受各個標志值影響之外,還受各組相對次數也就是總體結構的影響,在總體各個標志值不變的情況下,如果總體的結構發生變化,總體的平均數也要隨之變化。因此在用算術平均數反映總體一般水平時,除了計算總平均數外,還應進一步利用分組法,計算組平均數,來補充說明總平均數,揭示現象內部結構對總平均指標的影響。現以表1資料為例來說明。
從上述資料可以看出,全部工人的平均工資2003年為3500元,2002年為3460元,2003年比2002年增加了4元,能否斷定工人的工資水平提高了呢?
從各組工人的工資水平來看,技術工人和非技術工人的平均工資都有所下降,分別由5500元下降到5000元、3100元下降到3000元。那么,為什么總平均工資反而上升了呢?
發生這種矛盾現象的原因是2003年工人的構成發生了變化,工資水平較高的技術工人所占比重從2002年的15%上升到25%,而工資水平較低的非技術工人所占比重則從85%下降到75%,總體工資水平將工人的構成情況掩蓋了。由此可見,現象內部的結構變化對總平均數的影響很大,僅僅用總平均數說明問題是不夠的,需要用組平均數來補充說明總平均數。因此在計算“平均工資”時,除了計算總體平均工資外,能否依照表1,把總體按照行業分組,分別計算各行業的平均工資并和前一年或前幾年對比,這樣員工才能更加清楚自己所在行業的工資水平,從而也可避免這場爭論。
把平均指標和標志變異指標結合起來使用
利用平均指標進行分析問題,抽象了總體各單位某一數量標志值的具體差異,來反映這些標志值的一般水平。但平均指標只能反映總體某一方面的共性,而不能反映總體各單位之間的個性。僅僅用平均指標來反映總體的綜合特征是不全面的,我們還可以利用標志變異指標來說明總體各單位某一數量標志值之間差異程度,即說明變量值的離散趨勢。另外利用標志變異指標進行變異分析,還可以說明平均指標的代表性。平均指標作為總體單位數量標志的代表值,其代表性的大小取決于該總體中各總體單位標志值之間的差異程度,這種差異程度是由標志變異指標來反映的。標志變異指標值指標大,說明總體各單位標志值之間的差異程度也比較大,平均數的代表性就小;反之,標志變異指標值小,說明各標志值之間的差異性也比較小,平均數的代表性就大。而在不同總體之間進行比較時,除了用平均數比較他們的一般水平外,在平均數不同的情況下還應計算標準差系數比較他們的代表性問題。
而由于我國居民收入的差距很大,且還在不斷加大,因此算出來的平均數的代表性肯定不強,不能代表總體的一般水平。據北京市統計局統計,2006年北京市職工年平均工資為36097元,全市職工平均工資達到36097元及以上的職工人數比重為39.3%,沒有達到職工平均工資的人數占60.7%,也就是說有6成人平均工資沒有“及格”。 在一個相對和諧的社會中,收入狀況應該是呈正態分布的(即中等收入人群應該占大多數,高、低收入人群則相對較少),這樣算出來的平均工資也就真正能代表總體的一般水平,而從目前我國的收入狀況來看,平均工資的代表性較小,員工對這種統計結果反映強烈也是應該的。
因此我們在計算總的平均工資時,還應計算標準差,以及標準差系數,以反映平均數的代表性,并且方便和其他國家比較。另外,我們在計算各行業的平均工資時,也應計算相應的標準差系數,以反映整個行業平均工資的代表性。
參考文獻:
1.夏劍鋒.統計學.武漢理工大學出版社,2005
2.韓選利.平均數想接受你不容易[J].統計與預測,2004(2)
3.藺心芝.試比較幾種統計平均數[J].中國科技信息,2005(5)
4.袁莉萍.統計平均數的應用誤區與對策研究[D].西安財經學院,2006