基尼系數的一種新的經驗測算公式與實證

2012-03-12 06:03:30郭秀榮

統計與決策 2012年16期

郭秀榮

（重慶大學數學與統計學院，重慶 401331）

0 引言

早在2000年國家統計局就公布了當年的基尼系數為0.412，十多年了，現在的數字怎樣了呢？帶著這個疑問，我們通過官方中國統計年鑒公布的數字，試圖理出一個基尼系數的走勢圖來。

關于基尼系數的文獻眾多，國內也有不少的研究。意大利統計學家C.Gini[1]在其1912年發表的Variabilità e Mutabilità一書中,首次提出了一種不均等指數及其計算方法。但直到8年以后才引起國際學術界的廣泛重視。英國收入分配專家H.Dalton在1920年的《收入不均等的測量》一文中首次在英文文獻中介紹Gini的不均等指數,并把它稱之為平均差(mean difference)指數,而且認為該指數可以用來研究收入分配問題。從此以后,Gini的不均等指數逐步受到更多人的重視,并被后人稱為基尼系數。

基尼還從數學上論證了基尼系數與洛倫茲曲線的幾何含義是一致的(Dalton[2],1920)。基尼系數的原始計算公式如下:

計算公式如下[3][4]:

對有限樣本的問題，這兩個公式已經再明白不過了，只要獲得一國所有公民的收入數據，是不難直接算出Gini系數的。但這樣一來，完整的數據獲取不宜，二來如果要動態的監測Gini系數，就有必要進行抽樣或者在其他已經獲得的分層數據中進行估算。如果估算才能盡可能的反映真實的Gini系數，成為今天學術界關注的一個焦點問題，重慶市近年來提出在努力提高GDP的前提下，重點控制好Gini系數，并把Gini系數作為城市經濟發展的重要指標進行定期監測，這又提出了如果適時動態的根據抽樣或分層數據計算Gini系數的問題。

我國對國民的收入統計分農村和城鎮居民分別統計，因此只能分別計算出各自的基尼系數，好在R.M.Sundrum在文獻[5]中提出分類計算基尼系數的如下公式：

其中，G1和G2分別表示基于農村居民和城鎮居民的Gini系數；P1和P2分別表示農村居民和城鎮居民占總人口的比例；μ，μ1和μ2分別為全體居民的人均收入，農村居民人均收入和城鎮居民人均收入。這樣只要能分別得到城鎮居民和農村人口的分類基尼系數，不難獲得我國的基尼系數。

1 數據的整理與分析

表1和表2是歷年來中國統計年鑒公布的相關數據。

從表中可以看出最高收入的10%城鎮人口2000年占比不過20.5，約1/5強，到2009年已經占到25.4，超過1/4了，財富有向富人集聚的明顯趨勢。2011年以來，由于創業板和中小板的瘋狂造富運動，財富進一步向富人集中的趨勢在加快。

相對而言，農村居民收入各個層次變化不甚明顯。但20%的富人占有40%以上的財富無論農村還是城鎮都是一樣的。

國家統計局局長馬建堂直言不諱的指出，高收入者目前還缺乏好的統計辦法，因此目前的統計數字應該還有較大的誤差，灰色收入很難統計。同樣，對于絕對貧困人口，如城鎮5%的困難戶，農村20%的最低收入者，也存在統計口徑問題。筆者通過大學申請補助的貧困生填寫的家庭收入情況登記表統計的結果是占大學生1/3的學生家庭2009年平均家庭人均收入僅2739元，遠低于公布的統計數字。而2011年這個數字下降到2456元，可見與富人收入越來越多相對照的是窮人的收入仍在下降，如果沒有獎學金等保障措施，供孩子讀書越來越不容易。

表1 城鎮居民平均每人全部年收入

表2 農村居民平均每人總收入

表3 城鎮居民逐年累計人口各個百分點上的累計收入對照表

表4 農村居民逐年累計人口各個百分點上的累計收入對照表

2 一種新的基尼系數經驗測算公式

由于數據的原因我們無法通過公式（1）、（2）計算基尼系數。下面討論如何根據洛侖茲曲線計算歷年城鎮居民和農村居民的Gini系數。

顯然不能簡單的進行曲線擬合，考慮到人口比例和收入的現實情況，和最高收入比較，大部分人收入相對較低，因此曲線應該在開始階段走勢比較平緩，進入高收入區后應該相對陡峭，我們發現中心在縱軸正半軸上的橢圓曲線就很合適，也就是如下的模型：

剩下的問題是如何估計參數a和b以及檢驗模型的顯著性了，利用R軟件編制程序如下：

獲得的結果如下：

模型的檢驗是顯著的，我們由此得到2000年的洛侖茲曲線方程為：

下面的R程序可以畫出2000年城鎮居民收入累計洛侖茲曲線圖（圖1、2分別是2000～2009歷年城鎮居民收入的洛侖茲圖）。

圖1 2000年城鎮居民收入累計洛侖茲曲線圖

圖2 城鎮居民歷年收入累計洛侖茲曲線圖

plot(x,z0,type="l",main="2000年城鎮居民收入累計洛侖茲曲線圖",xlab="人口累計率",ylab="收入累計率")

這樣我們就能方便的計算出2000年的基尼系數，程序如下：

計算結果為0.3225478 with absolute error＜0.00012，從而基尼系數為1-2*0.3225478=0.3549，同樣使用模型（4）可以其他年份城鎮居民的基尼系數和農村居民的基尼系數，列入表5、6。

表5 城鎮居民各年度基尼系數

表6 農村居民各年度基尼系數

由于農村基尼系數缺了2000和2010年的，我們通過時間序列的自回歸模型AR（4）進行內插，R程序如下：

運行結果為：

由此得到預測模型為：

下面根據公式（3）來計算全國的基尼系數，對于農村居民收入，我們建議選擇純收入，而不是總收入，這與城鎮的收入具有可比性，計算均列入表5。

表5 全國居民收入基尼系數計算表

3 結論

本文的結論表明，根據我們的經驗測算公式獲得的全國基尼系數比較符合實際。我國僅僅在2000年公布過基尼系數，是0.412，而我們估計的結果是0.413，而到2009年，基尼系數已經是0.49了，這也與大多數學者的預測相符，相信2010和2011全國的基尼系數過0.5沒有懸念，這只需要把中國統計年鑒公布的相關數據帶入本文介紹的經驗測算公式就可以算出來，見表6。

表6 全國各年基尼系數一覽表

[1]C.Gini.Variabilità e Mutabilità,Bologna:Tipografia di Paolo Cuppini [Z].1912.

[2]H.Dalton.Measurement of the Inequality of Income[J].Economic Jour?nal,1920,(30).

[3]A.Sen.On Economic Inequality,Expanded Edition[M].Oxford:Oxford University Press,1997.

[4]D.G.Champernowne,F.A.Cowell.Economic Inequality and Income Distribution[M].Cambridge:Cambridge University Press,1998.

[5]R.M.Sundrum.Income Distribution in Less Developed Countries,First Published by Routledge[M].New York:Chapman and Hall,l990.