摘要:首先簡單介紹了基尼系數(shù)的一般計算方法,然后重點(diǎn)從冪函數(shù)的角度對洛倫茨曲線進(jìn)行計算、擬合及分析,推算此函數(shù)下的基尼系數(shù)計算公式,最后從函數(shù)角度對最佳基尼系數(shù)以及五分法的簡易公式進(jìn)行了分析和研究,并簡單探討了該函數(shù)的應(yīng)用價值。
關(guān)鍵詞:基尼系數(shù);洛倫茨曲線;冪函數(shù)
中圖分類號:F03文獻(xiàn)標(biāo)志碼:A文章編號:1673-291X(2010)13-0003-03
引言
基尼系數(shù)是意大利經(jīng)濟(jì)學(xué)家基尼于1912年提出的,用于定量測定收入分配差異程度,其經(jīng)濟(jì)含義是在全部居民收入中,用于進(jìn)行不平均分配的那部分收入占總收入的百分比。近年來,國內(nèi)不少學(xué)者對基尼系數(shù)的具體計算方法作了探索,提出了十多個不同的計算公式。在經(jīng)濟(jì)學(xué)中經(jīng)常使用的基尼系數(shù)的計算公式如下:G=1+YiPi-2QiYi,上式中,G代表基尼系數(shù),Yi代表第i組人口總收入占全部人口總收入的比例,Pi代表第i組人口數(shù)占全部人口總數(shù)的比重,Qi=Pi表示累計到第i組的人口總數(shù)占全部人口總數(shù)的比重。胡祖光教授提出的簡易公式更簡單,如果是把收入分成從低到高的五個組,G=P5-P1則可以用 來計算基尼系數(shù),他同時計算出基尼系數(shù)的理論最佳值為1/3。我們可以看到幾乎所有的有關(guān)基尼系數(shù)的計算研究都是以大量的離散經(jīng)濟(jì)數(shù)據(jù)為基礎(chǔ),并采用離散、分段、匯總的計算方法來分析基尼系數(shù)。而從社會經(jīng)濟(jì)、人口、收入數(shù)據(jù)的龐大規(guī)模來看,簡單劃分為有限個組段來計算基尼系數(shù)可能存在較大的誤差,描述人口收入分配差異情況的洛倫茨曲線應(yīng)該更符合連續(xù)函數(shù)的曲線特征。
一、基尼系數(shù)的函數(shù)表達(dá)分析
本文是從函數(shù)的角度來對洛倫茨曲線及基尼系數(shù)進(jìn)行計算和分析的,我們首先假設(shè)洛倫茨曲線是連續(xù)的、可導(dǎo)的,并能夠用y=xa,a≥1,x∈[0,1]這樣簡單的冪函數(shù)來表達(dá)的。事實(shí)上,我們根據(jù)大量的統(tǒng)計數(shù)據(jù),總是能夠找到適當(dāng)?shù)腶所形成的冪函數(shù)曲線來擬合所提供的數(shù)據(jù),且其擬合度或方差總是能夠達(dá)到足夠高的精度。
1.洛倫茨曲線的線性擬合。我們對一定區(qū)域收入分配狀況形成的洛倫茨曲線進(jìn)行函數(shù)的擬合,那么首先我們將有足夠多的數(shù)據(jù)來進(jìn)行計算,我們?nèi)?995年國際統(tǒng)計年鑒上的兩個國家的數(shù)據(jù)來進(jìn)行計算分析,該數(shù)據(jù)是按照收入從低到高劃分為人口相同的五組得到的(見表1)。
根據(jù)上表,我們可以繪制出兩條洛倫茨曲線(折線)(見圖1)。
我們現(xiàn)在就是要尋找適當(dāng)?shù)暮瘮?shù)y=xa來擬合中國及墨西哥1995年度的洛倫茨曲線(折線),由于任何一個y=xa,a≥1,都滿足x=0,y=0及x=1,y=1。所以我們就是要找出適當(dāng)?shù)腶使得該函數(shù)在中間的四點(diǎn)能夠盡量地擬合,也就是希望得到的函數(shù)在中間四個點(diǎn)上的擬合值與實(shí)際值的方差最小。我們可以將函數(shù)y=xa進(jìn)行簡單變換,兩邊取對數(shù),即ln y = aln x,如果用y′,x′分別代替ln y,ln x,則有y′=ax′,也就是說,通過簡單的數(shù)據(jù)變換,我們要進(jìn)行的就是一元線性的數(shù)據(jù)擬合。根據(jù)統(tǒng)計學(xué)的基本知識,在表格中將這些數(shù)據(jù)代入(注意,縱坐標(biāo)的值為百分比,計算時用小數(shù)代入)。根據(jù)以上的分析,分別采用中國及墨西哥的收入分配數(shù)據(jù)擬合該洛倫茨曲線。在EXCEL程序中應(yīng)用其數(shù)值分析功能,可以得出擬合結(jié)果(如表 2):
表2曲線擬合表
由于R都大于0.99,說明擬合優(yōu)度的效果好;同時F都大于200,說明擬合顯著性高;于是,我們可以分別用y=x1.910、y=x2.231來擬合或者說表達(dá)中國及墨西哥1995年度的(收入分配)洛倫茨曲線。
2.基尼系數(shù)的函數(shù)表達(dá)。通過上面的計算、擬合與分析,我們認(rèn)為收入分配曲線——洛倫茨曲線可以用簡單的冪函數(shù)y=xa來表達(dá)。本文主要以此函數(shù)為依據(jù)對基尼系數(shù)的相關(guān)性質(zhì)進(jìn)行計算分析(見圖2)。根據(jù)基尼系數(shù)的定義,我們可以計算:G===(xadx)/()=。
有了這個簡單的計算公式,根據(jù)有關(guān)規(guī)定,我們可以得到(社會)不同收入分配狀況相應(yīng)的函數(shù)冪值(見表3):
表3不同收入分配狀況的函數(shù)冪值
根據(jù)前面我們對中國及墨西哥1995年度的收入分配狀況的計算分析,參照基尼系數(shù)的函數(shù)公式,我們可以得到:G中國==0.313、G墨西哥==0.386;這是采用函數(shù)公式計算的結(jié)果。如果我們采用五分法計算的公式G=(4p5-4p1+2p4-2p2),則有G# 中國=0.386(統(tǒng)計年簽上給出的數(shù)據(jù)是0.415)①、G# 墨西哥=0.485(統(tǒng)計年簽上給出的數(shù)據(jù)是0.537)。從結(jié)果看,用原來擬合的結(jié)果與五分法計算結(jié)果差異還是比較大。
3.擬合函數(shù)的完善。前面以線性回歸擬合的函數(shù)其計算的基尼系數(shù)與五分法計算結(jié)果及統(tǒng)計年鑒給出的數(shù)據(jù)都有比較大的誤差,這說明這種方法擬合的冪函數(shù),可能還存在不足的地方,a的取值存在改善空間。事實(shí)上,當(dāng)冪函數(shù)進(jìn)行對數(shù)轉(zhuǎn)換后,用線性函數(shù)的回歸方法來擬合后其性態(tài)已經(jīng)與原冪函數(shù)不完全一致,而且線性回歸擬合有一個最基本的假設(shè)就是數(shù)據(jù)點(diǎn)相對于擬合直線呈正態(tài)分布,但實(shí)際情況可能并非如此。因此,我們要尋找的函數(shù)冪a應(yīng)要盡量使得擬合函數(shù)在高收入組的相似度越高越好(因為我們知道,正是由于高收入組所獲得收入所占的比例大才會引起基尼系數(shù)的明顯變化),更重要的是函數(shù)要滿足這樣的要求:即我們尋找的a要使得(y′i-y0i)2最小,這里的y′i,y0i分別是指對應(yīng)于中間四個統(tǒng)計點(diǎn)的擬合(估計)y值及初始的實(shí)際y值,而采用線性回歸擬合的參數(shù)未必能夠?qū)崿F(xiàn)這個目標(biāo)。從上面的計算分析我們可以看到,用該線性回歸分法所擬合的數(shù)據(jù)來計算基尼系數(shù)其結(jié)果要比實(shí)際值小,而且擬合值與實(shí)際值在高收入段的誤差比較大。而事實(shí)上,對中國數(shù)據(jù),當(dāng)a=1.910時,(y′i-y0i)2=0.0225;而如果我們?nèi)=2.1,則(y′i-y0i)2=0.0123;也就是a=2.1相對更優(yōu)。我們對中國數(shù)據(jù)進(jìn)行計算,要(y′i-y0i)2最小,就是要(0.2a-0.055)2+(0.4a-0.153)2+(0.6a-0.302)2+(0.8a-
0.525)2最小,對其求導(dǎo),并令等于0 ,即求解0.04aln0.04+0.16aln
0.16+0.36aln0.36+0.64aln0.64=0.11×0.2aln0.2+0.306×0.4aln
0.4+0.604×0.6aln0.6+1.05×0.8aln0.8。對這個方程,我們可以采取數(shù)值分析中的無限逼近原則,并借助EXCEL的計算功能來求解更恰當(dāng)?shù)膬缰礱,我們可以計算得到中國洛倫茨曲線的最佳擬合函數(shù)應(yīng)為y=x2.42,此時的(y′i-y0i)2=0.0066,基尼系數(shù)G==0.415, 與五分法數(shù)據(jù)接近,與統(tǒng)計年鑒給出的數(shù)據(jù)完全相等。同樣道理我們可以推算出墨西哥的最佳擬合函數(shù)為y=x3.32,其G==0.537,與五分法數(shù)據(jù)接近,與統(tǒng)計年鑒的數(shù)據(jù)相同。
通過上面的計算分析證明,無論是采用線性回歸還是采用方差最小并無限逼近的方法,我們總是能夠找到適當(dāng)?shù)膬绾瘮?shù)y=xa, a>1,去擬合反映社會收入分配狀況的洛倫茨曲線,擬合程度滿意,并且能夠得到相當(dāng)精確的符合程度很高的基尼系數(shù)。
圖3洛倫茨曲線示意圖2
二、最佳理論值的計算
基尼系數(shù)理論最佳值的計算需要基本的前提,那就是對于理想收入分配狀況的表達(dá)。一個社會的收入分配既不能太平均,那樣損失效率;分配也不能太懸殊,那樣有失公平。理想的情況是,一個社會有n個人,收入最低的那人其收入為a元,從此人開始,按收入從低到高排列,每個人比前一個人多一個單位的收入,即收入為a+1,a+2…a+n-1。為便于計算,也不影響計算的結(jié)果,我們這里令a=1;事實(shí)上,在實(shí)際的收入分配情況中,也并不能保證收入最小的那個組/成員就一定能夠?qū)崿F(xiàn)很大的最低保障a,因為還有不少國家和地區(qū)不能達(dá)到如此高的福利水平。不難發(fā)現(xiàn),從低到高將這n個成員的收入進(jìn)行排列、累加,收入總和為,第i個人所對應(yīng)的收入總和為,根據(jù)定義要求,把這些(累加的)排列轉(zhuǎn)換成X、Y軸最大值都為1的洛倫茨曲線,我們可以看到,X軸上劃分成為相等的n個部分,每個為1/n,第i個成員其橫坐標(biāo)為i/n,對應(yīng)的縱坐標(biāo)為(見圖3)。于是,如果我們令x=,那么y==×=×=×==x2+。顯然,當(dāng)n趨向于無窮大的時候,y=x2,也就是說在這種收入分配狀況下的洛倫茨曲線為函數(shù),y=x2,x∈[0,1]。很容易計算得到,此時的基尼系數(shù)為G===。亦即,基尼系數(shù)的理論最佳值為1/3。
三、簡單計算公式的分析
那么,用G=P5-P1這個簡單的公式來計算基尼系數(shù)是否準(zhǔn)確呢?我們這里取a=2,此時基尼系數(shù)為1/3,而用函數(shù)表達(dá)的洛倫茨曲線進(jìn)行分組計算時,我們要注意,并不是直接用該曲線的分組段落來積分,因為該曲線是各組數(shù)據(jù)(比例)低到高累加形成的曲線,而不是從低到高的各組數(shù)據(jù)(比例)本身。簡單地說,洛倫茨曲線上某組段所對應(yīng)的Y值之差就是該組段的數(shù)值(所占的比例),即P5=12-0.82=0.36,P1=0.22-02=0.04,則P5-P1=0.36-0.04=0.32略小于1/3,當(dāng)然這兩個值已經(jīng)非常的接近。事實(shí)上,我們可以進(jìn)行簡單的計算,來求解那個使得等式G=P5-P1成立的那個a。以上面的結(jié)果為基礎(chǔ),我們知道也就是求解方程:=1-0.8a-0.2a…(1),亦即(a+1)(0.8a+0.2a)=2…(2)。通過數(shù)值分析的計算方法,我們解得a=1,這是絕對平均的情況。而我們進(jìn)一步計算分析知道,當(dāng)1 結(jié)語 通過以上計算分析,我們得到了反映社會收入分配狀況的洛倫茨曲線可以用冪函數(shù)進(jìn)行擬合的結(jié)論,并將該方法的具體計算方法和基本性質(zhì)內(nèi)容進(jìn)行了闡述。基尼系數(shù)的函數(shù)表達(dá)具有廣泛的理論及實(shí)踐應(yīng)用,冪函數(shù)與基尼系數(shù)的簡單計算公式可以通過簡單的轉(zhuǎn)換方法應(yīng)用于數(shù)據(jù)的計算、擬合、檢驗以及各種離散計算方法的完善。通過該函數(shù),可以簡單計算出不同組類收入所占總收入的比例,也可以對分組分段方法的內(nèi)容予以解釋和分析。 參考文獻(xiàn): [1]胡祖光.基尼系數(shù)理論最佳值及其簡易計算公式研究[J].經(jīng)濟(jì)學(xué)研究,2004,(9). [2]王祖祥.分組數(shù)據(jù)條件下基尼系數(shù)的有效估算方法[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2001,(8). [3]雍紅月,等.基尼系數(shù)的計算方法與實(shí)證分析[J].內(nèi)蒙古大學(xué)學(xué)報,2007,(2). [4]習(xí)明,等.基尼系數(shù)的一種簡便計算方法[J].統(tǒng)計與決策,2007,(21). [5]杜洪波.統(tǒng)計年鑒與基尼系數(shù)[EB/OL].http://www.studa.net/shuxue/100201/13101984-2.html.