韓秀蘭,張 楠
(山西財經大學 統計學院,太原 030006)
不平等指數作為不平等測度的重要方法,相關研究十分豐富。自Gini(1914)提出基尼系數后,眾多學者構造了一系列新指數來測度不平等,這些指數主要包括Bonferroni指數(1930)[1]、Vergottini指數(1940)[2]、Atkinson 指 數(1970)[3]、泰爾指數(1973)[4]以及Zenga指數(2007)[5]等。
不平等指標如果具有較優良的特性,就能以更好的方式來測量不平等。目前,一些具有較優良特性的不平等指標并沒有得到應有的重視。比如堪培拉(Canberra)指數,該指數基于堪培拉距離衡量不平等,其良好性能由Subramanian(2012)[6]在測度洛倫茨曲線間的混亂程度時首次闡釋,國外文獻有許多相關的理論探討和實證應用,但堪培拉指數在中國尚未引起人們的關注。本文將堪培拉指數與傳統的基尼系數進行比較,系統地探討堪培拉指數對不平等的度量。
為了以較統一的方式給出不平等指數的數學表達式,有必要首先對基本符號進行定義。
非負、升序排列的n維收入向量:x=(x1…xi…xn);
收入升序排列的前i個人的累積人口比例:pi=i/n;
前i個人的累積收入:時,累積收入為總收入T(x);
前i個人的累積收入比例:L(Pi)=Qi(x)/T(x);
前i個人的平均收入:μi=Qi(x)/i;
總平均收入:μ=T(x)/n。
堪培拉(Canberra)指數是國際上最新的不平等測度指標,是將堪培拉距離函數引入經濟和社會領域來測度不平等。n維向量a和b間堪培拉距離的定義為:

對于升序排列的n維非負收入向量x=(x1…xi…xn),平等分配時每個人的收入都相同,相應的收入向量為μx=(μ1…μi…μn),μi=μ,Subramanian(2012)[6]基于堪培拉距離函數構造的不平等指數稱為堪培拉指數:

顯然,堪培拉指數是收入升序排列的前i個人的平均收入與總體平均收入之間相對差距的平均值。Subramanian(2012)[6]將DC(x)=[μ-μi(x)]/[μ+μi(x)],x∈[0,μ]定義為堪培拉剝奪函數,Mirzaei等(2017)[7]進一步將堪培拉剝奪函數定義為堪培拉曲線(見圖1):


圖1堪培拉曲線
如果總體中所有個體具有相同的收入,則μ=μi、p=L(p),堪培拉曲線與連接坐標點(0,0)、(1,0)的平等線重合,因此,堪培拉指數可定義為堪培拉曲線以下的面積:

顯然,堪培拉指數的值域為[0,1]。
基尼系數是應用最廣泛的傳統不平等指標,其定義基于洛倫茲曲線函數L(p),該函數指收入升序排列后一定人口累積分位數所對應的收入累積分位數(見圖2),可表示為:


圖2洛倫茲曲線
洛倫茨曲線始終低于代表完全平等的對角線(圖中450線)I(p)=p,p∈[0,1],任何與對角線之間的偏差都代表存在一定程度的不平等,因此基尼系數可表示為:

可以看出,式(6)所示的基尼系數也是基于某種意義的距離來表示不平等,該距離是對角線I(p)=p和洛倫茨曲線L(p)之間的距離。基尼系數的值域為[0,1]。
堪培拉指數與基尼系數的提出雖然相隔一個世紀之久,卻有諸多相似之處,兩指數都體現“距離”的概念,存在相應的不平等曲線,具有相似的幾何意義。由于兩指數的構造思想不同,對不同收入群體的敏感性不同,導致滿足的公理化要求和相應的分解方式也有所區別。
對比堪培拉指數的積分表達式(4)與基尼系數的積分表達式(6),如果收入完全平等分配,所有人口累積分位數等于對應的收入累積分位數,即p=L(p),則有C=G=0;通常情況下堪培拉指數和基尼系數的值都大于0,但兩者不相等。
將式(2)的堪培拉指數加和形式進一步展開,堪培拉指數還可表示為:

Sen(1973)[8]將基尼系數表示為:

將式(7)和式(8)對比可知,對于每個i=1,…,n,收入水平xi重復n+1-i次,收入最低的xi重復了n次,收入最高的xn重復了1次。堪培拉指數和基尼系數都體現出一種特殊的隨著收入排名的提高而觀測值出現次數遞減的布局結構,由于兩者構造的方法不同,考慮的收入差異對比的標準不同,盡管具有相似的布局結構,兩者對升序排列的不同累積分位數群體的收入差異敏感度仍然不同。
為了對比分析,將式(4)所示的堪培拉指數與式(6)所示的基尼系數統一變換為:

與基尼系數一樣,堪培拉指數的核心部分也是p-L(p),如前文所述,這部分是完全平等分配累積收入份額p與實際累積收入份額L(p)的差額,兩種指數賦予該差額以不同的權重,基尼系數中的權重wG(p)為常數2,而堪培拉指數中的權重wC(p)=1/[p+L(p)]隨著累積收入分位數的上升而遞減。基尼系數和堪培拉指數權重的這種差異意味著前者對累積收入分位數中部的收入差距比較敏感,而后者對累積收入分位數低處的收入差距比較敏感。
不平等度量指標需要滿足某些公理化要求,以保證其良好的測量性質,這些公理如表1所示。

表1 不平等測度指數的性質
不平等度量指標通常滿足的公理越多(兩種不平等測度指數所滿足性質的證明過程有大量的文獻對此關注,鑒于篇幅限制,本文將其略去),越能得到較廣泛的認可。堪培拉指數滿足表中所有的公理:齊次性、弱轉移性、強轉移性、人口對稱性和可加性,而基尼系數不滿足強轉移公理。另外,兩種指數雖然都滿足可加性,但堪培拉指數的分解更簡潔,解釋能力更強。
基尼系數和洛倫茲曲線的組合可以用直觀的形式來表達不平等,作為最經典的不平等測度方式,具有很強的理論和實際意義。然而,基尼系數對低收入群體沒有給予足夠的重視,不滿足強轉移公理要求,這也是基尼系數存在的較大缺陷。因此,滿足強轉移原則的堪培拉指數更應作為測度不平等的重要工具,以表達更多關注窮人的福利思想。
不平等指數的可加性可用于揭示不平等的構成,所得結論具有更直接的政策指導意義,堪培拉指數指數和基尼系數的構造不同,具有不同的分解方式,本文以不平等的人口構成子組分解為例進行對比。
設總體可根據一定的特征(比如性別、城鄉、地域等特征)分為k個子組,Subramanian(2012)[6]通過建立子組和總體間的映射,將堪培拉指數按子組分解為:

其中fg表示各子組人口份額,/(μ+μgi)為各子組的堪培拉指數,其中ng為各子組的個體數,μgi為各子組與總體相對應的前i個人收入平均值。顯然,堪培拉總不平等測度是子組不平等測度的加權和,相應權重是各子組對應的人口份額。
Dagum(1997)[9]給出以下基尼系數的分解公式:

上面方程中,fg和sg分別為g組人口份額和收入份額。方程(13)測量子組間存在的不平等,表示為任意兩子組間基尼系數Glg=Δlg/(μl+μg)與其人口比重和收入比重的加權和,為任意兩組間的平均絕對差異;方程(14)是組內不平等,組間不平等GTB又可進一步表示為組間不平等的凈貢獻GNB和組間交叉項GC之和:

可見,由于兩種指數的構造方法不同,分解方式也不同,相比之下,基尼系數子組分解顯得過于復雜,并且相應的分解除了組內不平等和組間凈不平等外,存在組間交叉項等難以解釋的余項,而堪培拉指數可直接分解為各組不平等指數的加權和,更簡潔明了。
應用實際微觀數據對堪培拉指數和基尼系數進行實證可以更好地理解堪培拉指數的優勢。本文實證所用微觀數據為CFPS數據①CFPS為北京大學中國社會科學調查中心實施的中國家庭追蹤調查。,該數據覆蓋全國,專注于中國居民家庭的經濟與非經濟福利指標,該調查于2010年正式啟動,最新數據可提供至2014年,家庭收入數據的調查是針對上一年度的。
本文對2010年和2014年家庭人均純收入的不平等進行分析,所有數據采用2010年價格進行了可比折算。CFPS在2010年和2014年提供的家戶樣本數分別為14798和13946②為了增加對Canberra不平等指數測度方法理解的直觀性,本文實證沒有考慮CFPS數據的樣本權重。,排除了缺少實證所需相關信息的樣本,兩年的最終家戶樣本量分別為13902和12917③統計軟件計算不平等指數時不考慮0收入數據,而0收入家庭又大量存在,直接刪除該樣本會造成估計的偏差,本文以0.00001代替所有的0收入,保證了樣本數,又不至于影響估計結果。,農村樣本約占到52%。中國家庭的人均純收入4年間經歷了較大幅度的增長,絕對水平從10137元上升到14066元(見表2),保持了8.5%以上的年均增長率。但收入增長的不平衡性是存在的,家庭人均純收入的平均值遠高于中位數,考察的每個年份,收入分布都表現出較明顯的右偏性。

表2 中國家庭人均純收入基本描述統計和不平等測度 (單位:元)
首先對比度量值的絕對水平。2009年和2013年,中國家庭人均收入基尼系數值分別為0.5513和0.5272④本文基尼系數測度實證時沒有考慮樣本權重,而且包含0收入家庭,這可能導致不平等測度結果偏大。,堪培拉指數值分別為0.5615和0.5555,兩者的測度水平值雖有所差別,但變化的趨勢是一致的,兩者均表明在2009—2013年間中國家庭人均收入存在較高程度的不平等,但兩種不平等測度值都有所下降。
從動態角度看,兩種曲線揭示出不平等演變的不同細節。兩個年份的洛倫茨曲線(見下頁圖3)在0<p<0.48范圍的低收入部分幾乎重合,位于0.48<p<1范圍內的洛倫茨曲線明顯上移,可以得出,總不平等的下降主要歸因于較高收入群體的收入與平均收入的差距縮小引起的不平等下降;堪培拉曲線顯示了不同于倫茨曲線的細節特征。堪培拉曲線(見下頁圖4)顯示,2009—2013年,位于0.48<p<1范圍的較高收入群體的堪培拉曲線明顯下移,意味著不平等程度的降低,而位于0<p<0.48范圍內的較低收入群體的堪培拉曲線卻發生明顯的上移,意味著不平等程度的上升,較高收入群體的不平等降低略高于較低收入群體的不平等上升導致了堪培拉指數值度量的總體不平等程度下降。對于中國家庭人均純收入總體不平等在2009—2013年間的這種動態演變特征:總體不平等程度有所下降,但低收入群體狀況更加惡化,不同群體的細節特征在洛倫茨曲線中難以觀察到,但在堪培拉曲線中卻包含了更多的信息,因此,與洛倫茨曲線相比,堪培拉曲線更加關注較低收入群體,與基尼系數相比,堪培拉指數提供了有關不平等動態演變的更多細節。

圖3中國家庭人均純收入樣本洛倫茨曲線

圖4中國家庭人均純收入樣本堪培拉曲線
為簡單起見,根據2014年的CFPS數據,本文將總體劃分為城市和鄉村兩個子組,用于不平等的子組分解研究。堪培拉指數子組分解沒有組間的交叉項,相應分解結果顯得簡單明了。城市家庭人均純收入堪培拉指數小于農村,考慮城鄉人口份額后,城市和農村不平等對總不平等的貢獻率分別為46%和54%(見表3)。

表3 2013年中國家庭人均純收入堪培拉指數的城鄉不平等樣本分解結果
與堪培拉指數的城鄉不平等加和分解相比,基尼系數的分解過于復雜。城市的基尼系數略低于農村,城市和農村組內不平等、組間凈不平等和組間交叉項對總不平等的貢獻分別為47%、28%和25%(見表4),基尼系數城鄉分解過程中城鄉間交叉項的存在導致基尼系數不能簡單表示為城市和農村不平等的加權和形式。
另外,堪培拉指數度量的城鄉間不平等具有很大的差別,而基尼系數的城鄉差異微乎其微,這是由于堪培拉指數對較低收入群體的收入差異更為敏感。如果社會中的弱勢群體更應值得關注,基尼系數有可能低估組間不平等差異。

表4 2013年中國家庭人均純收入基尼系數的城鄉不平等樣本分解結果
與基尼系數相比,堪培拉指數的特性更優異,主要是因為它滿足強轉移公理要求,更適合分析較低收入群體的不平等現狀和相關政策效應;與洛倫茨曲線相比,堪培拉曲線可以展現關于不平等動態演化的更多細節,而基尼系數則有可能低估組間的不平等差異。
不平等的測度是度量社會公平性的重要參照,當前世界分化動蕩加劇,貧富差距進一步加大,而基尼系數并不能充分體現這種社會分化。對中國而言,減少貧困和緩解不平等是當前社會和經濟發展的重要戰略目標,減少不平等的相關政策應該更多地關注低收入群體,而我國現有不平等方面的測度及相關的政策效應研究大都以基尼系數為參照,盡管堪培拉指數在國際上得到廣泛認可,但在我國卻很少得到關注。應該與國際接軌,結合中國實際,選擇性質更優良、對低福利群體更敏感、能揭示不平等動態演變更多細節、能合理體現子組間不平等差異的堪培拉指數作為不平等統計測度的重要方法工具。