——基于有限混合模型的測算"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?周龍飛,樊雨欣
(復旦大學經濟學院,上海 200433)
經過四十余年的改革開放,中國的經濟發展取得了舉世矚目的成就。從總量上來看,中國的GDP自2010年開始就已經位居世界第二,2019年更是達到了99.09萬億元人民幣,約為美國同期GDP的68.33%。就增速而言,中國經濟始終保持中高速增長,位居世界前列,盡管近年來增速由兩位數下滑至6%左右,但仍遠高于同期全球的平均增長水平,是對世界經濟增長貢獻最大的國家。
與諸多國家的發展經驗類似,隨著早期經濟的快速發展,中國居民的收入水平開始出現分化,收入不平等程度有所增加。國家統計局曾公布過2003年—2016年全國居民人均可支配收入的基尼系數,數據顯示中國居民人均可支配收入在2008年達到峰值0.491,此后則逐步回落至2016年的0.465,但仍處于0.4-0.5這一代表收入差距較大的區間之內。緩解收入不平等問題一直以來也都是中國政府的重要政策目標之一,2002年,中共十六大首次提出“以共同富裕為目標,擴大中等收入者比重,提高低收入者收入水平”方針。2017年,中共十九大強調:“鼓勵勤勞守法致富,擴大中等收入群體,增加低收入者收入,調節過高收入,取締非法收入。”2019年,中共十九屆四中全會再次提出:“鼓勵勤勞致富,保護合法收入,增加低收入者收入,擴大中等收入群體,調節過高收入,清理規范隱性收入,取締非法收入。”
不難看出,增加低收入階層收入水平,擴大中等收入階層比重是上述調節居民收入分配政策的重要抓手,因而諸多研究往往也聚焦于中國不同收入階層特別是中等收入階層的收入水平、所占比重、各個收入階層之內或不同收入階層之間的收入不平等狀況,但這其中所涉及的一個關鍵問題就在于如何界定高、中、低收入階層。全國以及各省的統計年鑒每年均會依照人均可支配收入的高低將樣本家庭平均分為五組:低收入戶、中間偏下戶、中間收入戶、中間偏上戶、高收入戶,并公布每一組家庭的平均收入水平,但這種劃分方法并無法反映不同收入階層的規模及其演變趨勢。另一種常見的做法是研究者人為設定一個收入標準用以區分不同的收入階層,但該做法的不足之處在于缺乏統一的劃分規則,即使利用相同的數據,如果將劃分標準略作調整,都很有可能會得出不一樣的結論,因此在一定程度上存在根據預設結論來挑選劃分標準的可能。而且當我們希望進一步分析收入階層隨時間的變化情況時,理論上我們還需要對不同年份之間的劃分標準做出相應調整,但調整的過程很可能又會引入新的偏差。
針對現有劃分收入階層方法的不足,本文嘗試使用有限混合模型(finite mixture model,以下簡稱FMM模型)來區分不同的收入階層。FMM模型是一種行之有效的聚類模型,其最突出的特點在于可以對包含無法觀測的潛在類別變量的數據進行建模,無須人為設定劃分標準。即可將包含不同類別的樣本按照數據分布特征內生聚類為幾個子樣本,估計出各個子樣本占全部樣本的比重以及相關的特征參數。同時也可以推斷出每個樣本屬于不同類別的條件概率,而且FMM模型直接適用于各年數據,無須在不同年度之間進行調整(周龍飛和張軍,2019)。利用FMM模型自動聚類的特點,基于1986年—2009年中國18個省份的城鎮住戶調查數據(Urban Household Survey,以下簡稱UHS數據),雖然我們無法觀測到樣本中的每個家庭屬于哪一類收入階層,但可以計算出每個家庭屬于不同收入階層的概率,并依照概率的高低將其區分為高、中、低收入階層。在此基礎上,本文進一步采用了廣義熵指數中的對數偏差均值(MLD指數)及其分解方法,分析討論了1986年—2009年中國城鎮地區的收入不平等狀況,并將總體不平等按照不同收入階層分解為組內不均等和組間不均等,理清了高、中、低收入階層的不平等程度現狀及其對整體不平等程度的貢獻。
本文可能的貢獻在于:第一,本文創新性地引入了FMM模型對中國城鎮地區家庭進行收入階層劃分,依據家庭收入條件分布的相似性將不同家庭內生聚類為高、中、低收入階層,在一定程度上解決了現有研究中普遍存在的收入階層劃分標準不統一、難以在不同年份進行調整的問題。而基于分類后的家庭,本文進一步討論了不同地區的收入階層分布特征,以及各個收入階層之內以及不同收入階層之間的收入不均等。第二,本文所使用的UHS數據是一套非常難得且詳盡的微觀調查數據。在目前利用微觀數據來測算中國收入分配不平等的文獻中,大多數研究使用的是年份不連續或者時間跨度較短的數據。而UHS數據跨度時間長,調查可信度高,所含內容豐富,有助于我們了解在相當長的一段時期內中國城鎮地區各收入階層的變化趨勢以及不平等程度的演變情況。
本文的后續安排如下:第二部分是相關文獻綜述;第三部分詳細介紹了FMM模型以及用于衡量不平等程度的廣義熵指數;第四部分介紹了本文所使用的數據及其描述性統計;第五部分為具體的測算結果;最后一部分是本文的研究結論。
收入階層的劃分就是要將不同的個體區分為高、中、低三類收入階層,目前文獻中討論最多的是如何界定中等收入階層,并對此提出了不同的劃分方法1雖然很多文獻僅討論了中等收入階層的劃分方法,但劃分中等收入階層的上下限自然也劃分出了高收入階層與低收入階層。。第一種方法是絕對標準的劃分方法,即根據具體的收入金額來確定不同的收入階層。例如,國家統計局城調總隊課題組(2005)曾以世界銀行公布的中等收入國家標準(人均GDP處于3470美元—8000美元之間)為基礎,將其換算成人均收入,并經過匯率和購買力評價標準調整,指出中國中等收入階層的劃分標準應為家庭年均總收入在6萬元—50萬元之間。國家發改委社會發展研究所課題組(2010)在綜合考慮中國現階段的經濟發展水平、城鄉收入差距、城鎮化等各項因素后,參考世界銀行的劃分標準,認為調查當年中國的中等收入階層可定義為人均可支配收入在2.2萬元—6.5萬元之間的群體,并進一步計算出中國2010年中等收入階層占比約為21%,其中城鎮人口中中等收入階層的比重約為37%,而農村人口中中等收入階層的比重約為6%。李強和徐玲(2017)參考日本與韓國的歷史發展經驗,認為2015年中國的經濟發展水平與1987年的日本以及1996年的韓國非常類似,由此他們通過國際比較提出適合中國現階段收入水平的中等收入階層絕對收入標準應為“人均可支配收入2萬元—6.7萬元”,“人均年收入3.5萬元—12萬元”或者“家庭年收入6.9萬元—23.6萬元”。根據這一標準,他們測算了中國2012年和2013年的中等收入階層規模,發現無論使用哪一種標準,中國整體中等收入階層的規模都約為20%左右,同時城市中中等收入階層的規模要遠大于農村中中等收入階層的規模。
第二種方法是相對標準的劃分方法,即根據某一具體金額的上下浮動百分比來確定不同的收入階層。例如,李實(2017)在其關于中等收入階層的研究中,認為中等收入階層的典型特征是崗位穩定、收入處于中等或以上水平、生活相對寬裕,因此可以按照收入中位數劃定上下限,比如取中位數大小的60%作為中等收入階層的收入下限,取中位數水平的200%或300%作為中等收入階層的收入上限。由此,他測算后發現,2002年中國中等收入階層的占比為5%,2007年上升至14%,2013年則達到了24%。李培林和朱迪(2015)同樣主張使用相對標準來界定中等收入階層的劃分標準。他們將前10%最高收入家庭的人均年收入作為最高收入水平,將后10%最低收入家庭的人均年收入作為最低收入水平。在此基礎上,他們將中等收入階層的上限定義為最高收入水平與最低收入水平的平均值加上二者差距的45%,將中等收入階層的下限定義為最高收入水平與最低收入水平的平均值減去二者差距的25%。經過測算后他們發現,中國城鎮居民中的中等收入階層規模在2006年至2013年之間變動不大,基本維持在27%—28%左右。
其他學者對中國收入階層的定義和測算方法與上述文獻基本類似,在此不再一一列舉。總體來說,無論相對標準還是絕對標準,其標準的制定缺乏統一的規則,即使利用相同的數據,如果將劃分標準略作調整,都很有可能會得出不一樣的結論,因此存在根據預設結論來挑選劃分標準的可能。此外,也難以在不同年度之間進行調整,而且不一定能很好地適用于分析不同時期的數據。為此,本文在研究中引入了FMM模型,嘗試利用該模型能夠根據數據自動聚類分析的特點來對中國城鎮地區的收入階層進行劃分,在一定程度上克服了現有研究中的不足。
在目前相關文獻中,針對中國的收入不平等問題存在較多討論,這其中與本文關系最密切的一支文獻是關于收入不平等的測算與分解,我們將在這一部分對此進行歸納總結。收入不平等的測算指標大致可以分為兩類,第一類指標是體現社會福利規范的指標,阿特金森指數是其中最具典型性的一個代表。阿特金森指數在測算不平等的過程之中首先需要選擇一個社會福利函數,并以此計算出一個等值收入,使得當所有人的收入均為等值收入時社會的總福利與當前社會的福利水平一致。與此同時,我們還需要選擇一個不平等厭惡參數,用以反映社會對不平等的厭惡程度。在此基礎上,我們即可計算得到阿特金森指數,尤其需要說明的是,阿特金森指數的具體數值與社會福利函數與不平等厭惡參數的選擇密切相關。歐陽葵和王國成(2014)曾證明,在標準福利主義的假設下,如果社會福利函數滿足一定的條件,則必定存在一個相應的阿特金森指數。以此為基礎,他們依據納什、羅爾斯主義社會福利函數分別提出了納什—阿特金森指數以及羅爾斯主義阿特金森指數,并發現在1980年至2007年之間中國地區收入差距呈現長期擴大趨勢。
第二類指標則是刻畫收入分布數理特征的指標,文獻中使用最多的基尼系數、廣義熵指數(一般計算的是其特例泰爾T指數或者泰爾L指數2泰爾L指數也被成為MLD指數(平均對數離差)。)均屬于這一類指標。此類指標的本質都是在刻畫群體實際收入分布相對于絕對平等狀態時的偏離程度(祁磊和艾小青,2020)。就具體文獻而言,李實等學者利用1988年、1995年、2002年、2007年以及2013年的中國家庭收入調查數據(China Household Income Project,簡稱CHIP)測算出中國在上述各年的基尼系數分別為0.395、0.456、0.460、0.483以及0.433(趙人偉等,1999;Gustafsson et al.,2008;Li et al.,2013;李實等,2017)。Xie and Zhou(2014)利用各類微觀數據測算了2010年至2012年中國的基尼系數,發現中國的基尼系數在2010年以后仍然處于上升趨勢之中,其范圍大致位于0.53至0.611之間。胡晶晶和曾國安(2011)利用宏觀層面的人均可支配收入測算了1987年至2009年中國居民收入的廣義熵指數,發現居民之間的總體收入差距呈現出波動中長期上升的趨勢。
為了探究中國居民收入不平等的具體來源,諸多研究也對基尼系數、廣義熵指數等不平等指標在不同群體之間進行分解,目前文獻中的分解思路主要集中在兩個方面:第一種分解思路是在城鄉之間進行分解。例如,羅楚亮(2006,2017)利用CHIP數據,根據MLD指數的分解方法將中國的收入不平等分解為城鄉內部的組內收入不平等以及城鄉之間的組間收入不平等,其測算結果表明城鄉之間的組間收入不平等對中國整體收入不平等的解釋份額在1988年、1995年、2002年、2007年以及2013年分別為33%、37%、40%、46%以及35%。吳彬彬和李實(2018)則對2002年、2013年CHIP數據中的收入定義、樣本權重等方面進行了調整,他們同樣利用MLD指數的分解方法發現,2013年城鄉之間的組間收入不平等程度及其在整體收入不平等中的占比相較于2002年均有所下降,同時城鎮內部、農村內部的組內收入不平等程度及其在整體收入不平等中的占比在2013年則均有所提高。
第二種分解思路是在地區之間特別是在東、中、西部地區之間進行分解。馮星光和張曉靜(2005)利用泰爾T指數對中國1978年至2003年的收入不平等在地區之間進行了分解,他們的測算結果表明中國整體的收入不平等程度在此期間呈現先降后升的趨勢。進一步將其在地區間進行分解后發現,地區之間的組間不平等程度逐漸上升,并在1992年以后成為整體收入不平等的主導因素。與此同時,東、中、西部地區的組內不平等程度均逐漸下降,但東部地區的組內不平等程度始終高于其他地區。唐莉等(2006)則嘗試對中國城鎮的基尼系數進行分解,他們的分析結果表明,2003年中國城鎮居民收入不平等的近40%來自于各省之間的不平等,而各省之間的不平等又有近64%來自于東、中、西部地區之間的不平等。翟彬和童海濱(2012)則聚焦于中國農村居民的收入不平等問題。他們計算了1984年至2009年之間的泰爾T指數,并將其分解為東、中、西部之內的組內收入不平等以及各地區之間的組間收入不平等,他們發現中國農村居民的整體收入不平等程度在逐漸上升,其中地區之間的組間收入不平等一直以來都是農村居民整體收入不平等的最重要因素。
另外值得說明的是,廣義熵指數相較于基尼系數具有更好的可分解性,因為廣義熵指數可以完全分解為組內不平等和組間不平等兩個部分。而除了上述兩個部分之外,對基尼系數的分解還會存在一項重疊項。這主要代表了組間樣本排序后的每個變化排序變化對基尼系數計算的影響,并且在多數情況下重疊項都因為所占比重較大而不能被隨意忽略(李虎,2005;洪興建,2009;萬廣華,2009)。正是考慮到這一點,本文將使用廣義熵指數中的MLD指數來衡量中國城鎮地區的家庭收入不平等程度,而且不同于大部分文獻依照城鄉或者地區對收入不平等指標進行分解,本文在利用FMM模型將家庭劃分為高、中、低三類收入階層之后,會進一步將整體收入不平等分解為各個收入階層之內的組內收入不平等以及不同收入階層之間的組間收入不平等,從收入階層的視角來考察中國城鎮地區收入不平等的來源。
本文首先使用FMM模型來對中國城鎮地區的收入階層進行劃分,FMM最主要的特點在于可以對包含無法觀測的潛在類別變量的數據進行建模,能夠將存在異質性群體的樣本按照數據分布特征內生劃分為幾個子樣本,估計出各個子樣本占全部樣本的比重以及相關的特征參數。同時,也可以推斷出每個樣本屬于不同群體的條件概率。近年來,FMM模型開始越來越多地被國內學者廣泛運用于各類經濟學研究之中(薛欣欣和辛立國,2015;楊天宇和張令達,2018;周龍飛和張軍,2019;劉貫春等,2019;曹建民等,2019)。在本文中,我們利用FMM模型,依據各家庭收入的條件分布相似性將不同家庭內生聚類為低收入階層、中等收入階層和高收入階層三類群體,模型的具體設定如下。
假設在每年樣本之中共有N個家庭,以下標來表示其中的第i個家庭。我們可以將其劃分為3個不同的收入階層3理論上FMM模型可以將總體設定為任意數量的收入階層,我們依據BIC指標發現包含3類收入階層的FMM模型擬合效果最好,而且針對本文研究的問題,將總體樣本分為3個收入階層更具有實際意義,方便進行解讀。,不同收入階層的家庭人均收入滿足方程:

其中上標j=L,M,H分別表示低收入階層、中等收入階層、高收入階層。Yi表示家庭人均收入,Xi表示影響家庭人均收入的各項因素,包括人均受教育年限、家庭就業人口占比、家庭男性占比、就業人口人均工作年限、人均住房面積、單位性質、所在地區。為各項因素的回歸系數,誤差項假設滿足均值為0、標準差為的正態分布。

其中θ表示所有參數的集合。為了估計公式(2)所示的有限混合模型,首先假設存在表示每一個家庭屬于哪一類收入階層的啞變量ZL、ZM、ZH。由此我們可以將樣本中家庭人均收入方程的似然函數以及對數似然函數表示如下:

1.針對所有待估參數,首先隨機選取一組數值作為猜測的初始值θ(0)。
2.E步:在第t次迭代(t=1,2,3……)中,將上一次迭代過程中得到的參數估計值θ(t-1)作為已知參數,利用貝葉斯公式,并以觀測到的家庭人均收入、影響因素以及θ(t-1)為條件,計算出樣本中每一個家庭屬于各收入階層的條件概率的具體表達式如下:

3、M步:在第t次迭代(t=1,2,3……)中,將上一步中計算得到的條件概率作為虛擬變量的值,并利用公式(3)之中的對數似然函數計算出所有待估參數的極大似然估計量θ(t)。
4.將上述E步和M步兩個步驟不斷迭代,直到所有參數收斂,并由此得到最終的參數估計值θ*。
根據最終參數的估計結果,我們可以利用公式(4)來計算出樣本中每一個家庭屬于低收入階層、中等收入階層、高收入階層的概率,通過比較三個概率的大小,將樣本中每一個家庭歸入所屬概率最高的收入階層,我們即可完成對中國城鎮家庭收入階層的劃分。
在此基礎上,本文將使用廣義熵指數來衡量收入不平等,這是一個常用的用于測算不平等程度的指標,其取值范圍是在0—1之間,值越大表示收入分配越不平等。廣義熵指數的具體表達式如公式(5)所示:

其中,N表示樣本個數,yi表示樣本中第i個家庭的家庭人均收入,表示樣本中所有家庭人均收入的平均值。α可以在0—1之間取值,當α取值為0時,GE(0)又被稱為泰爾L指數或MLD(平均對數離差)指數,當α取值1,GE(1)又被稱為泰爾T指數。廣義熵指數具有良好的可分解性質,根據相關步驟,我們可以將總體收入不平等分解為不同群體內部的組內收入不平等與不同群體之間的組間不平等兩部分,并計算出各部分的收入不平等指數及其對總體收入不平等的貢獻程度。
本文使用的數據為1986年至2009年的中國城鎮住戶調查數據,該調查由國家統計局負責組織并實施,數據中的樣本覆蓋地域廣泛,共包括中國18個省份,跨越東部、中部、西部地區4不同年份數據覆蓋的省份有所區別。1986年—2001年數據來自17個省份:北京、遼寧、黑龍江、上海、江蘇、浙江、山東、廣東、山西、安徽、江西、河南、湖北、四川、云南、陜西、甘肅。2002年—2009年數據來自16個省份:北京、遼寧、黑龍江、上海、江蘇、山東、廣東、山西、安徽、江西、河南、湖北、四川、云南、甘肅、重慶。我們計算了每一年各省樣本的分布情況,發現樣本在各省的分布較為均衡,具有較強的全國層面的代表性,但由于文章篇幅有限,相關數據在此不做展示,如有需要可向作者索取。。UHS數據的調查內容十分豐富,主要包括居民家庭人口基本情況(具體包含家庭人口、職業、年齡、性別、教育經歷、勞動就業情況等)、家庭主要消費品消費和擁有情況、家庭固定資產擁有情況、家庭收入支出情況、家庭非現金的收入支出情況等。在抽樣方法上,UHS數據首先采用劃類選點隨機抽樣的方法確定所要調查的城鎮,再按照所選城鎮的人口數量比例分配具體調查的家庭數量。為了增強樣本代表性,調查城鎮中的經常性調查戶要求每年輪換三分之一,因此三年之內,樣本中的調查對象會完全更新。正因為其內容的豐富性以及代表的廣泛性,UHS數據非常適合于針對中國城鎮地區收入差距和收入分配的相關研究。
在1986年至2009年期間,UHS數據的調查方案共計發生過6次調整56次調整對應的調查時期分別為:1986年-1987年,1988年-1991年,1992年-1996年,1997年-2001年2002年-2007年,2008年-2009年。。經過對比,本文所選用的變量統計口徑在屢次調整中均未發生變化,因此各年間的數據具有可比性。同時,本文剔除了關鍵變量缺失以及數據明顯異常的樣本。本文的核心變量為家庭人均收入,這是我們進行收入階層劃分以及計算并分解MLD指數的基礎,我們將每一年度家庭的工薪收入、經營凈收入、財產性收入、轉移性收入之和作為家庭當年的總收入,再與家庭人口數量相除即為家庭當年的人均收入,中國城鎮地區歷年家庭人均收入的描述性統計如表1所示。
為了對數據中的家庭樣本進行收入階層劃分,得到各年的高收入階層、中等收入階層、低收入階層的子樣本,我們利用FMM模型對1986年至2009年歷年的UHS數據均進行了估計,具體結果如表2所示。從中可以看出,在1986年至2009年間,中國低收入階層占總體的比重在55%-80%之間,總體呈現下降趨勢。中等收入階層占總體的比重在20%-40%之間,總體呈現上升趨勢。高收入階層的占比比較穩定,始終占總體10%以內。總的來看,盡管低收入階層的占比由1986年的78.38%下降為2009年的56.03%,但樣本期間,中國城鎮地區歷年的收入結構均呈現“金字塔型”,低收入階層的占比始終較高,“橄欖型”的收入結構尚未形成。這一發現與目前諸多討論中國各收入階層規模的文獻是類似的,說明中國城鎮地區的低收入階層占比始終較高。中等收入階層的占比在此期間逐步擴大,其擴大的主要來源是低收入階層的向上流動,中等收入階層本身向高收入階層流動比較緩慢。我們以各收入階層家庭人均收入的平均值來衡量不同收入階層的收入水平,可以發現在1986年至2009年間各階層的收入水平均基本都表現出上升趨勢。特別是在2001年之后,收入水平的增長尤其迅速。而且值得注意的是,高收入階層的收入上漲速度遠快于中等、低收入階層,低收入階層收入上漲速度最慢,因此不同收入階層的收入差距表現出擴大的趨勢。

表2 FMM模型估計結果

注釋:(1)括號里的數字為標準誤;(2)***,**和*分別表示1%,5%和10% 的顯著水平。
根據FMM模型最終估計出的參數,我們按照公式(4)可以計算出每一年樣本中的家庭屬于不同收入階層的條件概率,將每個家庭歸入其所屬條件概率最高的收入階層,我們即可將家庭區分為高、中、低三類收入階層。考慮到中國經濟發展很重要的一個特征在于地區之間的發展不平衡,因此我們首先考察了不同收入階層在地區之間的分布差異。依照統計局的劃分標準,我們將全國分為東部地區、中部地區、西部地區以及東北部地區共4個區域,并分別統計了各個區域內不同收入階層占家庭總數的比例6我們同時也統計了高收入階層在各省中的占比情況,由于篇幅所限這里不作匯報,如有需要可向作者索取。,具體結果如表3所示。我們從中可以發現東部地區的情況與其他地區之間表現出顯著的差異,在任何一個年份,東部地區低收入階層的占比幾乎始終要低于其他地區,同時東部地區中等收入階層的占比與高收入階層的占比也幾乎始終要高于其他地區,考慮到我國的人口分布也大多集中于東部地區,因此中國的中等收入階層與高收入階層主要集中于東部地區,這與東部地區更為發達的經濟狀態是密不可分的。

表3 東部、中部、西部以及東北部地區不同收入階層占比

表3 (續) 東部、中部、西部以及東北部地區不同收入階層占比

1994 61.05% 30.22% 8.73% 58.48% 36.16% 5.36%1995 66.49% 30.21% 3.29% 71.65% 26.85% 1.50%1996 67.09% 29.69% 3.23% 71.33% 26.56% 2.11%1997 68.93% 28.17% 2.90% 74.56% 23.31% 2.13%1998 70.87% 26.27% 2.86% 76.98% 21.33% 1.69%1999 59.99% 35.75% 4.26% 65.82% 30.83% 3.35%2000 59.21% 36.90% 3.88% 60.28% 36.81% 2.90%2001 69.85% 27.36% 2.80% 70.35% 27.72% 1.93%2002 64.67% 29.18% 6.15% 72.09% 25.45% 2.46%2003 64.70% 23.98% 11.32% 75.23% 22.23% 2.53%2004 67.96% 29.25% 2.79% 74.17% 23.31% 2.52%2005 68.36% 28.93% 2.70% 72.39% 24.73% 2.88%2006 70.90% 26.72% 2.38% 72.99% 24.83% 2.18%2007 76.10% 22.67% 1.23% 77.25% 21.14% 1.62%2008 76.34% 22.07% 1.59% 76.50% 20.80% 2.71%2009 67.83% 30.28% 1.88% 71.40% 25.63% 2.96%
根據收入階層的劃分結果,我們進一步利用廣義熵指數中的MLD指數來分析每一個收入階層之內,以及不同收入階層之間的收入不平等程度,及其對總體收入不平等程度的貢獻大小。我們計算了每一年中國城鎮地區表示總體收入不平等程度的MLD指數,并將其分解為表示各個收入階層之內收入不平等的組內MLD指數,以及表示不同收入階層之間收入不平等的組間MLD指數,具體結果如表4所示。
就總體收入不平等程度而言,其演變趨勢在1986年至2009年之間大致可以分為三個階段:第一階段是1986年至1991年,總體收入不平等程度處于較低水平并且基本保持穩定,MLD指數大約處于0.07至0.098之間;第二階段是1992年至1994年,總體收入不平等程度快速上升,MLD指數至1994年達到了0.23;第三階段是1995年至2009年,總體MLD指數圍繞0.2表現出一定的波動,在2000年達到最大值0.25,說明總體收入不平等程度維持在較高水平,并未發生明顯的改善。
上述發現與文獻中基尼系數的測算結果是類似的,均表明中國城鎮地區整體的收入不平等程度在20世紀90年代中期開始發生顯著的上升,此后大體保持穩定(趙人偉等,1999;Gustafsson et al.,2008;Li et al.,2013;李實等,2017)。總體收入不平等程度可以分解為各收入階層之內的組內收入不平等以及不同收入階層之間的組間收入不平等,分析組內收入不平等與組間收入不平等的演變趨勢可以看出二者均呈上升趨勢,但值得注意的是,在1986年至1991年間組內收入不平等程度與組間收入不平等程度基本相同。而自1992年開始,組間收入不平等程度要顯著高于組內收入不平等程度。比較高、中、低收入階層的MLD指數,我們還可以發現低收入階層的收入不平等程度始終要高于其他收入階層,高收入階層的收入不平等程度次之,而中等收入階層的收入不平等程度最低。但中、低收入階層的收入不平等程度在1986年至2009年之間出現明顯上升,相比之下高收入階層的收入不平等程度在此期間基本未發生明顯變化。

表4 中國城鎮地區家庭的MLD指數及其分解
我們在表5中進一步考察了中國城鎮地區各個收入階層之內的組內收入不平等程度以及不同收入階層之間的組間收入不平等程度對總體不平等程度的貢獻率。首先就組內收入不平等與組間收入不平等而言,在1986年至1994年之間,組內收入不平等的貢獻率呈現出明顯的波動下降趨勢。它由1986年的54.11%下降至1994年的29.11%,由此組間收入不平等開始成為中國城鎮地區總體不平等的主導因素。自此之后,組內收入不平等與組間收入不平等的貢獻率基本分別維持在30%-35%、65%-70%。其次,進一步將組內收入不平等貢獻率細分為高、中、低收入階層的組內收入不平等貢獻率。從中可以看出,雖然低收入階層的組內收入不平等貢獻率隨著低收入階層占比的下降而處于下降趨勢之中,但遠高于其他收入階層的組內收入不平等貢獻率,因此低收入階層內部的收入不平等始終是組內收入不平等的核心影響因素。中等收入階層的組內收入不平等貢獻率在此期間逐步增加,由1986年的2.52%上升至2009年的4.76%,考慮到中等收入階層的MLD指數增長相對緩慢而且始終低于其他收入階層,我們認為其貢獻率的增加主要是由中等收入階層占比提高所導致的。與之類似,高收入階層的組內收入不平等貢獻率也在1986年至2009年之間出現上升。但由于高收入階層的占比一直以來都較低,因而其貢獻率始終未超過1%。

表5 中國城鎮地區家庭MLD指數的各部分貢獻率
基于1986年—2009年UHS詳盡的微觀調查數據,本文使用FMM模型將歷年樣本中的家庭內生聚類為低收入階層、中等收入階層和高收入階層三類群體。考察了不同地區的收入階層分布特征,并利用MLD指數的計算及分解方法分析了每一年中各個收入階層之內以及不同收入階層之間的收入不平等程度,及其對總體收入不平等程度的貢獻大小。
本文的研究結論如下,第一,盡管中國城鎮地區的低收入階層占比總體呈下降趨勢,中、高收入階層占比總體呈上升趨勢,但低收入階層占比仍然較大超過了50%。就收入水平而言,雖然各階層的收入水平始終在上升,特別是在2001年之后,各階層收入水平的增速都得到顯著提高,但高收入階層的收入水平上漲速度遠快于中、低收入階層。第二,不同地區的收入階層分布存在顯著差異,東部地區低收入階層的占比幾乎始終要低于其他地區,同時東部地區中等收入階層的占比與高收入階層的占比也幾乎始終要高于其他地區,這說明中國的中、高收入階層主要集中在東部地區。第三,以MLD指數來衡量收入不平等程度,中國城鎮地區的整體收入不平等程度表現出三階段特征。組內收入不平等程度與組間收入不平等程度均呈現上升趨勢,但組間收入不平等程度自1992年開始要顯著高于組內收入不平等程度。中、低收入階層的MLD指數在1986年至2009年間出現明顯上升,而高收入階層的MLD指數在此期間基本未發生明顯變化,但低收入階層的收入不平等程度始終要高于其他收入階層,高收入階層次之,中等收入階層的收入不平等程度最低。第四,組內收入不平等貢獻率呈現明顯的波動下降趨勢,組間收入不平等是目前中國城鎮地區總體收入不平等的主要因素。在1986年至2009年之間,中、高收入階層的組內收入不平等貢獻率在逐步上升,低收入階層的組內不平等貢獻率在逐步下降,但低收入階層的組內不平等貢獻率始終要遠高于其他收入階層。
雖然本文使用的UHS數據是一套難得且詳盡的微觀調查數據,但不得不承認其時效性略顯不足。如果假設我們上述研究所發現的中國城鎮地區收入不平等情況的演變趨勢延續至今,則旨在調節收入分配的政策仍然是非常必要的,并且尤其應當著力提高低收入階層的收入水平,因為城鎮地區的收入不平等程度在1986年至2009年之間表現出顯著的上升趨勢,同時低收入階層的占比始終較大,且組間不平等開始成為總體不平等的主導因素。當然,如果未來可以得到新的UHS數據,本文所提出的收入階層劃分方法也可以很方便地在新數據上得到應用,再根據最新的發現提出更有針對性的政策建議。