劉 晗
中國教育回報率的分布特征及地區差異
——基于中國社會綜合調查(CGSS)2013年數據的實證分析
劉 晗
基于中國社會綜合調查(CGSS)2013年的數據,分別使用最小二乘法(OLS)和分位數回歸法(QR)估算不同收入水平和教育層次下的教育回報率,并分析其對收入差距的影響。研究發現:教育回報率隨著收入的增加而遞減,教育對縮小收入差距有正向影響。各教育層次的教育回報率分布情況不同。對于初等、中等教育層次,其回報率同上述一致。對高等教育層次,高收入群體的教育回報率更高。若一味的發展高等教育,必將導致“馬太效應”。教育回報率還存在顯著的地區差異,東、西部地區的收入差距存在進一步擴大的趨勢,對于西部偏遠地區,完善基礎教育的同時鼓勵職業教育對調節居民間收入差距更為有效。
教育回報率;分位數回歸;收入差距
近年來,多項研究表明:我國的人口紅利已經消失,經濟增長主要依靠科技發展和制度創新。因此,加快從人口紅利向人才紅利過渡才能保證國家經濟實現可持續穩態增長。提高教育水平是實現國家人才紅利的基礎,也是解決貧困代際傳遞的有力手段。
隨著我國教育事業的發展,教育經費也逐年提升。提高教育水平對不同收入、不同性別、不同地區的個人收入是否有影響,教育能否縮小收入差距等成為研究熱點。部分學者開展了基于教育回報率的測度分析實證研究。李雪松等人運用2000年微觀數據估計20世紀末中國的教育回報,指出我國教育回報率顯著提高,教育和勞動力對市場經濟的發展起到重要作用[1]。張車偉指出教育回報率存在隨收入增加而上升的趨勢,即教育在一定程度上會導致居民收入差距擴大的“馬太效應”[2]。劉生龍基于分位數回歸和審查分位數回歸對我國教育回報率進行實證研究,結果表明,教育對于中國居民的收入有正向促進作用,在各分位點教育對女性居民收入的回報高于男性[3]。徐舒通過考察技術進步、教育收益與收入不平等之間的關系,認為教育拉大了居民間收入的不平等,這與張車偉的研究結果一致[4]。劉生龍等人利用2007—2009年中國城鎮住戶調查數據,基于斷點回歸方法研究義務教育法的實施對個體受教育年限和教育回報率的影響,進一步論證了高收入群體教育回報率要高于低收入群體這一結果[5]。大部分學者對教育回報率的考察主要側重不同時期不同地區的教育回報率的變化,并未對各教育層次上不同收入水平的教育回報率進行考察研究。筆者利用CGSS2013年調查數據,基于分位數回歸對教育回報率的分布、地區差異及不同教育階段的回報率進行實證研究,在此基礎上分析教育對收入差距的影響。
(一)計量模型
Mincer考察人力資本對收入的影響,將工資收入表示為受教育年限、工作經驗的函數,推導出明瑟模型,被廣泛應用于探討人力資本對收入回報的研究中。明瑟方程的函數形式如下:

式中:y是收入變量;x指影響收入的因素,一般為受教育年限、工作經驗、性別、地區、職業等。
經典的明瑟方程只考察教育和工作經驗對收入的影響,其具體形式為:

式中:ln(wage)為工資的對數;Sch指受教育年限;Exp為工作年限,代表經驗變量;Exp2測度工作經驗的非線性影響;β1的估計值即為教育的收益率。
經典的明瑟方程是完全競爭市場的教育純收益。考慮到勞動力的市場分割,個人收入同時受性別、職業、地區等因素影響,筆者對變量進行調整,得到模型:

模型中新加入ΣλiXi為性別、地區的綜合影響。由于教育質量與個人能力難以測度,故研究不考慮其影響。
(二)指標與數據
研究數據來源于中國社會綜合調查(以下簡稱CGSS)2013年的調查結果。CGSS始于2003年,2013年數據調查涵蓋了除港澳臺與新疆、西藏和海南外的全國28個省、市、自治區,調查內容包括居民生活狀態、教育、健康、職業、社會關系等各方面的信息,適合做教育回報率的研究。筆者主要選取被調查者出生年份、最高受教育程度、受教育狀態(輟學、退學、肄業、畢業)、2012年全年總收入、職業性質、性別、所在地區、城市或農村8個變量估測教育回報率。
樣本選擇上,由于考察教育收益率,故只選取收入為正的樣本,并排除年齡在60歲以上和16歲以下的樣本。篩選后得到的有效樣本為6 071個。
模型中被解釋變量為工資。考慮到數據的可獲得性,筆者選取2012年全年總收入變量來衡量居民收入。由于居民收入水平呈明顯右偏態分布,故對其取自然對數,以減弱離群值和極端值的影響。采用對數處理后居民收入分布近似服從正態分布。
模型的解釋變量設為居民的受教育年限Sch、工作經驗 Exp、地區X1、性別 X2、城市或鄉村X35個變量。其中,Sch由最高受教育程度和受教育狀態決定。受教育程度被劃分為未受教育、小學(包括私塾)、初中、普通高中、職業高中或技校(包括中專)、大學專科、大學本科、研究生及以上8個等級,其教育年限分別為 0、6、9、12、12、15、16 和 19 年。考慮受教育狀態,對于未完成學業的樣本,其教育年限為上層次學歷年限加上未完成層次年限的一半。Exp由工作年限衡量,由年齡-受教育年限-6年的計算方式確定。 X1、X2、X3為虛擬變量,其取值為:東部地區 X1=1,中西部地區X1=0;男性 X2=1,女性 X2=0;城市X3=1,農村X3=0。
(三)計量方法
已有研究多使用最小二乘回歸對教育回報率進行估計。但是,最小二乘估計有以下幾方面的不足:一是最小二乘估計更容易受異常值影響,導致回歸結果不精確;二是存在內生性問題,如個人能力變量不可獲得,故模型將其歸為擾動項使得擾動項與解釋變量相關,從而導致最小二乘回歸結果不具有一致性,通常使用工具變量法解決此類問題;三是最小二乘回歸要求嚴格,研究實際問題時難以滿足,從而使得回歸結果不穩健。
分位數回歸的基本思路是尋求使得殘差絕對值的加權平均最小的系數估計值β^,即若對樣本做q分位數回歸,其目標函數為:

分位數回歸計量結果不受極端值影響,較為穩健。
分位數回歸可以對不同分位點的教育回報率進行測度,反應不同收入水平的教育回報率的差異,便于我們考察其分布特征。對不同收入水平的分位數回歸在一定程度上解決內生性問題。并且,分位數回歸對研究總體的分布無嚴格要求。因此,筆者使用分位數回歸法考察我國的教育回報率。
筆者分別使用最小二乘回歸(OLS)和分位數回歸(QR)2種方法對教育回報率進行估測。
(一)數據的描述性統計
選取CGSS2013年中所需變量,進行數據篩選處理后得到607 1個有效樣本。變量的描述性統計見表1。
從表1中可以看出,2012年我國平均受教育年限約為9.5年,學歷高于初中的人數占比超過50%。從樣本分布來看,中西部地區樣本量比較多;從性別來看,男性占比較高;從城鄉看,城鎮居民比重較大。
(二)最小二乘估計
首先運用Stata對式(2)即經典的明瑟方程做最小二乘估計,結果如下:

以上各變量系數估計值均在5%顯著性水平下顯著,收入與教育年限、工作經驗正相關,調整的可決系數R2的值為0.306 9,可以認為模型擬合效果較好。從估計結果看,不考慮地區等因素的影響,2012年我國教育回報率大致為10.97%。考慮地區、性別和城鄉因素的影響,最小二乘回歸結果為:

調整后模型的可決系數為0.441 4,說明加入虛擬變量后,模型的擬合度變得更好,同時各系數均顯著。從回歸結果看,教育對收入的影響明顯降低,教育回報率約為5.57%,幾乎是教育純收益的一半,這說明教育的收入效應在很大程度上受地區、性別、城鄉等因素的影響。在其他條件不變時,東部地區居民的收入比中西部高52.88%,這也解釋了當前勞動力向東部發達地區流動這一現象。在其他條件不變時,男性收入比女性高42.37%,而城市居民收入比農村的高47.75%,地區、性別和城鄉等因素均對居民收入有顯著影響。
(三)分位數回歸估計(QR)
對調整的明瑟方程做分位數回歸,分別選取0.1、0.2、…、0.9共9個分位點,并將結果與OLS回歸進行比較,回歸結果見表2。

表1 變量的描述性統計
根據回歸結果可以看出,由于異常值等因素的影響,OLS回歸系數略低于QR回歸,通過Stata中Test檢驗得到拒絕各分位點回歸系數相等的假設,且教育回報率隨著分位點的逐漸提高而降低。回歸結果表明教育回報并不會導致“馬太效應”,而低收入家庭可通過接受教育使得自身收入提高,縮小與高收入家庭的差距,此種差異可能源于數據或所選變量的不同。工作經驗對收入的影響在各分位點無明顯變化趨勢。地區差異對工資的影響隨著收入增加呈現遞減的趨勢。在0.1分位點上,其他因素不變時,東部地區居民的工資收入比中西部地區的高65.9%;隨著分位點的增大,系數逐漸減小;在0.9分位點,這一差距為45.1%。性別與城鄉差異對工資的影響同地區類似,也是隨著分位點增大逐漸遞減。但是,回歸中的常數項呈現出隨著收入增大而逐漸增加,在其他因素均為零時,收入最高的10%群體的工資是收入最低的10%群體的工資的2倍多。
(四)不同教育層次教育回報率的比較
1.各教育層次數據的描述性統計
為了便于相互比較不同受教育的程度,筆者將其分為小學、初中、高中、職業教育(包括職業高中或技校或中專)、高等教育(大專及以上)5個層次。各層次樣本量分別為 1 183、1 947、771、515 和 1 281。 各教育層次數據的描述性統計見表3。
根據描述性統計結果可以看出,隨著教育層次的提高,居民的工資收入明顯提升,標準差逐漸減小,工資收入分布越來越集中。在小學、初中、高中和職業教育層次上,收入的中位數均高于其均值,收入分布呈左偏態分布,即有低收入極端值存在。在大專及以上的教育層次上,收入的中位數低于均值,說明其呈右偏態分布,即有收入很高的極端值存在。在各教育層次樣本中,男性均多于女性,城市居民多于農村居民,且隨著教育層次的提高,東部發達地區樣本量占比上升。大專及以上的教育層次中,57.97%的樣本來自東部發達地區。城鄉間差異與地區間一致,數據表明接受過高等教育的人中有95.47%的人居住在城市,進一步反映東西部地區教育水平存在差距,且勞動力的地區遷移與受教育水平和收入水平有關。

表3 各教育層次數據的描述性統計
2.回歸結果分析
利用分位數回歸對0.1~0.9分位點進行估計,回歸結果顯示小學教育僅僅對收入水平最低的10%樣本有顯著影響。不同教育層次分位數回歸結果見圖1。

圖1 不同教育層次分位數回歸結果
分析圖1可得,從整體上看,大專及以上教育層次的教育回報率最高,其次是職業教育。在不同教育層次,教育回報率在不同分為點的變化趨勢不一致。具體來看,大專及以上教育層次的回報率隨著收入的增加而上升;職業教育層次回報率隨收入增加呈先增后減的倒“U”型;中學階段教育回報率隨收入增加而下降。在低分位點上,高中教育的回報率最高;在20%~35%分位點,職業教育的收益率最高;在高分位點,高等教育回報率最高。一般認為高等教育門檻高,限制低收入群體接受高等教育的機會,從而會擴大收入差距。從研究實證結果看,即使降低高等教育門檻,也難以縮小收入差距。對于低收入地區或群體,保障其完成中學教育,鼓勵職業教育對縮小差距更加行之有效。
3.教育回報率的地區差異
分析東部發達地區和中西部欠發達地區教育回報率的差異,不同地區教育回報率的回歸結果見圖2。

圖2 不同地區教育回報率的回歸結果
東部地區教育回報率隨著分位點的增大呈先減后增趨勢;中西部地區教育回報率隨著分位點的升高而降低;東部地區明顯高于西部地區且差異呈擴大趨勢。教育回報率差異不僅源于教育年限不同,還有教育質量差異。東部發達地區具有優越的地理位置、經濟條件和教育資源,即使接受同樣年限的教育,其教育質量也要普遍高于經濟不發達地區。隨著收入的提高,地區間收入差距隨著教育回報差距的增大而增大,鼓勵勞動力向高回報地區流動,摒除勞動力流動壁壘,才能有效縮小居民收入差距。
筆者基于CGSS2013年的調查數據,分別利用OLS和QR方法對我國教育回報率及其分布情況、層次地區差異進行考察,得到以下5點結論。第一,完全競爭市場的教育回報率(教育純收益)遠遠高于不完全競爭市場,地區、性別、城鄉均對收入有顯著影響,說明勞動力市場存在嚴重分割,教育對收入的影響效應很大程度上是通過就業途徑實現的。第二,隨著分位點的上升,教育回報率呈下降趨勢,說明低收入家庭可以通過接受教育縮小與高收入家庭的差距,教育不會導致“馬太效應”。第三,不同教育層次的回報率差異明顯,整體上看,教育回報率從高到低的順序依次為大專及大專以上教育層次、職業教育層次、初中和高中教育層次,在低分位點上職業教育回報率最高,高分位點上大專及以上的高等教育回報率最高。第四,不同教育層次的回報率隨收入的變動呈不同變動趨勢。整體上看,大專及以上的高等教育層次回報率隨著收入的增加而上升,職業教育層次的回報率隨收入增加呈先增后減的倒“U”型,中學階段教育層次的回報率隨收入增加而下降。第五,我國教育回報率存在較大的地區差異。東部地區的教育回報率遠遠高于中西部地區,且差距有擴大趨勢。東部地區教育回報率隨著分位點的提高呈先降后升的“U”型趨勢,中西部地區總體呈下降趨勢。
基于以上結論得出如下政策建議。第一,完善基礎教育。初等教育是教育的基礎,尤其對于西部欠發達地區,其初等教育收益率最高,故應加大投入力度,保證全民完成義務教育。第二,發展職業教育。近年來國家大力支持高等教育,忽視職業教育,然而從實證結果看,高等教育回報率隨著收入的增加而增加,若一味發展高等教育必然導致收入差距擴大的“馬太效應”。對于低收入家庭,接受職業教育是其縮小收入差距的最優選擇。第三,加大對低收入家庭的扶持力度。低收入群體教育收益率普遍高于高收入群體,扶持低收入群體接受更多教育會得到更高的回報,故應該加大對低收入家庭的教育輔助。第四,完善勞動力市場。勞動力的市場分割會降低教育回報率,故應完善勞動力市場,實現人才自由地向高回報率地區、部門流動,實現人力資源的最優配置。
[1]李雪松,詹姆斯·赫克曼.選擇偏差、比較優勢與教育的異質性回報:基于中國微觀數據的實證研究[J].經濟研究,2004(4).
[2]張車偉.人力資本回報率變化與收入差距:“馬太效應”及其政策含義[J].經濟研究,2006(12).
[3]劉生龍.教育和經驗對中國居民收入的影響:基于分位數回歸和審查分位數回歸的實證研究[J].數量經濟技術經濟研究,2008(4).
[4]徐舒.技術進步、教育收益與收入不平等[J].經濟研究,2010(9).
[5]劉生龍,周紹杰,胡鞍鋼.義務教育法與中國城鎮教育回報率:基于斷點回歸設計[J].經濟研究,2016(2).
(編輯:唐龍)
F014.32
A
1673-1999(2017)08-0059-05
劉晗(1994—),安徽財經大學統計與應用數學學院統計學專業2016級碩士研究生,研究方向為經濟統計。
2017-06-05