南京理工大學 梁雅茹
梳理現有文獻發現,學者大多通過回歸的方法探討或驗證城鄉教育水平差異與城鄉勞動者收入差距的相關性。基于此,本文將采用多元線性回歸模型分析中國高等教育擴展在居民收入差距擴大過程中所起的作用。
本文所使用的數據來源于中國人民大學的社會學系與香港科技大學的社會調查中心合作的2015年中國綜合社會調查,此數據開始于2003年,是最早具有全國性、連續性和綜合性的一項學術調查。該調查全面地收集了個人、家庭、社區等多個不同層次的數據。目前,CGSS已成為研究我國社會的主要數據來源,得到了國內外學者的認可。2015年CGSS項目除了核心模塊(A部分)外,新加入了2005年經濟態度與行為評價的10年回顧模塊(B部分)、東亞社會調查(EASS)的工作模塊(C部分)、國際調查合作計劃(ISSP)的工作模塊(D部分)、能源模塊(E部分)和法制模塊(F部分),其中A和B部分是所有受訪者必須要回答的,而C和D部分被抽中的概率都為1/6, E和F部分被抽中的概率都為1/3。本文所使用的CGSS問卷調查涉及了我國28個省/市/自治區的478村居。我們依據要研究的內容,使用CGSS2015數據來進行實證分析,主要原因有以下三點:
(1)中國綜合社會調查的數據樣本多、地區多。除西藏自治區、海南省、新疆維吾爾族自治區、港澳臺地區之外,包含大陸28個省級行政區。經統計,共有問卷10968份,即便刪除無法回答與拒絕回答的樣本,剩余樣本依然較大,這意味著本文所使用的調查數據有一定的典型性。
(2)中國綜合社會調查設計的問題及答案選項十分合理。問題的設計與我國的國情一致,全面收集了社會、社區、家庭、個人多個層次的數據。
(3)中國綜合社會調查的權威性在學術界已經得到了高度認可。用戶包括來自世界各國各個學科的學者、學生及其他人員。據中國國家圖書館統計,截至2018年12月底,基于中國綜合社會調查(CGSS)數據產出國內中文期刊論文2115篇,國際英文期刊論文355篇,其中有SCI和SSCI論文241篇; 2018年產出國內中文學術期刊論文高達429篇,國際英文學術期刊論文78篇,國內中文博、碩士學位論文98篇,三者都刷新了歷史最高紀錄。
本文所使用的數據主要來自“中國綜合社會調查”(CGSS)項目。表1給出了數據變量的簡單統計。

表1 樣本統計描述
(1)自變量。本文的核心解釋變量是居民的受教育程度,采用的問卷問題是“您目前所接受的最高教育程度是?”回答結果多種多樣,因此,本文借鑒已有文獻,將回答用14個學歷層次來表示,從低到高的順序依次為:沒有接受過任何教育、僅接受一點教育(私塾、掃盲班)、小學、初中、職業高中、普通高中、中專、技校、大學專科(成人高等教育)、大學??疲ㄕ幐叩冉逃?、大學本科(成人高等教育)、大學本科(正規高等教育)、研究生及以上、其她。具體數據見表2。由表2可知,隨著受教育程度的上升,人數也大幅度減少,從中專開始,高學歷人數所占的比例也在明顯下降。

表2 各教育層次的人數分布
(2)因變量。本文的因變量即被解釋變量是居民的勞動收入,采用的問卷問題是“您去年一年的勞動所得是多少?”包括工資、各種獎金、津貼、分紅、股息、保險、退休金、銀行利息等所有收入在內,以此得到各個教育層次的平均年收入。
(3)控制變量。根據本文的研究內容,從CGSS2015選取如下幾個控制變量:
①性別變量。本文選取的調查數據中,分別對男性和女性賦值為1和0,隨機選取的男性人數為4751,占比為47.33%,女性人數為5288,占比為52.67%。如表3所示。

表3 性別人數分布
②年齡變量。本文選取的年齡變量中,按不同的年齡階段進行劃分,最小年齡值為18,以10為間隔區間,具體年齡分布如表4所示。

表4 年齡區間分布
③健康狀況變量。根據調查問卷中,“您覺得您目前的健康狀況是?”回答設置為很不健康、比較不健康、一般、比較健康、很健康。由表5可知,被調查者中認為自己比較健康的人數占比很大,認為自己很不健康的人數只占很小一部分。

表5 健康狀況分布
④婚姻狀況變量。根據調查問卷中問題“您目前的婚姻狀況是?”回答分為已婚和未婚,且已婚人數占比最高,這與本文所研究的問題是相符合的,見表6。

表6 婚姻狀況分布
表7是對上述變量的數據處理部分。由表7可知,變量收入的樣本量為10039,樣本均值是6.5379,標準差是4.7326,中位數是9.2104,最大值為15.4249。

表7 樣本統計描述
本研究所采用的模型是多元線性回歸模型。其模型具體如下;

其中,Y代表被訪問者的收入,a代表常數項,即自變量和控制變量均為0時,因變量Y的平均取值;X代表模型中的自變量以及其他變量;回歸系數b代表在控制了其他變量的情況下,自變量Xi每變化一個單位,因變量Y的平均變化情況。本文通過受教育年限、性別、年齡、婚姻狀況、健康狀況等因素對個人收入進行回歸,分析教育對收入的影響。
表8給出了對上述變量的簡單線性回歸結果。

表8 樣本線性回歸統計結果
表8采用了線性回歸方法檢驗了教育程度對居民勞動收入的影響。在控制了其他變量的情況下,年齡系數為-0.078,說明年齡與居民收入的關系呈負相關,且p值為0,小于0.1,說明系數是顯著的,也即年齡對收入的影響呈顯著的負相關關系。性別與居民的收入呈顯著的正向關系,在控制其它變量的情況下,男性的平均年收入顯著高于女性。婚姻狀況和健康狀況也呈顯著的正向關系,即在相同情況下,已婚居民的收入顯著高于未婚居民;健康狀況好的居民收入普遍高于健康狀況較差的居民。
教育程度與居民的勞動收入呈現顯著的正向關系,且教育程度為本科以下水平時,教育系數為0.217,說明教育程度與居民收入的關系呈正相關關系,且p值為0.026,小于0.1,說明系數是顯著的,即教育程度對居民收入的影響呈正相關。在教育程度為本科及以上時,教育系數為0.748,p值為0小于0.1。表明教育程度每提高一個單位,對數化收入將提高0.531個單位,由此可見,受教育程度的提高有助于提高居民的收入,這也是我國實行科教興國的重要原因。
綜上所述,受教育程度可以通過性別、健康狀況和婚姻狀況三個中介變量對收入產生正面影響,年齡產生負面影響。
本文基于全國綜合社會調查數據(CGSS2015),利用多元線性回歸方法分析“教育程度”對中國居民收入的影響,得到以下結論:通過對受教育程度影響收入的研宄,發現受教育程度能夠通過健康狀況、婚姻狀況、性別三個中介變量來提高收入,通過年齡這個中介變量降低收入。這種影響機制不是單一的,而是一種復雜的機制,正因如此,我們應該通過一些政策加強正方向影響、降低負方向影響。
由以上結論可以得到主要的政策啟示:第一,加強對高校的管理。如今,我國在為全面實現小康社會、實現中國夢而奮斗,堅持科教興國戰略,注重對人才的培養,加大對教育經費投資力度。尤其是隨著高校的擴招,高學歷人才越來越多,大學生、研究生再也不像以前那樣缺少,這就導致了高學歷人才之間的競爭更加激烈。政府應該在一定程度上對高校提出要求,加強對高校的管理和監督,使之在保證學生數量的同時還要保證高質量,并合理利用教育經費,完善教育制度。第二,完善人力市場競爭體系。眾所周知,個體的受教育程度越高,對收入的要求越高,以致更難找到滿意的工作。所以政府應該完善勞動力市場的競爭機制,加強雇傭者與被雇傭者之間的信息交流,降低信息不對稱。還要注意促進企業改革,使企業在招聘新員時能遵循公平、公開、公正的原則,讓受教育程度高的個體最后能夠獲得與之相匹配的工資收入。