朱 州,趙國昌
(西南財經大學 經濟與管理研究院,四川 成都 610074)
生育水平過低是當前和未來長時間內我國經濟社會發展所面臨的重大挑戰。郭志剛和田思鈺通過《中國人口與就業統計年鑒》的數據發現:我國育齡女性的總和生育率已經從1990年的2.3下降到了2015年的1.05,遠遠低于2.1的人口更替水平。[1]雖然Notestein 發現工業化和城市化發展會自然伴隨著生育水平的下降,[2]但我國目前存在的最大問題是未富先老①實際上,世界銀行數據顯示我國老年撫養比(64歲以上人口與15-64歲人口之比)也超過了中高收入國家的平均水平。:在未完成工業化和現代化的條件下,生育水平的大幅下降導致我國提前步入老齡化社會。如圖1 所示:從20 世紀90 年代中后期開始,我國的總和生育率不僅低于同收入類別的中高等收入國家(地區),而且還遠低于高收入國家(地區)。2018 年中高等收入國家(地區)的平均生育水平在1.90,高收入國家(地區)的平均生育水平在1.60。2016 年全面放開二胎政策后,我國的總和生育率有了短暫上升,但2017 年、2018年的總和生育率也只有1.58、1.50。第七次人口普查數據顯示2020年我國總和生育率只有1.3。由于新出生嬰兒長成勞動力人口需要一定的時間,因此低生育率的當期和短期影響還會讓勞動力人口占比上升,但其中、長期影響會導致人口老齡化。范碩和李俊江及蔡昉等人研究發現低生育水平會帶來人口的老齡化,對經濟社會的消費和儲蓄、社會負擔、人力資本投資、創新活力等方面都產生影響。引發人口紅利消失、年輕人養老負擔重、政府財政壓力大、國內消費市場增長停滯等一系列的經濟社會問題。[3-4]

圖1 中國與其他國家(地區)的生育水平比較
另一方面,20世紀90年代以來我國育齡女性中接受過高等教育的數量和比例持續大幅度上升。1990 年人口普查和2015 年1%人口抽樣調查的數據顯示:我國育齡婦女(20-49 歲)中大專及以上學歷總人數由1990 年的397 萬上升到2015 年的6 782 萬,大專及以上學歷占比從1990 年的2%上升到了2015 年的20.7%。《2019 年全國教育事業發展統計公報》顯示2019 年我國女性的高等教育毛入學率已經達到了51%。實際上我國女性的大學毛入學率已高于男性。雖然目前社會和學術界有一些關于我國高等教育比例是否過高的討論,但與同檔次的中高收入國家(地區)相比,我國的高等教育人力資本積累并不占優勢,只是近兩年才達到平均水平,還遠遠低于高收入國家(地區)的平均水平(見圖2)。為了讓我國在未來全球競爭中擁有人力資本紅利,最近公布的“十四五規劃和2035 年遠景目標綱要”就明確提出要將我國的高等教育毛入學率提高到60%。可以預期未來我國接近乃至超過一半的育齡女性將會接受高等教育。當前我國社會正處于婚育行為急劇變遷的階段,生育水平的持續下降引起政府和社會的擔憂:未來我國還會繼續向著西方的少子化乃至丁克家庭模式變遷嗎?高等教育女性作為西方婚育觀念的率先接觸者,她們的婚育行為是判斷未來我國女性婚育行為模式變遷的風向標。那么,上大學是否會影響我國女性的生育數量?我國育齡女性中受過高等教育比例的不斷提高是不是近年來我國生育水平下降的重要原因?在人口老齡化不斷加劇的背景下,這兩個問題的答案意義重大。要回答這些問題,需要準確估計出高等教育對于女性生育數量的影響。

圖2 中國與其他國家(地區)的高等教育總入學率比較
1990年以來我國女性總和生育率下降到更替水平以下,已經出現了很多關于女性生育水平下降原因的研究。梁同貴及薛君從人口流動、周長洪及陶濤等從經濟社會發展、葛玉好和張雪梅從房價、郭志剛和田思鈺從婚姻推遲等多種角度對我國生育水平下降進行了解釋。[1][5-9]卻少有文獻實證分析教育因素在生育水平下降過程中的作用。作為重要的社會經濟變量,Becker、Blossfeld 和Huinink 發現教育會通過勞動市場的(潛在的)收入效應和替代效應[10-11]或者通過禁閉效應等多種機制影響女性的生育數量。[12]從理論上來說,上大學會降低還是提高女性的生育水平并沒有一致結論,因此相應的實證分析就非常必要。
雖然量化分析高等教育對我國女性生育水平的影響意義重大,但相關的實證文獻還很少①近年來有少量學者開始關注教育對生育數量的影響,與本文類似的有楊振宇和張程的研究,他們用1986年義務教育法作為工具變量,發現因義務教育法而上初中的女性群體的生育水平下降了。[13]。一個可能的原因在于估計高等教育對女性生育數量的影響會同時面臨內生性問題和生存數據結構問題。由于個人能力、事業心等不可觀察的變量既影響女性的教育獲得,也影響女性的生育數量,所以女性的受教育水平是內生的。本文既參照Duflo、Ou 和Zhao 及侯玉娜和鄧寧莎等人的思路②Ou 和Zhao 在估計大學擴招政策的影響時,除了利用1999 年作為政策處理時間點,也用了各省高等教育擴張強度作為政策處理的地區差異。[15],[14-16]借助1999 年高校擴招政策強度在個人出生隊列和戶籍所在省份的雙重外生差異,還利用各個省份本身的高等資源稟賦導致的高等教育入學機會差異來構造個人高等教育的工具變量。生存數據結構問題是指對于較為年輕的樣本,調查截止時點觀測到的生育數量不能代表該女性最終的生育數量。雖然可以通過把年輕女性樣本刪除的方式減弱這個問題,但這樣做會讓國內常見的微觀數據庫都面臨樣本量不足的問題。因為初步篩選的分析樣本就只能是高中及以上學歷③高中學歷才適合做大學的參照組,這里的高中是指高中階段,包括普通高中、中專、職業高中,下文同。,再排除較為年輕的女性樣本,往往樣本量非常小,很難保證在出生隊列層面上的代表性。本文利用2015 年1%人口抽樣調查的大樣本數據,能夠較為準確地描述高中和大學學歷女性平均生育水平在不同年齡隊列上的變動趨勢。2015 年1%人口抽樣調查的大樣本能夠幫助我們確定合理的起始分析年齡從而一定程度上克服生存分析問題。另外,結合翟振武和劉雯莉、朱州和趙國昌的發現,近年來我國各學歷女性婚姻推遲明顯而最終結婚率仍然很高。[17-18]將樣本限定為已婚來消除因為婚姻推遲導致的暫時未生育的情況,可以進一步克服生存分析問題對估計結果的影響。
借助1999年高校擴招政策和各省高等教育資源稟賦所帶來的高等教育機會在個人出生隊列和戶籍所在省份的雙重外生差異,我們給女性能否上大學構造了一個工具變量來解決內生性問題,并使用IV-Poisson 模型估計了上大學對我國女性生育數量的影響。結果表明與高中學歷的女性相比,上大學會使得女性生育數量平均下降30%左右。這種影響主要體現為上大學讓女性生育二孩及多孩的概率大幅度下降,而并非不生。進一步分析發現上大學會通過提高女性的勞動市場參與率影響女性的生育數量,換言之高等教育提高了女性生育的機會成本。另外,本文還通過采用不同的樣本起始年齡、用其他的工具變量以及用已育樣本進行估計值下界(Lower bound)分析,結果都很穩健。根據本文的估計結果,育齡女性中高等教育比例的提高是20 世紀90 年代以來我國生育水平下降的重要原因。本文主要有三點貢獻:第一,本文的研究結果有助于從高等教育發展的角度對1990年以來我國育齡女性生育水平的變動進行解釋,并對我國未來的生育水平變動趨勢進行展望。第二,上大學作為一種人力資本投資行為,傳統文獻多關注其對收入的影響。近些年以Oreopoulos和Salvanes為代表的一些文獻開始關注教育帶來的非貨幣化效應(Non-pecuniary effect)。[19]生育作為個體生命周期的重要節點,對家庭和社會的發展都具有極其重要的意義。本文發現上大學會顯著地降低女性的生育數量,豐富了相關的文獻。第三,在估計高等教育對生育數量的影響時,本文設計的識別策略對解決同類問題具有借鑒意義。比如用2015年1%人口抽樣調查數據,通過描述我國高中和大學學歷女性在不同年齡隊列上的生育變動趨勢,合理確定生育分析的起始分析年齡以克服所面臨的生存數據結構問題。另外,本文用已育樣本作為估計值下界(Lower bound)的穩健性分析思路也值得借鑒。
作為重要的經濟社會變量,教育可能會通過多種機制影響女性的生育數量。但從理論層面來說,教育到底會增加還是減少生育孩子數量是不確定的。首先,教育會通過提高女性在勞動市場上的(潛在)收入來影響生育數量:總效應取決于替代效應與收入效應的大小。替代效應是指教育水平更高的女性在勞動市場上的潛在收入更高,生育孩子所面臨的機會成本更高。[10-11]因此,替代效應會使教育對女性生育數量產生負向影響。收入效應是指高等教育水平女性在勞動市場上的收入提高,使其更容易負擔起養育小孩的費用,如果孩子是正常商品的話,會增加生育孩子的數量。另外,Behrman 和Rosenzweig 以及McCrary 和Royer 指出這種收入效應會因為婚姻的同質性匹配而增強,從而產生女性教育水平對家庭收入的乘數效應。[20-21]而Becker和Lewis則認為收入效應也會因為偏好孩子的質量而不是數量(Quantity-Quality tradeoff)而被削弱。[22]
其次,Grossman、Rosenzweig 等發現教育可能還會通過學習效應影響女性的生育數量:教育水平更高的女性往往掌握更多的避孕和生育健康方面的知識,或者是獲取相關知識的能力更強,從而會更有效控制生育,因此主要是負向影響。[23-24]
再次,還有一些研究從婚姻機制和個人價值觀念方面進行了分析。婚姻機制的影響是指在不存在非婚生子的情況下,教育水平通過影響結婚的可能性進而影響生育數量。一方面,Becker 發現教育可能降低女性的最終結婚率,[10][25-26]而Oppenheimer則發現教育也可能增加女性的結婚率。[27-29]還有一些研究比如Rindfuss 等認為教育水平會更多地給女性灌輸一種非家庭角色的個人價值觀,比如鼓勵女性去追求個人的職業發展,在個人職業中實現自我價值等,從而影響女性的生育數量。[30]
最后,Black 認為由于現代教育都是在學校內集中進行的,因此教育會通過禁閉效應(Incarcera?tion effect)推遲初育年齡、壓縮可供生育的生理周期,從而降低生育數量。[12]而Monstad等研究這種負向影響后期可能會消失,高教育水平女性在畢業以后會進行生育追趕。[31]
翟振武、劉雯莉及朱州、趙國昌發現:在我國,相對于高中學歷女性,接受過大學教育的女性雖然結婚要推遲,但仍然維持著非常高的終身結婚率。因此,婚姻機制的途徑是不存在或者影響極小。[17-18]學習效應也應該不大,本文的對照組(高中學歷的女性)基本的避孕和生育健康知識應該不會與接受過高等教育的女性有顯著差異。因此在我國高等教育應該主要是通過收入或者價值觀影響女性的生育數量。
近年來,陸續也有一些國外學者開始實證分析教育對生育數量的影響。但已有的實證研究也沒有給出一致的結論。總的來說,在生育轉型較慢、生育水平較高的發展中國家(地區)多發現負面影響,[32-33]在歐美等發達國家(地區)多發現沒有影響甚至是正面影響。[21][34-35]但也有例外,比如Fort等發現教育水平的提高對英國女性的生育數量是負向影響,而在歐洲大陸國家則無負面影響。作者給出的解釋是相對于歐洲大陸,英國的生育轉型進行的更慢,而且市場提供的孩子照料服務和相關的政府政策并不太友好,從而降低了生育數量。[36]總的來說,教育對生育的影響受到生育轉型水平、政府和市場對女性生育的友好程度等因素的影響。
就中國而言,目前我國并沒有像北歐等國家一樣提供讓女性兼顧家庭和事業的環境,過去40多年的計劃生育政策使我國大部分地區的育齡婦女已經提早完成了生育行為的轉型,生育數量下降到極低水平。另外一方面我國目前仍然保有比較傳統的婚育觀念,我國女性的結婚率依然非常高,對于絕大多數家庭來說,至少生育一個孩子是普遍的觀念,不育主義者所占比例還是非常小。在這樣一個女性不容易平衡家庭與事業、又保有一定傳統生育觀念的發展中國家,研究高等教育對女性生育數量的影響就顯得尤為必要。另外,20 世紀90 年代以來我國育齡女性中接受高等教育的比例快速上升,這一巨大的變化對我國的生育水平產生了怎樣的影響,都需要相應的量化分析。[13][37]
雖然近年來也有少量學者開始關注教育對生育數量的影響,但要么僅限于簡單的描述統計分析,要么研究集中于低學歷群體,比如楊振宇、梁秋生等人的研究。[13][37]本文將借助于2015 年1%人口抽樣調查的大樣本數據,通過提高女性的起始分析年齡到30 歲以上的已婚樣本來消除面臨的生存數據結構問題;用1999 年高校擴招政策和各省高等教育資源稟賦所帶來的高等教育入學機會在出生隊列和省份上的雙重外生差異構造高等教育的工具變量,用IV-Poisson 模型估計高等教育對我國女性生育數量的影響。
如前所述,在估計高等教育對女性生育數量的影響時會同時面臨內生性問題與生存數據結構問題。職業理想、能力等遺漏變量會同時影響女性的教育和生育數量。本文參照Duflo、Ou以及侯玉娜和鄧寧莎等人的思路①侯玉娜和鄧寧莎也采用了Duflo的思想來構造各省高校擴招政策強度變量。與本文略有差異的是,其計算方式是1999年及以后各年該省當年普通高等教育招生人數與1998 年該省普通高等教育招生人數之差與當年該省高中畢業生人數之比。本文是直接計算的高等教育入學機會相比于1998年的增加值。,[14-16]借助1999 年高校擴招政策強度在個人出生隊列和戶籍所在省份的雙重外生差異,同時還利用各個省份本身的高等資源稟賦導致的高等教育入學機會差異來構造個人高等教育的工具變量。其中各省歷年的高等教育入學機會用各省當年普通高等學校招生人數與普通高中畢業生人數之比來衡量。在各省高考錄取率數據缺失的情況下,這也是文獻中的常用辦法。個體受到的擴招政策強度是本文構造工具變量的關鍵。這既取決于個體參加高考的年份,還取決于參加高考時的戶籍所在省份的擴招強度。本文用1999 年及以后各省歷年高等教育入學機會減去該省1998年的對應數值,得到該年該省的高校擴招強度,并將1998年之前的擴招強度認定為0,構造出高校擴招政策強度變量。實際上,雖然1999年全國各省份都施行了大學擴招,但各省份在高等教育入學機會的擴招強度上存在較大的差異。根據本文的計算,擴招強度較小的西藏、寧夏、青海等省區,1999-2003 年高等教育入學機會年平均增加值在0.06~0.26 之間,而擴招強度較大的北京、天津等地則在0.35~0.67。因此,即便是同一隊列的高中畢業生,因為戶籍所在省份的差異,也可能會出現巨大的政策處理強度差異。在具體估計的時候,我們將構造出來的高校擴招政策強度變量及高考對應年份對應戶籍省份的高等教育入學機會作為高等教育的工具變量解決面臨的內生性問題②我們沒有直接用擴招政策強度變量作為IV是因為目前還沒有文獻能夠準確測量國內各省的高等教育入學機會。本文所用的各省當年高等院校入學人數與普通高中畢業生人數之比只是一個替代變量,會在一定程度上影響其作為工具變量的相關性。因此,在工具變量中還加入了各省當年高等院校入學人數與普通高中畢業生人數之比,作為各省存在的高等教育資源稟賦差異,有助于防止出現弱工具變量問題。。由于2015年1%人口抽樣調查數據中并沒有參加高考的年份信息,本文用其19歲時年份作為對應高考年份,這也符合我們的學制和前面的相關研究③本文用CFPS、CGSS中具有高考年齡信息的數據庫都一致發現將高考年齡確定為19歲是更為合理的。。來自2015年1%人口抽樣調查數據顯示:從1980年出生隊列開始,女性中大學占比出現跳躍性上升,說明將19歲時對應年份作為高考年份是合理的。另外,由于該數據中并沒有給出參加高考時的戶籍省份,本文用當前戶籍所在省份進行代替④當然會有戶口跨省份遷移的情況,但相對于全國的樣本,占比較小,后面穩健性檢驗中有專門針對此問題的討論。。
生存問題是指在觀測時點,一些女性還比較年輕,這個時候即便觀測到該女性沒有生育孩子或者只有一個孩子,不代表以后終身都不會生育孩子或只有一個孩子。這也是當前國內生育相關的實證文獻比較少的主要原因。除非樣本中的所有女性都已度過生育窗口期,否則這個問題不能完全解決,但是通過對年齡進行一定的限制可以緩解這個問題。圖3給出了2015年時20-40歲女性分年齡隊列的平均生育變動情況。如圖3所示,在假設各個相鄰年齡隊列的生育水平趨勢具有一定可比性情況下,在30 歲及以前,隨著年齡隊列的上升,平均生育水平有較大幅度上升。而在年齡隊列到達30 歲以后,這種上升幅度大大減小。到了33 歲時基本就穩定下來,隨著年齡增加的幅度極小。因此,在實證分析中將只選用30 歲以上的樣本,有助于克服生存分析問題。在穩健性分析中,我們還將起始年齡從31 歲上升到32 歲、33 歲,以盡量降低生存分析問題帶來的影響。當然,我們也不能引入年齡太大的樣本,這樣會降低不同年齡出生隊列所受政策差異的影響。因此最終本文將分析樣本確定為31-40歲。

圖3 高中和大學學歷女性分年齡隊列平均生育水平變動趨勢
另外,本文還將分析樣本進一步限定為已婚狀態。主要是近年來我國婚姻推遲現象十分明顯。另外一方面我國各學歷女性的最終結婚率仍然很高。上大學只是延遲了女性的婚姻,并沒有顯著降低其最終結婚率。[17-18]婚姻機制在我國不存在或者影響極小。實際上,31-40歲的大學與高中學歷女性在已婚狀態上非常接近。31-40 歲大學學歷女性目前處于已婚狀態(排除未婚、離異和喪偶)的女性占比為90.04%,高中學歷女性的對應占比為92.17%。兩者差異僅在2%左右。在穩健性分析部分,我們將樣本限定為33-40歲,該樣本中,高中與大學學歷女性的結婚率僅有1.44%的差異。而且本文也對全樣本進行了分析,在控制住婚姻狀態以后,估計系數基本一致。而婚姻推遲會導致暫時未生育情況,也會帶來生存分析問題,[1]因此在基準樣本中我們僅包括已婚女性。
傳統上關于生育數量或者說生育率的研究多采用匯總數據,[38-40]但是這種方法不能控制個體微觀特征上的差異。由于本文的被解釋變量是生育數量,這是一個非負整數,普通的線性模型可能會存在一定的問題。而Poisson 回歸作為一種計數模型,就是為了分析因變量是非負整數而出現的統計模型。[41]本文中的因變量(已生育小孩數量)恰恰屬于這種類型,因此特別適合微觀層面上對生育率的研究。[41]具體地,假設生育數量(N)i服從Poisson分布:

進一步地,Poisson回歸假設:

由于在Poisson 分布中,E(Ni|λi)=λi,這意味著E(Ni|λi)=exp(γ'xi+πEdui)。如果教育程度采用受教育年限度量,則:

即100×π是如果教育程度增加1 年生育數量增加的百分比。如果教育程度用是否上大學的類別變量度量,則:

基于泰勒近似可知上式近似等于π,即相比于高中畢業生,大學畢業的女性的生育數量大約會增加100×π個百分比。
當我們在方程(2)中引入誤差項ui,模型進一步擴展為:

如果ui與個人的教育程度相關,即E[ui|Edui]≠0,比如事業心強、能力強的女性的受教育程度會更高,同時也會選擇生更少的孩子,此時E(Ni|λi) ≠exp(γ'xi+πEdui),并且Poisson 回歸的估計是有偏的。與線性模型類似,這種情況下我們也需要為自變量尋找工具變量(記為zi),采用IV-Poisson模型來估計參數。此時工具變量需要滿足的條件為:E(ui|zi)=0,該條件可以進一步寫為:

上述條件可以推導出如下的矩條件:[42-44]

在本研究中,我們用高校擴招、各省高等教育資源差異以及二者交互項作為IV-Poisson 模型中教育程度的工具變量。
本文所用數據是2015年全國1%人口抽樣調查個人微觀樣本數據。2015年全國1%人口抽樣調查實際完成2 131 萬樣本,占全國總人口的1.55%。隨機抽樣了10%的個人微觀樣本提供給研究者使用。本文所用數據樣本量為2 003 563①清華大學數據中心公開的是在總人口的1%樣本基礎上隨機抽取10%形成的。本文所用的樣本量更大。。接下來本文對樣本進行了篩選。首先剔除了男性樣本(剔除1 027 075 個,占總樣本51.26%)。其次,為了解決面臨的生存分析問題,我們只保留31-40 歲之間的女性樣本(剔除832 610 個,占總樣本41.6%)。這里剔除40 歲以上的樣本是為了降低不同出生隊列對生育行為的影響。另外,我們剔除了初中及以下學歷樣本(剔除93 598 個,占總樣本的4.7%),是因為只有高中學歷適合做大學學歷的對照組。根據前面分析,本文還刪除了婚姻狀況缺失樣本(占比0.1%)、戶口登記地址缺失樣本(占比0.003%),保留已婚樣本(占比0.2%),最終剩下43 835個樣本。
表1報告了主要變量的描述性統計結果。相對于高中樣本,大專及以上女性平均生育子女數量要少0.24 個,約減少19%。如果只考慮已育樣本的話,大專及以上女性的平均生育子女數比高中樣本少0.22 個。說明樣本中平均生育子女數量的差異主要不是來自大專及以上女性更多存在未生育情況。大專及以上樣本的年齡要略低于高中及以上樣本,這主要是因為1999 年擴招以來我國大學生的比例迅速增加。因此,越年輕的隊列中大學生的比例越高。另外,在非農勞動比例上,上過大學的女性要顯著高10個百分點,這說明上大學可能會通過勞動市場參與影響生育水平。

表1 主要變量的描述性統計
表2報告了生育數量分布的比較。在全樣本中,僅有8%的女性還沒有生育,可見本文通過將樣本年齡控制在31-40歲并限定為已婚樣本,有助于減輕刪失數據結構帶來的影響。約70%的女性生過一個孩子,22%的女性生過2個及以上的孩子。從表2還可以看出:大專及以上和高中學歷的女性在生育數量分布上的差異主要體現為在生育二孩及多孩的比例上。在大專及以上教育程度的樣本中,只有12%的女性育有2個及以上子女,而高中學歷女性這一數值為30%。截至調查時點,這兩種學歷女性在是否已經生育上僅僅略有差異:在大專及以上教育程度的樣本中,大約10%的女性還沒有生育;而高中學歷女性這一數值為7%,僅僅相差3 個百分點。總的來說,從表2 可以看出,大專及以上和高中學歷女性在生育數量上的差異主要表現為少生,不生的差異較小。

表2 生育數量分布比較
1.高等教育對生育數量的影響
表3 給出了高等教育對生育數量的影響。其中第1、3 列分別是Poisson、IV-Poisson 模型的估計結果,第2、4列分別是OLS、2SLS模型的估計結果。由于OLS模型不適合本文的數據結構,其回歸結果是不可信的。因此本文的所有分析都以Poisson 和IV-Poisson 模型為準。放入OLS和2SLS回歸結果是為了與Poisson 和IV-Poisson 模型回歸結果進行對比。正如前面所討論的,這里將樣本控制在31歲到40歲,共10個出生隊列。既有助于減弱刪失數據結構帶來的影響,也能保證分析樣本不摻雜過多隊列,減少隊列差異帶來的影響。

表3 上大學對女性生育數量的影響
從估計結果可以看到上大學確實顯著降低了女性的生育數量。第1 列Poisson 模型的回歸結果表明在不考慮內生性的情況下,相對于高中學歷女性,上大學使得女性的生育數量顯著降低13%。在考慮內生性問題后,第3 列IV-Poisson 模型的估計結果表明上大學使得女性的生育數量顯著下降40%。本文的一階段回歸F值為78,說明我們的工具變量構造是有效的。通過對比第1 列與第2 列的結果,我們發現OLS模型比Poisson 模型估計出來的上大學對女性生育數量的負面影響要大,2SLS估計出來的負面影響也比IV-Poisson要大。回歸結果也證實用OLS模型是不合適的。
2.穩健性分析
由于我們的估計系數對于解釋和預測未來我國的生育變動趨勢非常重要,有必要對系數進行更為準確的估計,為此我們進行了穩健性分析。進行穩健性分析的思路有三個方面:
第一,進一步提高樣本起始分析年齡,降低生存數據結構問題對估計結果的影響。正如前面對圖3 的分析:如果將分析樣本的起始年齡從31 歲提高到32 歲、33 歲,有助于進一步降低生存數據結構問題對估計值的影響,有助于準確估計。第二,采用其他的工具變量進行穩健性分析。采用侯玉娜和鄧寧莎構建高校擴招政策強度的方法。[16]在構建各省歷年高等教育擴招強度變量時,不是計算高等教育入學機會的增加值,而是計算高中畢業生所獲得的生均擴張名額。即將1999 年及以后該省高等教育招生名額減去1998年的名額,然后除以當年高中畢業生人數,并將1998年及以前的數值設定為0。從而構造出個體受到的高校擴招政策強度變量。在具體回歸中將按照侯玉娜和鄧寧莎的方法[16]計算出來的政策強度變量與高考對應省份當年高等教育入學機會作為高等教育的新工具變量(稱為IV2,以前的稱為IV1)。
兩種穩健性分析的結果如表4 所示:其中第1、2、3 列是原來的工具變量(IV1)的估計結果,所分析樣本是31-40 歲、32-40 歲、33-40 歲,而第4、5、6 列則是新的工具變量(IV2)的估計結果。所用模型都是IV-Poisson。從表4 的結果可以看出在將起始年齡提高和采用不同的工具變量后,估計結果仍然是穩健的。而且在將起始年齡提高到33 歲以后,我們最終的估計系數穩定在-0.3 左右。由于起始年齡設定為33歲,能進一步降低生存分析問題對估計系數的影響,因此本文把-0.3作為準確的估計值:即相對于高中畢業生,上大學讓女性生育數量下降了30%左右。

表4 上大學對女性生育數量影響的穩健性分析
雖然以上兩種方式已經在保證工具變量有效性的前提下,受到擴招政策影響的第一代女性在2015年人口普查時最大年齡才35歲,盡可能地降低了生存分析問題帶來的影響(起始分析年齡提高到33 歲),但很難說生存分析問題已經被完全消除。為了盡力排除這種擔憂,本文還借助于另外一種穩健性分析的思路:采用下界(Lower bound)穩健性分析思路。具體做法是將分析樣本限定為已育女性。根據基本理論和經驗事實可以知道:大專及以上女性出于生育機會成本以及生育觀念的原因,有更大的概率出現暫時或者終身生育為0 的情況,因此,當分析樣本限定為已育樣本時,對大專及以上女性的平均生育水平會有相對更大的提升效果,兩種學歷之間的生育差距會有所縮小。這點可以從前面表1 中得到證實:當采用已育樣本時,大學與高中學歷女性的平均生育數量差距從0.24下降到0.22。因此,采用已育女性樣本所估計出來的效應應該要比前面的估計值要小,即相當于前面估計值的下界。如果估計值的下界是顯著的,可以證明估計值本身是穩健的。
表5給出了用已育樣本估計出的上大學對女性生育數量影響。表5的結果證實了我們前面的猜測。在將樣本限定為已育女性后,估計系數絕對值為0.2左右,確實比前面對應的估計結果要小。從表5 的估計結果可以看到,即便估計出來的結果是影響效應(絕對值)的下界,這個效應也是顯著為負的。從而證明我們前面的估計結果是穩健的:上大學確實顯著地降低了我國女性的生育數量。

表5 上大學對女性生育數量影響的穩健性分析(已生育樣本)
另外,本文用女性當前的戶口所在省份作為其高考時的戶口所在省份,可能會存在讀完大學以后戶口遷出的情況。也是就說要排除那些跨省流動概率較高的樣本。為此,我們只保留在本地住滿5 年的本地戶籍人口或者在本地住滿5 年的本省流動人口,這樣來排除那些跨省流動概率較高的樣本。在排除那些跨省流動概率相對較大的樣本后,本文的估計結果仍然是穩健的(限于篇幅,此處未展示)。
3.上大學讓女性不生還是少生?
前面的實證分析結果表明上大學確實能顯著降低我國女性的生育數量。那么這種差異主要表現為不生還是少生?具體來說上大學對生育數量的負面影響是表現為不生育概率更高?還是會進入生育但生育二孩及多孩的概率更低?為此,表6 給出了上大學對女性不生育子女以及生育二孩及多孩概率(限定為已進入生育樣本)的影響。由于Stata 中IV-Probit 命令不適合離散內生變量,而OLS 和2SLS 同樣可以獲得系數的一致估計。因此,表6 給出了OLS 和2SLS 的估計結果。從估計系數來看,上大學讓女性不生育的概率增加了15%,但不顯著。而上大學讓已育女性選擇生育二孩及多孩的概率顯著下降23%。即上大學會顯著降低步入生育女性選擇生育二孩及多孩的概率。在我們將樣本的起始年齡提高到32 歲、33 歲后,上大學對不生育概率的估計系數下降到0.05 且依然不顯著;上大學對生育二孩及多孩的概率的影響系數仍為20%左右,而且在1%水平上顯著(限于篇幅,此處未展示)。可以說,上大學對女性生育的負面影響主要體現為少生,而并非不生。這也與前面表2的描述統計結果相符。

表6 上大學對女性不生和少生概率的影響
4.機制分析
根據前面的分析,在我國上大學主要會通過機會成本、改變女性價值觀念等機制影響女性的生育數量。2015年人口小普查數據詢問了女性勞動市場參與情況。與以往研究的結果類似,本文也發現上大學顯著提高了女性的勞動參與率(限于篇幅,此處未展示)。更高的勞動參與率意味著高等教育女性生育小孩的機會成本更高。在當下的中國勞動市場,缺乏足夠的讓職場女性更好地平衡事業發展與家庭照料的政策支持。構建生育友好型社會可能有助于縮小高等教育女性與高中學歷女性的生育水平差異。
5.小結
總的來說,前面的分析發現女性接受高等教育確實會顯著降低生育數量。背后的機制包括上大學會提高女性的勞動參與的概率,這主要體現為生育的機會成本機制。當然還可能存在價值觀念等機制,比如上大學對女性生育數量的負面影響主要體現為少生,這與傳統的多子多福的觀念是不同的,但基于現有數據我們無法進一步探討其他可能的影響機制。
1990年以來我國育齡女性的總和生育率持續下降,目前我國生育數量已遠低于更替水平。與此同時,我國育齡女性中接受過高等教育的比例持續提高。本文嘗試從高等教育角度對20 世紀90 年代以來我國生育數量的轉變進行解釋。借助于1999年高校擴招政策和各省高等教育資源稟賦帶來的高等教育機會在出生隊列和區域上的雙重外生差異,構造了高等教育的工具變量,并通過將分析樣本限定為30歲以上的已婚女性來克服面臨的生存數據結構問題,并使用IV-Poisson模型量化分析了高等教育對生育小孩數量的影響。估計結果顯示女性上大學對生育數量有顯著的負面影響。相對于高中學歷女性,上大學使得女性的生育數量平均下降30%左右。而且這種負面影響主要體現為讓女性生育二孩及多孩的概率大幅下降,即讓女性少生而非不生。本文發現上大學會通過提高女性勞動市場參與率這種機制影響女性的生育數量。
那么,如何看待我們的估計結果?首先,高校擴招導致的我國育齡女性隊列中的高等教育比例提高是近年來我國生育水平下降的重要原因。根據IV-Poisson 模型的估計結果,上大學使得女性的生育數量平均下降30%左右。在全面二孩政策已經全面實施,計劃生育政策已經不再是阻礙我國生育水平的重要因素的條件下,育齡女性中接受高等教育比例的大幅上升會成為導致我國生育水平下降的最重要因素之一。其次,要準確量化分析上大學對生育數量的影響,需要同時考慮內生性問題和生存數據結構問題。要解決這兩個問題,需要使用個人微觀大樣本數據。對于內生性問題,現有文獻多用1999年開始的高校擴招來解決,但這要求分析樣本中有一定比例擴招后參加高考的樣本,但并非所有受到擴招影響的樣本都可以包括進來。在分析的時候,要根據我國不同年齡隊列女性的平均生育變動趨勢合理確定樣本起始分析年齡,既保證有足夠多的受到擴招政策影響的樣本(工具變量的有效性),又能盡量降低生存數據結構問題對估計結果的影響。
本文的貢獻有三點:第一,本文對高等教育影響女性生育率的量化分析,有助于從高等教育發展的角度理解20 世紀90 年代以來我國生育水平的變動趨勢。第二,以往傳統的關于高等教育的文獻多關注教育帶來的貨幣收益,近年來有少量文獻開始關注教育產生的非貨幣收益,本文通過探究上大學對生育數量的影響豐富了這類文獻。第三,本文用2015年人口小普查個人樣本數據的大樣本,通過控制所用年齡隊列,大大降低生存數據結構問題帶來的影響。當然本文還存在著一些不足之處,比如由于沒有被訪者關于婚育價值觀念、個人收入等方面的信息,無法對影響機制做全面的分析。
總的來說,在女性生育行為模式上,我國與發達國家(地區)既有相同點也有不同點:相同點是都完成了初育推遲、生育數量低于更替水平的生育轉型。不同點在于:在我國傳統生育觀念依然發揮著比較大的影響,已婚家庭對生育一個孩子的需求依然很高,終身不婚不育的女性比例很低,這可能是我國相對于歐美國家存在的生育潛力。本文發現高等教育確實是造成生育數量下降的重要原因。女性教育水平的提高絕對是社會進步的推動因素,而且我們也會預期到中國女性的教育水平會進一步提高。因此,進一步研究高教育程度的女性生育時面對哪些成本和顧慮,只有了解她們對孩子的需求,才能推出更有針對性地緩解我國生育率下降的政策。