摘要:(中)摘要根據總和生育率與出生率確定性函數關系,利用國家統計局人口統計數據,分別計算了四種出生人口數據漏報模式下總和生育率與出生率的關系系數。并與官方公布數據(有數據漏報)情況下估算的關系系數進行對比分析,發現雖然出生數據漏報對總和生育率和出生率有明顯的影響,但是對總和生育率與出生率關系系數影響很小,可以忽略。因此,可以認為出生人口數據漏報對總和生育率與出生率具有同等的影響,而對兩者之間的關系系數沒有影響。并利用不受數據漏報影響的K值,估算出中國1990年以來的總和生育率,研究結果是官方和非官方都可以接受的生育水平。最后,文章還對今后的研究方向提出了建議。
關鍵詞:(中)關鍵詞數據漏報;總和生育率;出生率;函數關系;人口統計
中圖分類號:(中)中圖分類號C921文獻標識碼:A文章編號:1000-4149(2019)01-0001-13
DOI:10.3969/j.issn.1000-4149.2019.01.001
一、問題的提出
出生率和生育率是反映人口生育水平的兩個常用指標,出生率也稱為粗出生率,它的優點是資料容易得到,能夠從官方統計數據中獲得,但是由于受到人口年齡構成和性別構成的影響,不能夠很準確地反映生育水平,難以進行比較研究。生育率通常包括:一般生育率、分年齡生育率、終身生育率以及總和生育率等,通常所說的生育率一般都是指總和生育率。總和生育率是比出生率更好的指標,它能夠準確地反映現有生育水平,避免了育齡婦女構成的影響,可以直接用于比較研究,是最具有代表性的人口統計指標,具有直觀、易理解的特點。在社會相對穩定的情況下,總和生育率可反映婦女生育率變化的趨勢。但是除了普查年及小普查年,人們很難獲得總和生育率的數據,而官方可以通過每年一度的人口變動抽樣數據估計出歷年的出生率數據。如果能夠建立總和生育率與出生率之間的確定函數關系,就可以利用公布的出生率數據估計每年各個地區的生育率數據。我們曾經給出過總和生育率與出生率有確定性函數關系:總和生育率(β)=出生率(CBR) /常數(K),即β=CBR/K[1],再根據人口統計數據估計出K值,這樣如果已知出生率,就能夠在K值給定的情況下估算出歷年的總和生育率。
然而,自20世紀90年代以來中國出生人口漏報是一個很普遍的現象。這可能會導致對K值的估計不準確,進而會影響到使用出生率對總和生育率所進行的估計。本文的目的就是在假定出生人口存在漏報的情況下,分析漏報對K值的影響,最終來判斷利用出生率來估計總和生育率的有效性[1-4]。
二、以往研究的回顧
長期以來,出生人口數據漏報一直困擾著中國的人口學者,用漏報的出生人口數據計算出來的總和生育率與出生率總是不準確的,為此,人口學者嘗試著利用各種間接數據來研究中國的總和生育率和出生率。關于出生人口數據漏報對生育率影響的研究文獻很多,根據數據處理方法和來源的不同,可以分為三類不同的研究。一類是假定普查數據是可信和準確的,直接利用普查數據估計總和生育率,這類得到的結果是最低的,認為自2000年以來中國的總和生育率不超過1.5[5-7]。第二類研究對普查數據提出質疑,通過各類方法調整后,再進行總和生育率的估計,由于使用的調整和估計方法不同,估計的結果也存在較大的差異,估計的總和生育率水平在1.42—1.75[8-11]。第三類研究利用教育數據、公安數據等其他系統數據來校對、調整普查數據,進而估計總和生育率,估計的生育率水平在1.6—1.7[12-14]。也有學者采用其他方法對生育率水平進行估算,比如,陳衛、楊勝慧采用布拉斯(Brass)提出的生育率間接估計P/F比值方法,對中國2010年的總和生育率進行間接估計,得到的結果為1.66[15];陳衛、張玲玲利用普查同隊列人口的比較計算,估算出2005—2010年間的生育水平基本上在1.5以上[16]。研究出生人口數據漏報的學者,主要有孫學禮和秦凱世,張廣宇和原新,夏樂平,郭志剛等[12,17-19],其中郭志剛和夏樂平具體給出了育齡婦女分年齡別的出生人口數據漏報說明和各個年齡別出生人口數據漏報的比例[12,19]。
不同于已有文獻關注于調整出生人口和育齡婦女人數來估計生育水平的方法,本文通過研究在有出生人口數據漏報情況下,總和生育率與出生率確定性關系系數的穩定性,并利用不受出生人口數據漏報影響的關系系數K值,對1990年以來的中國人口生育率給予大致的估計。
三、數據和方法
二級標題1.數據來源及預處理
本研究所采用的年平均總人口數、分年齡別育齡婦女人數和每年對應的分年齡別出生人口數(活產數)取自國家統計局《中國人口年鑒》、《中國人口統計年鑒》和《中國人口和就業統計年鑒》,共獲得了1986年到2015年近30年的數據。經過對數據進行處理
由于早期的統計數據沒有經過信息化處理,不是電子數據,本文作者花費大量時間把紙質的統計數據完全電子化,為后續的研究分析創造了條件,在此要特別感謝周小青、秦雪姣同學的大力幫助。,獲得了可以用來計算總和生育率與出生率函數關系系數的數據:得到分年齡別婦女人數、分年齡別活產數、年平均總人口數、分年齡別育齡婦女結構數據、分年齡別生育率數據、分年齡別標準生育模式數據。
通過上面的公式(10)能夠清楚地發現,影響K值的主要因素是分年齡別出生人口數(分年齡別活產數)、分年齡別育齡婦女人數以及平均總人口數。在計劃生育政策的影響下,會出現一定程度的出生數據漏報,并可以表現為分年齡別出生人口數(分年齡別活產數)的漏報。人口漏報主要集中在0—9歲的少年兒童階段,由于上學申報戶口等原因,漏報的人口隨著年齡的增長會逐步補報,而15—49歲育齡婦女漏報很少,其漏報率只有0.159%,這個漏報情況對地區育齡婦女總和生育率的影響很小,可以忽略[20];即使在出生人口漏報嚴重的20世紀90年代,人口漏報也不超過10%,國家統計局對1993年和1994年人口變動情況進行了抽樣調查,發現1993年和1994年人口漏報率分別為6.9%和6.4%[21],而人口出生率漏報也多是在5%以下[22],漏報的出生人口對總人口數量的影響微乎其微,也可以忽略。因此在數據漏報對總和生育率與出生率確定性函數關系影響研究中,不考慮分年齡別育齡婦女人數和平均總人口數這兩個變量的變化[20-28]。
本文主要研究出生人口數據漏報,特別是分年齡別出生人口數(分年齡別活產數)的漏報對K值的影響。
3.研究方法
為了便于研究,本文把分年齡別出生人口數(活產數)漏報對K值的影響分為四種模式。
(1)每個年齡別的出生人口數成比例漏報。舉例說明,對15,16,…,48,49等35個育齡婦女年齡段的出生人口數(活產數),假定每個年齡段漏報的出生人口數都具有相同的比例,比如都是30%,則每個年齡段漏報前的出生人口數(活產數)B1x=Bx*130%,然后用漏報前的出生人口數(活產數)作為該年齡別的出生人口數(活產數),代入K值計算公式估算K值,再對計算結果進行分析。
(2)每個年齡別漏報的出生人口數據固定。舉例說明,對15,16,…,48,49等35個育齡婦女年齡段的出生人口數(活產數),假定每個年齡段都漏報1000個活產,則每個年齡段漏報前的出生人口數(活產數)B2x=Bx+1000,然后用漏報前的出生人口數(活產數)作為該年齡別的出生人口數(活產數),代入K值計算公式估算K值,再對計算結果進行分析。
(3)每個年齡別漏報的出生人口數據沒有規律,每個年齡別漏報人數不確定,而是隨機漏報。舉例說明,對15,16,17,…,48,49等35個育齡婦女年齡段的出生人口數(活產數),假定每個年齡段漏報的出生人口數都不一樣,也沒有規律,假定按照隨機函數RAND()的50%比例漏報,則每個年齡段漏報后的出生人口數(活產數)B3x=Bx+Bx*RAND()/2,漏報前的出生人口數在Bx(官方公布的數據)和1.5Bx之間隨機變化,(隨機函數RAND()返回大于等于 0 且小于 1 的均勻分布隨機實數,每次計算工作表時都將返回一個新的隨機實數,這里用隨機函數RAND()來產生隨機數據),然后用漏報前的出生人口數(活產數)作為該年齡別的出生人口數(活產數),代入K值計算公式估算K值,再對計算結果進行分析。
(4)根據已有文獻關于育齡婦女分年齡別出生人口漏報分布,研究出生人口漏報對K值的影響。根據文獻的論述,40歲以上育齡婦女生育已經極少,因此在研究漏報對K值的影響時,這個年齡段的漏報可以忽略。15—19歲及35—49歲兩個年齡段育齡婦女,占整個生育群體的比例從1980年的12%逐步減少到5%,他們對整個生育率的影響是有限的,在研究漏報對K值的影響時也不予考慮,而20—34歲是高生育率年齡段,該年齡段出生人口數據漏報對總和生育率、出生率及K值的影響最大,這個年齡段出生人口數據漏報是研究的重點。根據文獻的研究結果,由于官方制定的晚婚晚育的限制,導致20歲、21歲和22歲育齡婦女出生人口漏報問題嚴重,漏報比例分別達到63%、28%和18%,而進入可以生育第一胎的23—26歲年齡的育齡婦女群體,漏報情況很少。進入27歲的年齡段,由于進入第二胎生育期,漏報的數據再次升高,在27—34歲的年齡段漏報的數量超過20%[12,19,24-25]。
本文首先利用已知年份的出生人口數、婦女人數和總人口數,求出官方公布數據下的K值,然后再把該年份的出生人口數作為有漏報的出生人口人數,分別采用上述四種模式的數據漏報方法獲得漏報前的出生人口數,并用漏報前的出生人口數代替原來的出生人口數,利用K值計算公式分別求出四種出生人口漏報模式下的K值,再用四種漏報模式下求出的K值與官方公布的數據(有數據漏報)下求出的K值進行對比分析,研究四種出生人口數據漏報對K值的影響程度。
四、結果與討論
在下面的討論過程中用到的一些變量,在這里分別作如下的定義說明:Bx表示官方公布(有漏報數據)的活產數;B1x代表每個年齡別出生人口數成比例漏報前的活產數;B2x代表漏報了固定出生人口數前的活產數;B3x代表隨機漏報了出生人口前的活產數;B4x代表根據已有文獻漏報了出生人口前的活產數;fx表示官方公布數據情況下的分年齡別生育率;fx1表示成比例漏報下的分年齡別生育率;fx2表示固定漏報情況下的分年齡別生育率;fx3表示隨機漏報下的分年齡別生育率;fx4表示根據已有文獻漏報比率下的分年齡別生育率;hx表示官方公布數據下的標準生育模式;hx1表示成比例漏報下的標準生育模式;hx2表示固定漏報下的標準生育模式;hx3表示隨機漏報下的標準生育模式;hx4表示根據已有文獻漏報比率下的標準生育模式;K表示官方公布數據下的總和生育率與出生率關系系數;K1表示成比例漏報情況下的系數;K2表示固定漏報情況下的系數;K3表示隨機漏報情況下的系數;K4表示根據已有文獻漏報比率情況下的系數。
根據K值計算公式(10),在平均總人口P和分年齡別育齡婦女Wx沒有漏報的情況下,即可以把公式中的P和Wx看作固定值?,F在只研究出生人口數漏報,也即分年齡別出生人口數漏報對K值計算結果的影響。本文利用國家統計局《中國人口統計年鑒》和《中國人口和就業統計年鑒》獲得了1986年到2015年近30年的人口統計數據,并對每一年的數據進行了分析處理。首先利用上述數據求出每一年的K值,然后,分別針對四種數據漏報模式,求出四種漏報情況下的K值,并對填補了漏報數據求出的K值與官方公布數據(有漏報數據)情況下求出的K值進行比較分析,研究數據漏報對K值的影響。通過對每一年數據的研究分析,發現每一年數據漏報對K值的影響是一致的。為了能夠清楚地展示研究過程,下面以1995年和2015年兩個年份的研究過程為例,展示分析出生人口數據在四種漏報模式下,數據漏報對K值的計算結果的影響。
1.成比例漏報情況下K值的穩定性研究結果與分析
1995年官方公布數據情況下,K值的計算過程及計算結果參見表1。
五、歸納和總結
有關20世紀90年代以來中國生育水平的學術研究中,數據質量問題成為研究中國生育水平的關鍵問題。在眾多的研究中,有關生育率水平的探討主要通過兩大類方法來處理。一類是調整出生人口數據,通過考察各類調查、普查數據之間的關系,調整、回推出生人口數據;或者利用教育、公安等其他系統數據,通過校對、調整出生人口數。另一類是采用一些對普查數據質量要求較低的計算方法,比如采用生育率間接估計的P/F比值方法、變量r方法等。
不同于已有研究關注于出生人口數據質量對生育率的影響,本文從總和生育率與出生率確定性函數關系系數入手,研究出生漏報對關系系數K值的影響,研究發現數據漏報對K值的影響很小,足以忽略,從而可以利用人口統計數據求出K值,并利用官方公布的出生率估算出每年的總和生育率數據,本研究提供了一種利用人口統計數據計算生育率的新方法,可以計算出每一年的生育率數據,計算結果是官方和非官方都接受的生育水平。
K值隨著時間的變化規律,以及與K值有關的標準生育模式hx的變化規律是今后需要進一步研究的問題。
(致謝:作者感謝安徽農業大學教授徐俊博士在論文撰寫過程中給予的支持!)
參考文獻:
參考文獻內容
[1]喬曉春,朱寶生.如何利用(粗)出生率來估計總和生育率?[J].人口與發展,2018(2):65-70,100.
[2]CAMPBELL A A. Manual of fertility analysis[M]. London: Churchill Livingstone,1983:3-10.
[3]ENTWISLE B. CBR versus TFR in crossnational fertility[J]. Demography,1981,18(4):635-643.
[4]佟新.人口社會學[M]." 北京:北京大學出版社,2000:63-93.
[5]郭志剛.六普結果表明以往人口估計和預測嚴重失誤[J].中國人口科學,2011(6): 2-13,111.
[6]郝娟,邱長溶.2000年以來中國城鄉生育水平的比較分析[J].南方人口,2011(5): 27-33.
[7]朱勤.2000—2010年中國生育水平推算——基于“六普”數據的初步研究[J].中國人口科學,2012(4):68-77,112.
[8]李漢東,李流.中國2000年以來生育水平估計[J].中國人口科學,2012(5):75-83,112.
[9]王金營,戈艷霞.2010年人口普查數據質量評估以及對以往人口變動分析校正[J].人口研究,2013(1):22-33.
[10]崔紅艷,徐嵐,李睿.對2010年人口普查數據準確性的估計[J]. 人口研究,2013(1):10-21.
[11]米紅,楊明旭.總和生育率、出生性別比的修正與評估研究——基于1982—2010年歷次人口普查、1%抽樣調查數據[J].人口與發展,2016(2):12-19.
[12]夏樂平.1979—2000年中國人口生育趨勢:出生數據和教育數據的比較分析[J].人口研究,2005(4):2-15.
[13]楊凡,趙夢晗. 2000年以來中國人口生育水平的估計[J]. 人口研究,2013(2): 54-65.
[14]陳衛.2000年以來中國生育水平評估[J].學海,2014(1):16-25.
[15]陳衛,楊勝慧. 中國2010年總和生育率的再估計[J].人口研究,2014(6):16-24.
[16]陳衛,張玲玲. 中國近期生育率的再估計[J].人口研究,2015(2): 32-39.
[17]孫學禮,秦凱世.出生漏報的癥結及建議采取的措施[J].人口與經濟,1993(1):49-51.
[18]張廣宇,原新.對1990年代出生漏報和生育水平估計問題的思考[J].人口研究,2004(2):29-36.
[19]郭志剛.再論隊列平均子女數不能作為當前總和生育率的估計[J].中國人口科學,2008(5): 26-33,95.
[20]王金營,何云艷,王志成,等.中國省級2000年育齡婦女總和生育率評估[J].人口研究,2004(2):20-28.
[21]賈同金,賽音.人口變動情況抽樣調查現狀與問題分析[J].人口研究,1995(5):28-31.
[22]周夷谷,于麗莎.出生人口數量增多是我國第三次出生高峰的主要內容——兼與查瑞傳老師商榷[J].人口研究,1992(5):25-28.
[23]喬曉春.“單獨二孩”,一項失誤的政策[J].人口與發展,2015(6): 2-6,18.
[24]周皓.我國第四次人口普查漏報情況的重新估計——基于第五次人口普查的分析[J].人口研究,2003(2):36-41.
[25]李若建.歷次人口普查中低年齡組人口漏報研究[J].中山大學學報(社會科學版),2013(2):145-152.
[26]趙夢晗.2000—2010年中國生育水平估計[J].人口研究,2015(5):49-58.
[27]喬曉春.實施“普遍二孩”政策后生育水平會達到多高?——兼與翟振武教授商榷[J].人口發展,2014(6):2-15.
[28]郭志剛.中國的低生育水平及其影響因素[J].人口研究,2008(4):1-12.
[責任編輯方志責任編輯]