石國平,李漢東
(北京師范大學政府管理學院,北京100875)
改革開放以來,中國社會和經濟取得了的巨大發展,加之中國實施的計劃生育政策,使得中國的初婚模式產生了深刻變化,并成為人口學研究的一個重要領域。但現有的對于中國初婚模式的研究,由于受到人口數據的局限,主要集中在平均初婚年齡及其趨勢、夫妻年齡差等方面的分析。已有研究在對初婚模式的分析和測度方面的指標和分析方法也較為簡單,無法綜合考察初婚模式變動的趨勢和不同人口群體之間的差異,特別是對我國城鄉差異以及教育程度差異對初婚模式的影響的研究尚處于空白。本文首先基于觀察數據建立了初婚年齡分布的一般模型,并提出了一種改進的估計初婚年齡分布的方法,然后進行了實證分析,給出了我國25年來初婚年齡分布的變化趨勢,并比較了城鎮鄉人口群體的初婚年齡分布差異以及不同教育程度人口群體的初婚年齡分布差異情況。
自從寇爾(1971)發現人口的初婚模式以來,圍繞初婚模式的研究層出不窮。為改進對初婚年齡分布的估計效果,人們先后提出了許多的改進模型(Kostaki,2009)。但是由于實際人口數據存在一定的誤差,特別是年齡別初婚率往往存在一定的進度效應和隨機干擾現象,所以直接對數據進行擬合并不一定能得到真實的初婚年齡分布。為此,本文提出一個一般的初婚年齡分布模型。
設Y為某一特定人口中觀察到的初婚年齡,且滿足:

其中X是取非負值的隨機變量(可理解為人口的內在初婚年齡),ε是隨機項,且滿足ε~N(μ0,,即若μ0≠0,則存在一個與內在初婚年齡不同的平均進度或擾動效應。這里我們假設X和ε相互獨立。
顯然,Y的分布由X和ε的分布共同決定。在給定X的分布的條件下,Y的分布可通過相互獨立的連續隨機變量和的卷積公式來求出。其一般表達式為:

關于fX(x)的形式,前面已經介紹了多種模型,最近的一個模型是由Peristera和Kostak(i2007)提出的,簡稱之為P-K模型。該模型如下:

其中x代表育齡婦女初婚年齡,c1,μ為參數。當x≤μ,σ(x)=σ11;當x≥μ,σ(x)=σ12。c1描述的是基準初婚水平,它和初婚率有關。μ反應了分布的位置,σ12分別反應了初婚率在峰值前后的分布。
在模型(3)的基礎上,Peristera和Kostaki(2007)提出了可供選擇的另一個模型,該模型可以很好地描述存在兩次初婚高峰的情形,稱為P-K擴展模型,該模型如下:

其中參數μ1、μ2反映了兩次初婚高峰的平均年齡,σ1、σ2反映了兩次初婚高峰的方差,c1、c2反映了兩次初婚高峰劇烈程度。
在給定fX(x)的形式下,通過計算可以給出一些一般的結論。
引理2:若X服從P-K擴展模型,即:

則有:

其中:

從上述結果看,如果初婚年齡分布受到隨機因素的干擾,將使得觀察到的初婚年齡分布非常復雜。但由于觀察到的初婚年齡是相互獨立的內在初婚年齡和隨機擾動項的和,所以可以得到最重要的數字特征,如期望和方差:

這一關系是簡潔的,其中稱EY為樣本均值,EX為擬合均值,DY為樣本方差,DX為擬合方差。因此,在實際中,本文可采用兩步法,即首先對數據進行擬合,并將擬合數據與實際觀察數據分別計算各自的均值和方差;然后將得到的均值和方差分別進行比較,以判斷擬合模型的擬合效果。
本文所使用的與年齡別初婚率有關的數據來自中國歷年的人口統計數據。由于部分普查數據如“六普”數據中僅提供了分年齡的婚姻狀況人口數據,沒有直接給出年齡別初婚率(更不用說同一隊列人口的年齡別初婚率)。因此,本文需要將分年齡的不同婚姻狀況的人口數據進行處理,以得到近似的同一隊列人口的年齡別初婚率。為此,本文提出了以下方法:
首先,對于某一特定年齡,普查數據給出了該年齡段人口的總數和分婚姻狀況的人口數。在該年齡段所有已婚人口中由于包含了再婚的人口比率,因此需要將再婚的人口數量從該年齡隊列的人口數量中去掉,剩下的就是該年齡的初婚人口累積人數,除以該年齡總人口數就可得到該年齡的累積初婚率。其次,由于該年齡段的累積初婚率是由該年齡及以前的各年齡的初婚率累加而成的(如在20歲人口中,一個人處在初婚狀態,則他或她可能是在20歲完成的初婚,也可能是在19歲或18歲完成的初婚),因此將該年齡之前的各年齡初婚率去除就是該年齡的初婚率,然后將結果歸一化就得到分年齡的初婚率。最后,借鑒總和生育率的計算方式,將同一時點不同隊列的分年齡人口看作是同一隊列經歷不同年齡的人口,就得到同一隊列人口的近似年齡別初婚率。在此基礎上,通過本文給出的一般方法就可以得到某一隊列人口的初婚年齡分布。
上述步驟可用數學公式表示如下:

顯然有:

此外需要說明,由于實際數據取自不同年齡隊列,每一年齡隊列的總人數并不相同,而且可能會存在低年齡隊列累積初婚率高于高年齡別累積初婚率的情況,因此,在計算中需要保證高年齡隊列的累積初婚率要高于低年齡隊列人口的累積初婚率(如出現這種情況則需要通過對兩相鄰隊列人口的累積初婚率進行線性插值計算),這樣調整后得到的不同隊列人口的年齡別初婚率可近似看作同一隊列人口的年齡別初婚率。
本文選取的數據出自1985以來的歷年人口統計數據,包括《中國1990年人口抽樣調查資料》、《中國2000年人口抽樣調查資料》、《中國2005年1%人口抽樣調查資料》以及《中國2010年人口抽樣調查資料》數據。錄入的數據包括“全國男性總人口”、“全國男性初婚”、“全國男性已婚”、“全國女性總人口”、“全國女性初婚”、“全國女性已婚”以及分年齡別男女(15~49歲)人口數,總出生人口數,分城鎮鄉的初婚人數以及受教育程度的初婚人數。
對得到的同一隊列的年齡別初婚率本文使用P-K擴展模型進行擬合。
為研究我國20世紀80年代以來初婚年齡分布的變化趨勢,本文選擇了1985年、1995年、2000年、2005年和2010年全國男性和女性人口數據,采用上述介紹的方法,得到了中國自1985—2010年的分性別初婚模式變化情況,結果如圖1所示。

圖1 1985年、1995年、2000年、2005年和2010年初婚年齡分布曲線
從圖1中可以看出中國男性和女性人口從1985—2010年之間初婚的年齡分布存在一定的差異,且呈現出隨時間增加分布的峰值下降和整體分布向后延遲的趨勢。無論男性還是女性的初婚年齡分布,1985年和1995年呈現明顯尖峰的形狀,而2000年后則分布高峰的陡峭程度下降,而且2000年、2005年2010年這三年無論男性還是女性的分布存在明顯的相似性。這一性質表明中國的初婚模式從80年代以來經歷了一個明顯的變化,而到2000年以后初婚模式相對變化較小。
從圖1中可觀察的另外一個變化是分布曲線隨著時間增加存在明顯的右拖尾現象,即無論男性還是女性隨著時間推移,在高年齡段選擇初婚的比例逐漸增加,與八、九十年代的初婚年齡相對集中存在比較明顯的差異,這一變化可通過分布的數字特征表現出來。表1分別給出了樣本均值、樣本方差、擬合均值和擬合方差的計算結果。

表1 歷年樣本的均值、樣本標準差和擬合均值、擬合標準差
從表1中數據可以看出,我國25年來男性和女性初婚模式都發生了一定的變化,初婚年齡樣本均值從1985—2010年有明顯的提高,其中男性的樣本均值從23.3歲提高到了25.3歲,25年提高了2歲,平均每年提高0.08歲,女性初婚年齡樣本均值從21.6歲提升到23.4歲,25年來提高1.8歲,平均每年提高0.072歲。男性初婚平均年齡延遲程度略高于女性。對比實際數據和擬合分布的情況,可以看出男性的擬合均值小于樣本均值,這也與圖形中男性實際初婚年齡分布出現的劇烈變動有關,也表明男性的初婚年齡數據存在一定的干擾。而女性的擬合均值與樣本均值有著高度的相似,擬合方差也小于男性,這表明模型對女性的初婚年齡描述上要好于男性,也可以認為女性的隨機擾動相比男性而言更小,她們在初婚年齡上更加穩定。這里不難看出,盡管最近10幾年中國初婚年齡分布的形狀存在高度的相似,但中國平均初婚年齡在逐年上升,這與圖像中所觀察的拖尾的結果是相吻合的。
表1中反映出另外一個重要信息是男女平均婚齡差的變化。從歷年樣本均值來看,1985年男女平均初婚年齡差為1.7歲,而到2010年相差為1.9歲,所以整體來看男女初婚的平均年齡差變化不大,這是由于男性和女性的平均初婚年齡都增加了,且增加的幅度是相近的。
為分析城鎮鄉因素對男女初婚年齡分布的影響,本文分別選擇1990年和2010年的數據進行了統計分析。由于兩組數據結果相近。本文以2010年為例給出分城鎮鄉的男女性人口的初婚年齡實際分布,如圖2所示。

圖2 2010年分城鎮鄉的初婚年齡樣本曲線
圖2(a)給出了城鎮鄉的男性初婚年齡分布曲線,可以看出鄉村和鎮的男性初婚年齡分布呈現明顯的相似性,而城市男性的初婚年齡分布曲線呈現出了雙峰的分布趨勢,且與鄉鎮的分布呈現明顯的差異,表現為更平的峰部和寬和后延的曲線形狀。從圖2(b)中可看出與男性初婚年齡分布相似的結果,但與男性初婚年齡分布曲線相比,城市女性的初婚年齡分布更平滑,且沒有出現雙峰分布的情形。

表2 1990年和2010年分城鎮鄉樣本均值、樣本方差和擬合均值、擬合方差
從表2中可以觀察到,2010年樣本均值與1990年樣本均值相比,男性城市人口增加了2.6歲,男性城鎮人口增加了2歲,男性鄉村人口則增加了1.5歲;與此同時,女性城市人口增加2.2歲,女性城鎮人口增加了1.6歲,女性鄉村人口增加了1.1歲。這與前面分析的平均結婚年齡隨時間增加的趨勢是一致的,同時也表明無論男性和女性,隨著時間的增長,存在著平均初婚年齡從城市到城鎮再到鄉村的遞減效應。
而從同一時間點來看,無論男性還是女性,平均初婚年齡也同樣存在著城鎮鄉的遞減效應。如從樣本均值看,2010年的男性城市人口比城鎮人口平均初婚年齡多出1.5歲,比鄉村人口多出2.2歲;女性城市人口比城鎮人口平均初婚年齡多出1.4歲,比鄉村人口多出2.3歲。與此同時,1990年的男性城市人口比城鎮人口平均初婚年齡多出0.9歲,別鄉村人口多出1.1歲;女性城市人口比城鎮人口平均初婚年齡多出0.8歲,比鄉村人口多出1.2歲。可見隨著時間的推移,男女人口平均初婚年齡存在的城鎮鄉差異進一步增大。
而從男女平均初婚年齡差的角度來看,2010年城市人口為1.9歲,城鎮人口為1.8,鄉村人口為2歲;1990年城市人口為1.5歲,城鎮人口為1.4歲,鄉村人口為1.6歲。可以看出城鎮鄉的平均初婚年齡差相差不大,且隨著時間增長,平均初婚年齡差有增加的趨勢。
另外需要說明,擬合模型的平均初婚年齡和樣本初婚年齡相差不大,方差亦穩定,說明本文的模型在描述分城鎮鄉的男女初婚年齡上效果良好。其中同一年的城市男性和女性的平均初婚年齡要高于鄉村男性的平均初婚年齡的2歲左右,可以看到平均初婚年齡隨著由鄉到鎮再到城市的依次后移的趨勢,不難推出平均初婚年齡和區域的社會經濟發展水平有著密切的聯系。
為考察不同教育程度人口群體在婚姻選擇上的差異,本文根據2010年男性和女性受教育程度的婚姻狀況數據,來給出其初婚年齡分布。其中男女性的教育水平分為未上過學、小學、中學和大學四個程度。圖3給出了根據實際數據繪制的初婚年齡分布曲線。

圖3 2010年分教育水平的男女初婚年齡分布曲線
從圖3中可以看出,無論男性還是女性,受教育水平越高,初婚年齡分布曲線越向右移,且初婚的平均年齡增大。為進一步說明初婚模式和初婚年齡的變化,本文分別計算了不同教育程度下的男女人口初婚年齡分布的樣本均值和樣本方差以及擬合均值和擬合方差,通過比較來判斷生育模式隨時間變化情況,如表3和表4所示。

表3 分教育程度男性樣本均值和方差以及擬合均值和方差

表4 分教育程度的女性樣本均值和方差以及擬合均值和方差
根據表3和表4,可看出其有以下特點:
(1)隨著受教育程度的升高,其初婚年齡的樣本均值有明顯的后移,其樣本均值變化較大。對男性來說,大學教育程度人口比中學教育程度人口增加1.8歲,比小學教育程度人口增加2.7歲,比未上學人口增加2.8歲;對女性來說,大學教育程度人口比中學教育程度人口增加1.6歲,比小學教育程度人口增加3.6歲,比未上學人口增加4歲。女性人口平衡初婚年齡受教育程度的影響高于男性。
(2)與之前的不同年份的初婚年齡樣本均值與擬合均值相比,在分教育程度的初婚年齡擬合均值上雖然都略小于樣本均值,但大多數都在1歲的誤差范圍內,方差除了個別偏離程度較高,大部分都較低,模型整體對樣本的描述是穩健的。
已有的研究將人口區分為接受高等教育和未接受高等教育兩個群體,并研究高等教育與對人口婚姻選擇行為的影響。上述分析也表明接受高等教育的人口群體其初婚平均年齡明顯高于其他教育程度群體。因此,本文將教育進一步分為大學與未上過大學兩個條件來討論,并得到如下結果,見表5所示。

表5 分教育程度的男性與女性樣本均值和方差以及擬合均值和方差
從表5可以看出在接受大學教育與不接受大學教育的男女群體中平均初婚年齡都相差較大,其中男性的差值在2~3歲之間,而女性差值更是達到了3~4歲,都大于全國平均初婚年齡差值,說明是否接受大學教育的男性和女性在初婚年齡選擇上會產生明顯的影響,相比而言這一因素對女性初婚年齡選擇上產生的影響比男性更大。
本文從男性和女性兩個角度,對全國初婚年齡進行了探討,在時間維度上進行了縱向比較;并選取了受教育程度與城鎮化水平這兩點,在空間維度上進行了橫向比較,綜上所述,20世紀80年代以來,中國的初婚年齡分布發生了明顯的變化,并且中國的初婚年齡分布呈現出明顯的城鎮鄉差異和教育程度的差異。具體的結論如下:
(1)中國20多年來的人口的平均初婚年齡穩定增長。雖然增長并不高,但總體增長趨勢較為平穩。而且早婚現象仍然存在(如15歲,16歲左右),但這一年齡的初婚率卻逐年下降,而25~30歲初婚率卻在這25年來逐漸增高,這也與我國男女婚姻觀念更加開放,對婚姻要求更高相符合。其中男女平均初婚年齡差在1985—2010年都有所增長,也體現我國現在男性生活工作壓力越大,對初婚年齡的選擇延遲會遠高于女性。
(2)中國人口的初婚年齡分布存在明顯的城鎮鄉差異。這種差異表現在三個方面:一方面是隨著時間增加,無論男性還是女性其初婚模式都存在延后的趨勢;二方面是無論男性和女性,都存在著平均初婚年齡從城市到城鎮再到鄉村的遞減效應;三方面是城鎮鄉的男女平均初婚年齡差相差不大,但同樣存在隨時間增加的趨勢。
(3)教育程度對中國人口初婚年齡分布存在明顯影響。平均初婚年齡在受教育程度不同的情況下呈現男高女低的現象,但是隨著受教育程度的升高,二者之間的差距會有所降低。接受高等教育的男女人口其初婚年齡分布沒有顯著差異,但存在明顯的向右延遲現象。
以上分析都是建立在初婚模式模型和經驗分布的基礎上的。由于初婚模式相對不容易受到出生人口漏報的影響(當人口漏報是均勻分布的時候),因此,本文的分析結果有利于對初婚率的變化進行判斷。當然,本文選擇的擬合模型隱含了雙峰分布的假設,在模型的擬合中可以看出來當初婚率變動劇烈時效果會更加好,也更加接近本文的模型描述。
[1] Hajnal J.European Marriage Patterns in Perspective[M].London:Ed?ward Arnold,1965.
[2] Ansley J C.Age Patterns of Marriage[J].Population Studies,1971,25(2).
[3] Peristera P,Kostaki A.Modeling Fertility in Modern Populations[J].Demographic Research,2007,16(6).
[4] 易翠枝.婚姻市場的教育分層與女性人力資本投資[J].華東經濟管理,2007,(2).
[5] 陳正偉.中國初婚年齡性別匹配模型及應用[J].統計與決策,2010,(3).
[6] 韋艷,董碩,姜全保.中國初婚模式變遷——基于婚姻表的分析[J].人口與經濟,2013,(2).
[7] 中國國家統計局.中國1990年人口抽樣調查資料[M].北京:中國統計出版社,1992.
[8] 中國國家統計局.中國2000年人口抽樣調查資料[M].北京:中國統計出版社,2002.
[9] 中國國家統計局.中國2005年1%人口抽樣調查資料[M].北京:中國統計出版社,2007.
[10] 中國國家統計局.中國2010年人口抽樣調查資料[M].北京:中國統計出版社,2012.