摘 要 近年來研究人員致力于研究孕婦吸煙和懷孕期間營養狀況對于嬰兒體重的影響,所以本文為了簡化分析,以孕婦懷孕期間吸煙程度和間接影響營養狀況的家庭收入作為影響嬰兒體重的兩個因素建立模型進行分析研究。
本文將研究問題從實際中抽離出來,從計量經濟學角度出發,利用stata進行OLS回歸,得出簡單模型,進而對模型進行異方差檢驗,兩個變量聯合顯著性的F檢驗以及擬合優度的比較,從而分析解釋變量對于因變量的影響,得出結論。最后,為了進一步保證模型的穩健性,對因變量取對數建立模型,與初始模型進行比較,從而得出較優的模型。在本文的結尾部分,分別從計量經濟角度,實際生活角度對問題進行了評價。
關鍵字 嬰兒體重 OLS回歸 F檢驗 white檢驗 計量經濟
一、研究背景與基礎
嬰兒出生的體重一直是嬰兒重要的生理指標。研究人員發現近年來初生嬰兒的體重低于正常值的越來越多,對于新生兒來說,體重達不到標準值,將會面臨一系列長遠的健康問題,所以嬰兒的出生體重是必須要關注的事情。
一般孕婦的懷孕年齡,健康狀況,懷孕期間營養狀況都會影響嬰兒的體重。研究人員發現近年來吸煙的女性比例持續上升,那么可以猜想吸煙對于他們的嬰兒是有害的,進而研究人員進行了調查,發現吸煙女性的孩子體重普遍低于正常值,證實了我們的猜想,所以孕婦吸煙對于嬰兒體重來說絕對是一個不可忽略的影響因素。
其次經過醫學研究,孕婦在懷孕期間如果營養狀況不佳,同樣會影響嬰兒的體重,甚至會對嬰兒以后的腦力發展造成不好的影響,所以孕婦要特別注意增加營養,那么收入較高的家庭則會給孕婦帶來較好的條件以及提供較好的營養,并且收入高的家庭一般對應著家庭成員的受教育程度較高,也許會對嬰兒體重造成影響。
為了簡化問題,本文重點選取比較關注的孕婦吸煙數量(cigs)和影響孕婦營養狀況的家庭收入(faminc)兩個因素進行研究。
二、模型建立與解釋
(一)數據來源
本論文的數據來自《計量經濟學》配套數據BWGHT.DTA
(二)建立模型
根據上述研究背景的闡述,我們可以假定以下一個用孕婦懷孕期間抽煙數量和家庭年收入解釋嬰兒體重的簡單模型:
其中,bwght表示以磅為單位的嬰兒出生體重,cigs為母親懷孕期間平均每天的抽煙數量,faminc為家庭年收入。
(三)估計方程
利用stata軟件對上述簡單模型進行OLS回歸,則根據結果得簡單回歸方程:
(四)數據解釋
截距項:如果回歸方程中變量cigs=faminc=0,則嬰兒體重為116.9741英鎊。
系數:cigs的系數表示孕婦在懷孕期間平均每天抽煙數量每增加1,嬰兒體重就會下降0.4634英鎊。如果按照一個月計算,孕婦一個月增加的抽煙數量為30,那么嬰兒體重就會下降13.9032,根據常識,孕婦一般懷孕周期為十個月,繼續根據簡單回歸模型進行計算的話,嬰兒體重將會大幅度下降,對于嬰兒健康甚至生命都存在極大的威脅性,所以說孕婦在懷孕期間抽煙對于嬰兒健康絕對具有傷害性。
Faminc的系數表示家庭總收入每增加一個單位,嬰兒體重會增加0.0928英鎊。根據前面背景的闡述,我們知道收入高的家庭可以使孕婦在懷孕期間得到更好地產前照顧與營養,那么嬰兒在母體中也可以吸收較多營養,從而增加自身體重,所以家庭收入與嬰兒體重是正相關。
三、模型檢驗
(一)White檢驗
從懷特檢驗的結果可以看出p值為0.9675,大于0.05,不存在異方差。
(二)F檢驗
我們知道收入高的家庭意味著家庭成員受教育程度相對較高,并且簡單回歸方程中的R2=0.0298,即bwght被cigs和faminc解釋的部分只有2.98%,是相對較小的,說明cigs和faminc對bwght的影響力度不夠,那么我們可以嘗試加入父母教育程度的解釋變量,利用F檢驗研究其對bwght的影響,則模型變為:
其中,motheduc表示母親受教育年數,fatheduc表示父親受教育年數
OLS回歸結果如下:
由結果可知,只有1191個觀測值,是因為我們要研究motheduc與fatheduc對bwght的影響,我們可以從反方向研究,即要檢驗的虛擬假設是:在控制了cigs,faminc之后,父母的受教育程度對嬰兒出生時的重量沒有影響,表示為:
所以有q=2個排除性約束要檢驗。雖然數據集BWGHT.DTA中包含了1388個嬰兒的信息,但是樣本中有197個嬰兒至少缺失變量motheduc和fatheduc中的一個信息,在估計上述簡單模型時,這些觀測值不能被包含進來,所以實際上只有1191個觀測值。
在上述不受約束的模型中df是n-5,即1191-5=1186個df,則F檢驗分子的自由度為2,分母的自由度為1185,查表得顯著性水平為5%的臨界值為3.0,F統計值為1.64,遠遠低于臨界值,所以不能拒絕原假設H0。換句話說,motheduc和fatheduc在嬰兒體重方程中是聯合不顯著的。P值為0.1946,則%[motheduc和%[fatheduc都是零的假設檢驗,即使在20%顯著性水平上都不可以拒絕 。
那么我們根據上述分析知motheduc和fatheduc對于bwght的解釋力度依然很小,即影響不大,所以我們在以后的研究中對于影響bwght的因素必須更進一步的進行發現分析。
(三)擬合優度
以上兩個回歸方程的R2=0.0298和0.0328,都比較小,說明擬合度不是很好。
四、模型比較
從數據中我們可以得到log(bwght)和log(faminc)兩個數據,那么我們可以保持cigs不變,將因變量換成log(bwght),解釋faminc換成log(faminc)之后的模型,并進行分析。
log(beghe)=4.7186-0.0041cigs+0.0163log(faminc)
n=1388,R2=0.0258 (2)
(1)對其進行white檢驗,得p值為0.9276,大于0.05,不存在異方差。
(2)從上述結果我們可以看出回歸方程(1)的R2要大于回歸方程(2)的,說明回歸方程要更具有說服力,可見直接使用bwght進行預測更好。
五、結論
1、從計量經濟角度來看
通過本文上述分析,得知cigs與bwght負相關,faminc與bwght正相關即bwght確實受到以上兩個因素的影響,并且隨著孕婦懷孕期間吸煙數量的增加,家庭收入的減少嬰兒體重是減少的,與我們所了解的背景知識和猜想是吻合的。
2、從擬合值角度來看,回歸方程的R2都差不多,而且偏小,說明擬合度不是很好,還需要進一步發現并在模型中加入更多可能影響嬰兒體重的因素,增強解釋變量對因變量的解釋力度。
模型比較的結果告訴我們bwght模型要比lbwght模型的穩健性更好,說明bwght模型更能說明影響嬰兒體重的因素分析,得出來的結果更可靠。
從實際生活角度來看
通過本文的分析,以及結合實際,說明越來越多的人關注嬰兒健康,并且致力于研究嬰兒健康的影響因素,孕婦吸煙程度,家庭收入,父母受教育程度都會直接或間接影響嬰兒體重,并且孕婦吸煙對于嬰兒體重的影響是近年來人們研究的主要方向。所以為了嬰兒的健康,為孩子以后的健康著想,呼吁各位準備做母親或者即將做母親的女性,請不要吸煙,并且注意懷孕期間自身營養,給予寶寶良好的發育環境,充足的營養和美好的未來。
模型不足
由于為了問題的簡化分析,突出某一個著重點,本文模型只簡單的采用了幾個變量,對于嬰兒體重的影響分析還不夠深入和全面,在以后的研究中,要加入更多影響因素,使模型更具有說服力,更貼合實際。
參考文獻:
[1]杰弗里·M.伍德里奇.計量經濟學導論[M].北京:清華大學出版社,2009(7).
[2]費劍平.計量經濟學導論(中文版).北京:中國人民大學出版社,2010(6).
[3]束莉.孕期增重、新生兒出生體重的影響因素分析及與膳食關系的研究,2011(1).
[4]井淇,路中.孕期吸煙與被動吸煙影響妊娠結局的研究進展,2010(15).
作者簡介:魏佳(1991-),女,單位:中南財經政法大學統計與數學學院學院,主要研究方向:計量經濟。