中南大學(xué)湘雅公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)系(410078)
蔣 妮 程 港 賀思敏 吳夕紅 唐 偲 謝群輝 閔獻(xiàn)英 李 超 顏 艷△
【提 要】 目的 利用決策樹和多元線性回歸模型,探討新生兒出生體重的影響因素,為孕期保健和改善新生兒出生體重提供理論依據(jù)。方法 選取湖南省長沙市開福區(qū)三個街道社區(qū)衛(wèi)生服務(wù)中心2015年出生的新生兒及母親進(jìn)行問卷調(diào)查,回顧性收集孕期和分娩相關(guān)信息,運(yùn)用決策樹CHAID算法和多元線性回歸分析出生體重的影響因素。結(jié)果 決策樹CHAID算法結(jié)果表明孕周、孕前體質(zhì)指數(shù)(body mass index,BMI)、孕期增重和新生兒性別是出生體重的影響因素,其中孕周是最主要的因素。決策樹模型劃分的亞組顯示孕周<37周組的新生兒出生體重最低,孕周≥37周且孕前肥胖組的新生兒出生體重最高。多元線性回歸模型結(jié)果也顯示孕周、孕前BMI、孕期增重和新生兒性別是出生體重的影響因素,四個因素之間無真正的交互作用。結(jié)論 出生體重受孕周、孕前BMI、孕期增重和新生兒性別的影響,決策樹和多元線性回歸模型都能分析出生體重的因素,兩種方法可以聯(lián)合運(yùn)用,互為補(bǔ)充。
新生兒出生體重不僅能反映母親孕期保健質(zhì)量和營養(yǎng)狀況,而且能衡量新生兒的生長發(fā)育水平,同時能影響新生兒成長過程中的健康狀況。低出生體重能增加?jì)胗變旱陌l(fā)病與死亡風(fēng)險(xiǎn),也與兒童生長遲緩、高血壓以及成年后冠心病、心肌梗死、2型糖尿病等疾病密切相關(guān)[1-2]。高出生體重兒更易出現(xiàn)肥胖、糖尿病、高血壓,并且胰腺癌、前列腺癌、乳腺癌等癌癥的患病風(fēng)險(xiǎn)增加,出生體重增加1000g,患癌癥風(fēng)險(xiǎn)增加7%[3-4]。因此控制新生兒出生體重在適宜的范圍內(nèi),可以提高兒童乃至成人后的健康水平和生活質(zhì)量。
目前,有關(guān)出生體重影響因素的研究以經(jīng)典的多元線性回歸模型為主,多元線性回歸模型雖然能分析出生體重與影響因素之間的線性關(guān)系,量化出生體重影響因素的作用,但其受適用條件的限制且不能提出有針對性的決策建議;在自變量較多的情況下,常常需要判斷自變量之間復(fù)雜的交互作用,將各種情況的交互項(xiàng)加入多元線性回歸模型,就更復(fù)雜了。決策樹以樹形圖為基礎(chǔ),適用范圍廣,能直觀地體現(xiàn)出影響因素的重要程度,劃分出具有不同特征的亞組,并按照每個自變量對因變量的關(guān)聯(lián)程度進(jìn)行分層,顯示自變量之間的交互作用。根據(jù)決策樹結(jié)果篩選的變量可以建立相應(yīng)的回歸模型,并對交互項(xiàng)進(jìn)行檢驗(yàn),以確定交互作用是否真正存在,兩種方法聯(lián)合運(yùn)用能互為補(bǔ)充,得到詳細(xì)的結(jié)果。因此,本研究運(yùn)用決策樹和多元線性回歸模型,探討新生兒出生體重的影響因素,為孕期保健提供科學(xué)的理論依據(jù),對改善新生兒出生體重及以后的健康狀況有重要意義。
1.數(shù)據(jù)來源和研究對象

2.調(diào)查方法
利用自行設(shè)計(jì)的調(diào)查問卷,結(jié)合社區(qū)衛(wèi)生服務(wù)中心的健康檔案和孕婦保健手冊收集信息。調(diào)查問卷內(nèi)容包括:①母親年齡、文化程度、家庭經(jīng)濟(jì)收入等社會人口學(xué)信息;②母親孕產(chǎn)史、孕周、孕前體重、孕期營養(yǎng)劑補(bǔ)充情況、分娩方式等孕期與分娩信息;③新生兒性別、出生體重和身長等信息。
3.判定標(biāo)準(zhǔn)
母親年齡:根據(jù)最佳生育年齡和產(chǎn)婦高齡,將母親年齡(歲)分為<25、25~35和>35 3組[6]。
孕周:參照《婦產(chǎn)科學(xué)》以及早產(chǎn)的定義,根據(jù)新生兒是否早產(chǎn),將母親孕周分為<37和≥37周[7]。
孕前體質(zhì)指數(shù)(body mass index,BMI):孕前體重/身高2(kg/m2)。孕前體重為孕早期(<13周)首次測量的體重。根據(jù)《中國備孕婦女膳食指南(2016)》,孕前BMI分為4類:消瘦(BMI<18.5kg/m2)、正常(18.5kg/m2≤BMI≤23.9kg/m2)、超重(24.0kg/m2≤BMI≤27.9kg/m2)和肥胖(BMI≥28.0kg/m2)[8]。
孕期增重:分娩體重與孕前體重的差值。根據(jù)孕前BMI和美國醫(yī)學(xué)研究院的孕期增重推薦值,孕前體重消瘦者、正常者、超重者和肥胖者適宜的孕期增重范圍分別為12.5~18.0kg、11.5~16.0kg、7.0~11.5kg和5.0~9.0kg[9]。因此,可將孕期增重分為不足、適宜和過多3類。
葉酸增補(bǔ)情況:根據(jù)《中國備孕婦女膳食指南(2016)》,葉酸增補(bǔ)規(guī)范為備孕婦女從孕前3個月開始補(bǔ)充葉酸,并至少持續(xù)到孕后3個月[8]。
4.模型原理
決策樹CHAID算法:決策樹是一種數(shù)據(jù)挖掘方法,通過一系列規(guī)則對數(shù)據(jù)進(jìn)行分類,具有多種算法,其中CHAID算法即卡方自動交互檢測法(chi-squared automatic interaction detector,CHAID),是根據(jù)變量類型利用卡方檢驗(yàn)或方差分析原理對數(shù)據(jù)進(jìn)行最優(yōu)分割,按P值進(jìn)行多元列聯(lián)表的自動判斷分組,生成一個多叉樹,既支持離散型目標(biāo)變量,又支持連續(xù)型目標(biāo)變量,能高效的挖掘出主要影響因素[10]。對于連續(xù)型目標(biāo)變量,CHAID算法按照方差分析進(jìn)行判斷分組,從根節(jié)點(diǎn)開始,在每一步均選擇與目標(biāo)變量有最強(qiáng)作用的輸入變量,若每個輸入變量的類別與目標(biāo)變量的差異無統(tǒng)計(jì)學(xué)意義,則進(jìn)行合并,當(dāng)節(jié)點(diǎn)的數(shù)據(jù)和P值達(dá)不到設(shè)置的要求,則停止分割,該節(jié)點(diǎn)為終末節(jié)點(diǎn)[11-12]。
多元線性回歸模型:是經(jīng)典的統(tǒng)計(jì)學(xué)分析方法,研究的是一個因變量與多個自變量之間的線性依存關(guān)系,要求因變量是連續(xù)變量且服從正態(tài)分布,自變量可以是連續(xù)變量、分類變量或有序變量[13]。
5.統(tǒng)計(jì)分析
通過EpiData 3.1進(jìn)行數(shù)據(jù)雙人雙份錄入。用均數(shù)和標(biāo)準(zhǔn)差對數(shù)據(jù)進(jìn)行描述,使用t檢驗(yàn)、單因素方差分析進(jìn)行組間比較,使用決策樹CHAID算法和多元線性回歸模型分析出生體重影響因素。所有分析過程在SPSS 20.0中進(jìn)行,檢驗(yàn)水準(zhǔn)α=0.05。
1.一般情況
本次調(diào)查共有1286名新生兒,根據(jù)納入和排除標(biāo)準(zhǔn),最終調(diào)查了926對母嬰。剔除10份缺失關(guān)鍵數(shù)據(jù)的問卷,有效問卷916份,有效率為98.9%,符合最少樣本量545名的要求。916名母親的平均年齡為(29.49±3.92)歲,平均孕周為(38.92±1.64)周,文化程度以大學(xué)及以上為主。新生兒平均出生體重為(3350.93±432.49)g,男孩的出生體重高于女孩,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05),孕前肥胖、孕期增重過多、經(jīng)產(chǎn)婦和孕周≥37周組的出生體重較高(P<0.05),而不同母親年齡、文化程度、家庭人均月收入、孕期吸煙暴露、妊娠期高血壓和糖尿病、葉酸增補(bǔ)情況和分娩方式間出生體重的差異無統(tǒng)計(jì)學(xué)意義(P>0.05),見表1。

表1 916對母嬰的一般情況描述和比較
2.出生體重影響因素的決策樹CHAID算法分析
將出生體重作為目標(biāo)變量,其余所有變量作為輸入變量,利用決策樹中的CHAID算法進(jìn)行分析,設(shè)置決策樹最大深度為3層,父節(jié)點(diǎn)最小個案數(shù)為50,子節(jié)點(diǎn)最小個案數(shù)為10。最終構(gòu)建的出生體重影響因素決策樹圖見圖1,結(jié)果顯示共有7個終末節(jié)點(diǎn),排除了母親年齡、文化程度、家庭人均月收入、孕期吸煙暴露、產(chǎn)次、妊娠期高血壓和糖尿病、葉酸增補(bǔ)情況和分娩方式,孕周、孕前BMI、孕期增重情況和新生兒性別是影響出生體重的因素。

圖1 出生體重影響因素的決策樹CHAID算法分析結(jié)果
由圖1可以看出,第一層是孕周,說明孕周是影響出生體重的最主要因素。在孕周≥37周的人群中,孕前BMI與出生體重的相關(guān)性最高。孕期增重情況和新生兒性別對出生體重的影響分別在孕周≥37周且孕前消瘦和孕周≥37周且孕前BMI正常的人群中表現(xiàn)出來。具體組合規(guī)則見表2,新生兒出生體重在孕周<37周組最低,其次是孕周≥37周、孕前消瘦且孕期增重不足/合適組,在孕周≥37周且孕前肥胖組最高。組間比較顯示不同組合的出生體重差異具有統(tǒng)計(jì)學(xué)意義,F(xiàn)=36.240,P<0.001。

表2 決策樹圖終末節(jié)點(diǎn)的組合規(guī)則
3.出生體重影響因素的多元線性回歸分析
關(guān)于出生體重影響因素的研究多采用經(jīng)典的多元線性回歸方法,將出生體重作為因變量,其余所有變量作為自變量對本數(shù)據(jù)進(jìn)行多元線性逐步回歸分析,考慮到自變量間可能存在交互作用,將決策樹結(jié)果中的孕周、孕前BMI、孕期增重和新生兒性別的交互項(xiàng)納入分析,α進(jìn)=0.05,α出=0.10。結(jié)果見表3,母親孕周、孕前BMI、孕期增重與出生體重呈正相關(guān)且孕周對出生體重的影響最大,新生兒性別與出生體重呈負(fù)相關(guān),自變量間的交互項(xiàng)未進(jìn)入模型。模型檢驗(yàn)F=61.593,P<0.001,決定系數(shù)R2=0.461,該模型能解釋出生體重變異的46.1%。

表3 出生體重影響因素的多元線性回歸分析結(jié)果
本研究通過決策樹CHAID算法和多元線性回歸模型分析顯示,孕周、孕前BMI、孕期增重情況和新生兒性別都是影響出生體重的因素。其中,孕周是影響出生體重的最主要因素,這與多項(xiàng)研究結(jié)果一致[14-17]。孕周<37周為早產(chǎn)兒,與孕周≥37周的足月兒相比,早產(chǎn)兒各器官形態(tài)和功能發(fā)育尚未成熟,出生時各方面情況差。此外,新生兒性別與出生體重相關(guān),男孩的出生體重高于女孩。
孕前BMI和孕期增重情況與新生兒出生體重呈正相關(guān),既往研究表明孕前低BMI的孕婦不能給胎兒提供充足的營養(yǎng)物質(zhì),而孕前高BMI的孕婦會出現(xiàn)代謝紊亂,使得胎兒通過胎盤獲得的營養(yǎng)物質(zhì)增加,導(dǎo)致新生兒出生體重隨孕前BMI的增加而增加[18-19]。孕期增重情況是反映孕期營養(yǎng)狀況的重要指標(biāo),孕婦孕期營養(yǎng)狀況與胎兒的生長發(fā)育密切相關(guān),孕期增重不足和過多均能影響包括出生體重在內(nèi)的多種結(jié)局[20]。因此,控制孕前BMI和孕期增重在適宜范圍內(nèi)有利于胎兒的生長發(fā)育,使出生體重維持在正常水平。
多元線性回歸是經(jīng)典的多因素模型,顯示了控制其他因素后某因素對因變量的作用,能量化影響因素與因變量的關(guān)系;決策樹模型以樹形圖的形式清楚直觀地顯示分析過程和結(jié)果,體現(xiàn)出影響因素的重要程度,劃分出不同特征的亞組,有利于快速識別出不同的人群而采取有針對性的措施,比僅僅分析出哪些變量能影響結(jié)果更具有指導(dǎo)意義[21-23]。本研究結(jié)果提示,需關(guān)注孕周<37周和孕周≥37周且孕前肥胖的孕婦,因?yàn)檫@兩類人群中新生兒出生體重分別為最低和最高,此外在孕期保健服務(wù)和管理工作中,要指導(dǎo)孕婦科學(xué)增重,多關(guān)注孕周≥37周且孕前消瘦人群,因?yàn)樗齻冊鲋夭蛔銜?dǎo)致新生兒出生體重偏低。
使用多元線性回歸模型需考慮自變量之間可能存在的交互作用,當(dāng)自變量較少時,可以加入兩自變量的交互項(xiàng)進(jìn)行分析,但自變量較多的情況下,自變量間的交互作用會變得復(fù)雜。決策樹模型可以顯示自變量間復(fù)雜的交互作用,借助決策樹模型可以揭示復(fù)雜的交互項(xiàng)[23-25]。對于本研究,決策樹模型提示孕周、孕前BMI、孕期增重和新生兒性別可能存在交互作用,新生兒性別對出生體重的影響在孕周≥37周且孕前BMI正常的亞組中體現(xiàn)出來,可能因?yàn)榕c孕周和孕前BMI相比,新生兒性別是不可改變因素,對出生體重的影響較小,無法在其他人群中進(jìn)一步劃分亞組。另外,孕期增重對出生體重的影響在孕周≥37周且孕前消瘦的情況下表現(xiàn)出來,這提示在孕周≥37周、孕前消瘦的人群中,孕期增重情況對新生兒出生體重的影響更加突出。以往的研究有類似的結(jié)果,王雅文等[26]進(jìn)行的前瞻性隊(duì)列研究發(fā)現(xiàn)孕期增重不足僅會增加孕前BMI較低的孕婦分娩低出生體重兒的風(fēng)險(xiǎn)。Eraslan SM等[27]研究未發(fā)現(xiàn)孕前BMI正常的孕婦孕期增重不足和過多對新生兒出生體重有影響。然而,決策樹模型無法分析和檢驗(yàn)自變量及交互項(xiàng)的線性組合關(guān)系[22,25],將可能的交互項(xiàng)加入多元線性回歸模型進(jìn)一步分析,結(jié)果表明孕周、孕前BMI、孕期增重和新生兒性別對出生體重的影響并無真正的交互作用,二者結(jié)果并不矛盾,決策樹模型只顯示了某變量在某亞組中有作用,在其他亞組中無作用。以往有研究表明孕期BMI和孕期增重對新生兒出生體重的影響不存在交互作用[28-30]。在孕婦管理工作中,應(yīng)同時關(guān)注這些因素,以控制新生兒出生體重在正常范圍內(nèi)。
本研究存在一定的局限性,一是樣本量較小。二是在收集孕期信息時,讓被調(diào)查者進(jìn)行回憶,存在回憶偏倚,為減少回憶偏倚的影響,本研究在收集資料時結(jié)合了社區(qū)衛(wèi)生服務(wù)中心的健康檔案和孕婦保健手冊。三是由于中國還沒有孕期增重的推薦值,本研究根據(jù)美國醫(yī)學(xué)研究院推薦的孕期增重值對孕期增重進(jìn)行分類,可能存在人群差異而影響研究結(jié)果。
綜上所述,出生體重受多種因素的影響,加強(qiáng)孕期保健服務(wù)與管理,預(yù)防早產(chǎn)的發(fā)生,同時監(jiān)測孕前體重與孕期體重變化,并根據(jù)孕前BMI制定科學(xué)的孕期增重方案,對改善新生兒出生體重及以后的健康狀況有重要意義。決策樹和多元線性回歸模型都能分析出生體重的影響因素,決策樹模型能直觀反映各因素對出生體重的作用與重要程度,劃分出有不同特征的亞組,并能顯示自變量間復(fù)雜的交互作用;而多元線性回歸模型能量化出生體重與影響因素之間的線性關(guān)系,并對可能的交互項(xiàng)進(jìn)行檢驗(yàn),兩種方法可以聯(lián)合運(yùn)用,互為補(bǔ)充,進(jìn)而充分解釋變量之間的關(guān)系。