鄧連方,梁 潔,盧 丹,黃秋杰,何 水
(欽州市第一人民醫(yī)院產(chǎn)科,欽州 535000)
陰道分娩產(chǎn)后尿潴留(PUR)是產(chǎn)科常見并發(fā)癥,發(fā)生率為1.5%~47%[1],部分產(chǎn)婦會因癥狀漸性加重而發(fā)展為頑固性PUR,威脅產(chǎn)婦生命健康。早期識別和準(zhǔn)確預(yù)測產(chǎn)婦產(chǎn)后PUR 風(fēng)險(xiǎn)對臨床采取針對性預(yù)防措施具有重要的意義。然而,目前臨床多采用Logistic 回歸模型分析發(fā)生PUR 的影響因素[2],其雖有訓(xùn)練速度快、簡單易懂等特點(diǎn),但無法直接呈現(xiàn)各因素對結(jié)果變量的重要程度。列線圖是整合多個(gè)相關(guān)因素預(yù)測某事件發(fā)生概率的模型圖,具有直觀、可視化特點(diǎn),在醫(yī)學(xué)領(lǐng)域常用于疾病影響因素的風(fēng)險(xiǎn)預(yù)測;數(shù)據(jù)挖掘技術(shù)是一種較為新興的統(tǒng)計(jì)學(xué)方式,如決策樹、隨機(jī)森林等均被證明可用于預(yù)測疾病發(fā)生[3-4]。目前這3種預(yù)測模型在頑固性PUR 的應(yīng)用報(bào)道較少,且缺乏關(guān)于這3 種統(tǒng)計(jì)學(xué)方法預(yù)測頑固性PUR 的分析研究。本研究旨在對比列線圖、決策樹及隨機(jī)森林模型對頑固性PUR的預(yù)測效能。
1.1 研究對象 回顧性分析2020 年1 月至2021 年12月在欽州市第一人民醫(yī)院經(jīng)陰道分娩的380例產(chǎn)婦的臨床資料。納入標(biāo)準(zhǔn):(1)初產(chǎn)婦、足月、單胎;(2)頭位妊娠,經(jīng)陰道自然分娩;(3)產(chǎn)后6~8 h 內(nèi)出現(xiàn)尿潴留,產(chǎn)后2 d 后有尿但無法自行排出。排除標(biāo)準(zhǔn):(1)產(chǎn)前合并泌尿系統(tǒng)感染疾病者;(2)產(chǎn)前合并妊娠期高血壓、糖尿病、甲亢者;(3)其它原因引發(fā)尿潴留(如產(chǎn)婦膀胱腫物、受外傷等)者;(4)嚴(yán)重精神系統(tǒng)疾病者;(5)合并嚴(yán)重肝、腎功能異常者。
PUR判斷標(biāo)準(zhǔn)[5]:陰道分娩后6 h內(nèi)無法自行排尿,或在自行排尿后經(jīng)超聲測定膀胱內(nèi)殘余尿量>150 mL;頑固性PUR 是產(chǎn)后2 d 有尿但不能自行排出,需借助其他手段進(jìn)行排尿。根據(jù)產(chǎn)后有無頑固性PUR分為頑固性PUR組和對照組。
1.2 資料收集 收集產(chǎn)婦的臨床資料,包括年齡、孕周、分娩前體質(zhì)量、妊娠糖尿病、妊娠高血壓、總產(chǎn)程時(shí)間、第一產(chǎn)程時(shí)間、第二產(chǎn)程時(shí)間、人工破膜、分娩鎮(zhèn)痛時(shí)間、產(chǎn)鉗助產(chǎn)、會陰側(cè)切伴裂傷及巨大兒(新生兒出生1 h內(nèi)體重超過4 kg)等[6]。
1.3 數(shù)據(jù)預(yù)處理 列線圖和決策樹按照機(jī)器學(xué)習(xí)設(shè)置,將產(chǎn)婦按7:3的比例分為訓(xùn)練集(266例)和測試集(114例);隨機(jī)森林按照隨機(jī)樣本的分割節(jié)點(diǎn),按照機(jī)器學(xué)習(xí)設(shè)置,將患者分為訓(xùn)練集為2/3(254例)與測試集為1/3(126例)。
1.4 列線圖模型 在訓(xùn)練集數(shù)據(jù)上,采用R Studio軟件中的lrm函數(shù)建立初始Logistic回歸模型,基于已識別的相關(guān)因素,將顯著性P<0.05 的變量構(gòu)建列線圖模型。
1.5 決策樹模型 本研究使用R 語言中的rpart 函數(shù)構(gòu)建決策樹模型,“因變量”為發(fā)生頑固性PUR,“自變量”為具統(tǒng)計(jì)學(xué)意義的特征變量,指定最小代價(jià)復(fù)雜度剪枝中的復(fù)雜度參數(shù)CP 設(shè)置為0.012 5,并運(yùn)算生成決策樹分析模型。
1.6 隨機(jī)森林模型 在Rstudio 軟件中,采用randomforest 程序包對隨機(jī)森林分類識別并構(gòu)建模型。randomforest 函數(shù)在進(jìn)行模型構(gòu)建過程中主要包含2個(gè)模型參數(shù),分別是ntree和mtry。ntree參數(shù)設(shè)置為500,即隨機(jī)森林中默認(rèn)存在500 顆樹,mtry默認(rèn)設(shè)置為在每次拆分時(shí)隨機(jī)抽樣候選的變量數(shù)。根據(jù)上述參數(shù),構(gòu)建隨機(jī)森林初始模型。
1.7 統(tǒng)計(jì)學(xué)方法 采用SPSS 23.0統(tǒng)計(jì)軟件分析數(shù)據(jù),計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差()表示,兩組間比較采用t檢驗(yàn);計(jì)數(shù)資料以百分率(%)表示,率的比較采用χ2檢驗(yàn)。將單因素分析中差異具有統(tǒng)計(jì)學(xué)意義的變量作為輸入變量,將是否發(fā)生頑固性PUR作為結(jié)局變量,在訓(xùn)練集中分別建立列線圖、決策樹模型及隨機(jī)森林模型,通過計(jì)算預(yù)測模型的準(zhǔn)確度、靈敏度、特異度、召回率、精確度及受試者工作特征(ROC)曲線下面積(AUC)評價(jià)3種統(tǒng)計(jì)學(xué)模型的預(yù)測效能。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 3 組臨床資料比較 380 例陰道分娩產(chǎn)婦中,180 例發(fā)生頑固性PUR(頑固性PUR 組),發(fā)生率47.37%,未發(fā)生頑固性PUR 200 例(52.63%),作為對照組。單因素分析顯示,頑固性產(chǎn)后PUR與總產(chǎn)程時(shí)間、第一產(chǎn)程時(shí)間、第二產(chǎn)程時(shí)間、分娩鎮(zhèn)痛、產(chǎn)鉗助產(chǎn)、會陰側(cè)切伴裂傷及巨大兒有關(guān)(P<0.05),見表1。

表1 影響頑固性PUR的單因素分析結(jié)果
2.2 陰道分娩產(chǎn)婦發(fā)生頑固性PUR 的3 種風(fēng)險(xiǎn)預(yù)測模型的構(gòu)建 以產(chǎn)婦是否發(fā)生頑固性PUR(是=1、否=0)作為因變量,將單因素分析中差異有統(tǒng)計(jì)學(xué)意義的變量分別納入列線圖、決策樹和隨機(jī)森林模型。對分類資料進(jìn)行賦值[產(chǎn)鉗助產(chǎn)(是=1、否=0),會陰側(cè)切伴裂傷(是=1、否=0),巨大兒(是=1、否=0)],連續(xù)變量:產(chǎn)程時(shí)間、第一產(chǎn)程時(shí)間、第二產(chǎn)程時(shí)間、分娩鎮(zhèn)痛時(shí)間,以實(shí)際值錄入。
2.3 列線圖模型 基于多因素Logistic回歸分析中篩選出的危險(xiǎn)變量,用70%樣本量構(gòu)建產(chǎn)婦發(fā)生頑固性PUR 的列線圖預(yù)測模型,見圖1。預(yù)測模型的臨床應(yīng)用示例:1 位陰道分娩產(chǎn)婦,總產(chǎn)程時(shí)間為13.5 h(32 分),第一產(chǎn)程時(shí)間560 min(86 分),第二產(chǎn)程80 min(50 分),分娩鎮(zhèn)痛使用時(shí)間350 min(30分),有使用產(chǎn)鉗助產(chǎn)(22 分),有會陰側(cè)切伴裂傷(28分),巨大兒(16分),總分264分,對應(yīng)發(fā)生頑固性PUR風(fēng)險(xiǎn)為72%。

圖1 陰道分娩產(chǎn)婦發(fā)生頑固性PUR風(fēng)險(xiǎn)的列線圖預(yù)測模型
2.4 決策樹模型 模型結(jié)果顯示,第二產(chǎn)程時(shí)間≥77 min的頑固性PUR發(fā)生率為30%,分娩鎮(zhèn)痛時(shí)間≥327 min、第一產(chǎn)程時(shí)間≥526 min的頑固性PUR發(fā)生率為25%,第一產(chǎn)程時(shí)間≥568 min的頑固性PUR發(fā)生率為3%,總產(chǎn)程時(shí)間≥14 h的頑固性PUR發(fā)生率為6%,巨大兒的頑固性PUR發(fā)生率為11%,見圖2。

圖2 陰道分娩產(chǎn)婦發(fā)生頑固性PUR風(fēng)險(xiǎn)的決策樹預(yù)測模型
2.5 隨機(jī)森林模型 根據(jù)構(gòu)建的最佳模型總體預(yù)測準(zhǔn)確度變化,影響產(chǎn)婦發(fā)生頑固性PUR的變量排序分別是第二產(chǎn)程時(shí)間、第一產(chǎn)程時(shí)間、總產(chǎn)程時(shí)間、分娩鎮(zhèn)痛時(shí)間、會陰側(cè)切伴裂傷、巨大兒、產(chǎn)鉗助產(chǎn),見圖3。

圖3 陰道分娩產(chǎn)婦發(fā)生頑固性PUR 風(fēng)險(xiǎn)的隨機(jī)森林預(yù)測模型:輸入變量重要性測度
2.6 3種模型性能比較 使用驗(yàn)證集對3種模型進(jìn)行效能驗(yàn)證,結(jié)果顯示,列線圖模型在實(shí)際患者識別發(fā)生頑固性PUR 效能方面優(yōu)于決策樹和隨機(jī)森林模型,列線圖模型的準(zhǔn)確度為0.833,靈敏度為0.933,特異度為0.759,召回率為0.900,精確率為0.806,AUC為0.902,均高于決策樹模型和隨機(jī)森林模型,見表2。

表2 列線圖、決策樹與隨機(jī)森林模型預(yù)測效能比較
隨著臨床醫(yī)學(xué)研究信息不斷膨脹,數(shù)據(jù)呈現(xiàn)多樣化發(fā)展,傳統(tǒng)的數(shù)據(jù)分析方法和工具難以滿足當(dāng)前臨床需求,對于繁雜、大規(guī)模的醫(yī)學(xué)數(shù)據(jù)信息,機(jī)器學(xué)習(xí)算法更具優(yōu)勢。本研究利用本院醫(yī)院信息系統(tǒng)病歷數(shù)據(jù),分別構(gòu)建列線圖、決策樹和隨機(jī)森林用于預(yù)測陰道分娩產(chǎn)婦發(fā)生頑固性PUR 風(fēng)險(xiǎn)識別模型,在一定精準(zhǔn)度上選擇最優(yōu)的預(yù)測模型,以更好地服務(wù)臨床。
陰道分娩過程中,若產(chǎn)程時(shí)間過長,胎兒對陰道造成的壓迫時(shí)間也有所增加,致使盆底肌肉和神經(jīng)在不斷拉伸下?lián)p傷,逼尿肌未能正常舒張、收縮而發(fā)生PUR[7]。隨著總產(chǎn)程時(shí)間的推移,陰道分娩產(chǎn)婦發(fā)生頑固性PUR 的風(fēng)險(xiǎn)顯著增加[8];而第一產(chǎn)程時(shí)間的延長會使陰道持續(xù)受壓,對膀胱和尿道造成持續(xù)性壓迫,產(chǎn)婦盆骨神經(jīng)功能被抑制而增加了頑固性PUR 的發(fā)生風(fēng)險(xiǎn)[9]。第二產(chǎn)程時(shí)間超過1 h也是引發(fā)PUR 的危險(xiǎn)因素,會時(shí)膀胱、尿道黏膜及尿道口充血、水腫,最終致使產(chǎn)婦頑固性PUR 發(fā)生。分娩鎮(zhèn)痛雖然能夠有效減輕產(chǎn)婦分娩過程中的疼痛感、提高分娩質(zhì)量,但該法會延遲神經(jīng)組織和盆底局部組織受到壓迫的時(shí)間,致使產(chǎn)婦排尿信號受影響[10],而鎮(zhèn)痛劑量的加大會導(dǎo)致分娩鎮(zhèn)痛時(shí)間和排尿傳導(dǎo)信號的影響時(shí)間延長,影響正常排尿,導(dǎo)致頑固性PUR 發(fā)生[11]。既往研究證實(shí),會陰側(cè)切和會陰裂傷與PUR發(fā)生呈正相關(guān)關(guān)系[12-13]。本研究結(jié)果顯示,會陰側(cè)切伴裂傷程度越重,頑固性PUR 風(fēng)險(xiǎn)越高。會陰側(cè)切伴裂傷引起的疼痛和水腫程度也影響反射性尿道痙攣,并間接反映了陰道分娩的困難程度。Polat等[14]研究表明,產(chǎn)鉗助產(chǎn)過程中可能會損傷盆腔神經(jīng)、肛門括約肌等,延長膀胱受刺激時(shí)間,造成產(chǎn)婦自主排尿反射障礙。產(chǎn)鉗助產(chǎn)具侵入性,會致使生殖道機(jī)械性阻塞、膀胱創(chuàng)傷而引起頑固性PUR[15]。巨大兒可能會延長產(chǎn)程時(shí)間、提高會陰側(cè)切及產(chǎn)鉗助產(chǎn)率,巨大兒對于膀胱以及盆腔神經(jīng)的壓迫更劇烈,產(chǎn)婦產(chǎn)后發(fā)生嚴(yán)重的組織水腫而導(dǎo)致排尿困難或無法自主排尿[16],本研究提示巨大兒是發(fā)生頑固性PUR的獨(dú)立危險(xiǎn)因素。
隨著計(jì)算機(jī)軟件和人工智能的發(fā)展,機(jī)器學(xué)習(xí)已成為醫(yī)學(xué)界研究的新方向,能夠從大樣本數(shù)據(jù)集中篩選出更有效數(shù)據(jù),并做出準(zhǔn)確預(yù)測或決策,為患者帶來更為準(zhǔn)確和個(gè)性化的診療。研究顯示,采用機(jī)器學(xué)習(xí)算法預(yù)測模型預(yù)測鋼鐵工人頸動脈粥樣硬化發(fā)生情況[17]。通過機(jī)器學(xué)習(xí)可預(yù)測軟骨肉瘤患者的肺轉(zhuǎn)移風(fēng)險(xiǎn)[18]。本研究將差異有統(tǒng)計(jì)學(xué)意義的7 項(xiàng)指標(biāo)分別納入列線圖、決策樹和隨機(jī)森林算法并建立預(yù)測模型,經(jīng)驗(yàn)證,列線圖模型在實(shí)際患者識別發(fā)生頑固性PUR 效能方面優(yōu)于決策樹和隨機(jī)森林模型,列線圖模型的準(zhǔn)確度、靈敏度、特異度、精確率和AUC均高于決策樹模型和隨機(jī)森林模型。此外,在測試集中發(fā)現(xiàn),隨機(jī)森林模型的預(yù)測性能均低于訓(xùn)練集,說明隨機(jī)森林模型存在過擬合現(xiàn)象,也可能是訓(xùn)練集數(shù)據(jù)不足而出現(xiàn)泛化效果較差。可見,列線圖模型的預(yù)測效果更為理想,其診斷價(jià)值均優(yōu)于決策樹模型與隨機(jī)森林模型,且列線圖可將Logistic回歸或Cox回歸可視化,臨床醫(yī)師可以簡單、便捷的估算出產(chǎn)婦發(fā)生頑固性PUR 的風(fēng)險(xiǎn)。
本研究局限性在于:本研究為單中心回顧性研究,受時(shí)間及樣本量限制,可能存在一定的偏倚;本研究沒有分析更多的頑固性PUR 發(fā)生風(fēng)險(xiǎn)特征與危險(xiǎn)因素。在未來的研究中將使用更大、更全面的樣本集,并采用多中心研究對本研究中的模型進(jìn)行改進(jìn)與驗(yàn)證,以進(jìn)一步構(gòu)建更為完善的預(yù)測模型。
綜上所述,列線圖模型在陰道分娩產(chǎn)婦發(fā)生頑固性PUR中具有較好的預(yù)測效果和穩(wěn)定性,其預(yù)測效能優(yōu)于決策樹預(yù)測模型和隨機(jī)森林模型,具有較好的臨床應(yīng)用價(jià)值。