999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量回歸的新型胎兒體重預測模型的研究

2022-09-16 06:50:40林燕茹唐文波莊佳衍
中國婦幼健康研究 2022年9期
關鍵詞:模型

劉 騰,朱 屹,林燕茹,朱 琴,唐文波,莊佳衍

(1.寧波大學醫學院附屬醫院,浙江 寧波 315020;2.中國科學院寧波工業技術研究院,浙江 寧波 315201;3.寧波大學,浙江 寧波 315211)

胎兒體重預測是產前管理的重要內容,準確的胎兒體重預測可以減少圍產兒的患病率、死產率、死亡率及孕產婦并發癥。在臨床工作中,準確的胎兒體重預測顯得尤為重要。在過去的30年中,對胎兒體重預測模型的研究有幾十種之多。目前準確性最高、臨床最常用的仍然是1985年Hadlock等報道的基于超聲測量數據所建立的回歸模型。據報道該模型對胎兒體重預測準確率(出生體重±10%)只有67%~86%[1-8]。當然也有基于臨床數據(孕婦宮高及腹圍)的胎兒體重預測模型,其預測的準確性更低,僅占55.0%~74.3%[5,9]。2017年,國際胎兒和新生兒生長聯盟嘗試構建一個通用的胎兒體重預測模型,即Intergrowth-21st模型[10]。有研究表明其預測準確率為57.6%~72.6%[11-13]。可見,胎兒體重預測的準確性有待提高。近年來,為了提高胎兒體重預測準確率,有研究已將目光轉移到三維超聲[11,14-15]及磁共振[16-17]檢查方面。雖然三維超聲和磁共振檢查從一定程度上提高了預測準確率,但仍不理想。考慮三維超聲和磁共振檢查并非常規測量,且費用較高,耗時較長,目前難以普遍推廣應用。因此,如何應用更為全面的孕婦生理參數和超聲參數,建立一種比較簡便同時又較傳統方法更加準確和個性化的胎兒體重預測方法,將估計胎兒體重的誤差減小至產科臨床可接受范圍內,仍是亟待解決的重大挑戰。

隨著人工智能技術的不斷發展,使進一步提高胎兒體重預測的準確性成為了可能。支持向量回歸(support vector regression,SVR)[18]是機器學習算法的一種,是一種模仿人腦的非線性信息處理系統。該方法通過數學建模的方式模擬人類的學習過程,可用于真實結果的預測。因此,本研究嘗試聯合應用臨床數據及超聲數據,擬構建一種方便、經濟且性能良好的基于SVR的新型胎兒體重預測模型(簡稱新模型)。

1 研究對象與方法

1.1 研究對象

1.1.1 數據的收集及臨床數據庫的建立

收集2020年1月至6月在寧波大學醫學院附屬醫院分娩的1 442例孕產婦(限單胎頭位孕晚期)的臨床資料,于分娩前1周內采集相關數據,最大可能地減少誤差。收集的數據共計18維,包括3個方面,①母親數據:年齡、孕周、胎產次、身高、體重、宮高、孕婦腹圍、孕期增重、是否妊娠期糖尿病(gestational diabetes mellitus,GDM)、分娩方式(順產/產鉗/剖宮產)等;②超聲測量的胎兒數據:雙頂徑、頭圍、股骨長、胎兒腹圍、羊水指數;③胎兒情況:胎頭是否入盆(未入盆/淺入盆/入盆)、性別、出生體重。

1.1.2 納入標準

單胎,頭位,妊娠31~42周,有明確的末次月經或可依據早孕期超聲測量頭臀長度確定孕周,中孕期大畸形篩查未見胎兒結構異常。本研究經寧波大學醫學院附屬醫院倫理委員會批準(批件號KY20201121)。所有參與本研究的納入對象均簽署知情同意書。

1.2 機器學習算法的選擇

分別應用以下方法對現有數據進行預實驗,通過對比選出最優的算法。

①基于多層感知機的反向傳播算法(Back Propagation):通過隨機變量的多元線性組合和非線性函數激活,從而擬合目標函數,并通過誤差反傳,迭代調整多層感知機的參數權重,自動學習最佳的映射函數;②決策樹回歸(Regression Tree):通過尋找樣本中最佳的特征及特征值作為最佳分割點,構建一棵二叉樹,在預測階段,根據提供的樣本特征,以葉子節點的值作為預測值;③多元線性回歸(Multivariable Linear Regression):通過2個或2個以上的影響因素作為自變量解釋因變量的變化;④輕量梯度提升機(Light Gradient Boosting Machine):簡稱LightGbm,其為一種集成學習方法,通過合并多個決策樹構建一個更為強大的模型,采用連續的方式構造樹,每棵樹都試圖糾正前一棵樹的錯誤;⑤SVR:在支持向量機(Support Vector Machine,SVM)的基礎上,將最大化分類間隔的分類任務替換為最大化回歸范圍的回歸任務的變種。

1.3 構建基于SVR的新模型

1.3.1 選出建模參數

根據預實驗結果,分別計算每個特征與新生兒出生體重的皮爾遜相關系數,應用SVR算法權重,結合臨床經驗,反復進行實驗后,根據實驗結果選擇建模所需的參數。

1.3.2 應用SVR建模

SVR算法是在SVM基礎上發展起來的一種自回歸算法。SVM算法是利用核函數的方法,將在低維特征空間線性不可分的樣本映射到更高維特征空間,使得線性可分。

SVR算法是建立在SVM理論基礎上的一種回歸算法,給定數據集D={(x1,y1),(x2,y2),…,(xm,ym)|m∈R},學習目標回歸函數f(x),f(x)=wTφ(x)+b,其中φ(x)為非線性映射函數[12]。以學習到的函數f(x)為回歸中心,構建一個寬度為2ε的間隔帶,若測試樣本落入此間隔帶,則認為是被預測正確的樣本。

1.3.2.1 數據的預處理 數據預處理是數據挖掘分析的基礎,主要分析數據來源,對數據進行采集、清洗、規整,實現對數據的規范化,為之后的數據分析打下良好基礎[19]。對新生兒出生體重預測問題主要采集的數據:一是孕婦相關數據;二是B超數據;三是胎兒相關數據。

針對采集的數據,需要進一步進行處理。①離散數據的數值化:對采集數據中的是否GDM進行數值化,應用Python語言對其進行處理,將有GDM標記為0,無GDM標記為1;②異常值處理:在采集到的數據中,不免會出現數據缺失、異常等情況,對于缺失的數據,首先引入Python語言的一個擴展程序庫Pandas,其是一個強大的分析結構化數據的工具集,應用Pandas中的read excel()方法來讀取數據文件,并應用數據處理工具包NumPy(Numerical Python)進行數據清洗,踢除含有空值的數據。

1.3.2.2 模型的構建 數據集經過預處理后進行劃分,應用sklearn.model selection中的train test split函數將原始數據集劃分為訓練集和驗證集,且劃分比例為9∶1。SVR模型中核函數的主要作用是將高維數據映射為低維數據,常見的核函數有‘rbf’‘linear’‘poly’,實驗對比后選擇應用linear核函數,應用該核函數在訓練集上可以更好地擬合數據,見圖1。同理,懲罰因子C在超參數調優后設為1.35。將收集到的數據以90%用于訓練,而10%用于驗證。損失函數選用平均絕對誤差(mean absolute error,MAE)。構建出基于SVR的新模型。

1.3.2.3 模型的評估 將新模型與經典胎兒體重預測模型(Hadlock1模型和Intergrowth-21st模型)對比,比較平均絕對百分比誤差(mean absolute percentage error,MAPE)、MAE、均方根誤差(root-mean-square error,RMSE)及胎兒體重預測準確率來評估每個模型的胎兒體重預測的準確性,評估新模型的性能。

MAPE=(|預測體重值-實際體重值|)/實際體重值×100%。計算預測體重與實際出生體重誤差的絕對值占實際出生體重的百分比,求其平均值及標準差,可準確評估誤差的大小。

MAE=|預測體重值-實際體重值|。直接計算預測體重與實際出生體重誤差后進行平均,平均值和標準差均以g為單位,與原始數據量綱一致,便于直接進行比較。

RMSE為回歸分析中常用的評價指標,常出現于應用回歸分析等方法的研究中,可準確評估誤差的大小,且量綱與原始數據相同,便于直接比較。

將預測體重與實際出生體重MAE在250g以內定義為預測準確;5%預測準確率是指預測體重與實際出生體重之間誤差不超過5%實際出生體重,10%預測準確率是指預測體重與實際出生體重之間誤差不超過10%實際出生體重。預測準確率(%)=成功預測數量/總數量×100%。

1.4 統計學方法

應用的計算工具基于Python 3.7語言,其中包括數據處理工具NumPy 1.19.5和Pandas 1.3.5及數學建模工具Scikit-learn 1.0.1。Pandas用來讀取數據文件;應用NumPy進行數據清洗,剔除異常樣本,對數據進行處理及統計;采用Scikit-learn對處理后的數據進行數學建模。

2 結果

2.1 孕產婦的基本資料

本研究選取了2020年上半年間符合納入標準的孕產婦共計1 442例,總共納入18維參數,其中GDM孕產婦242例,其他孕產婦1 200例;經陰道分娩824例,剖宮產618例;孕次為1~8次,平均(1.95±1.16)次;初產婦948例,二胎分娩475例,三胎分娩19例;男嬰747例,女嬰695例;其余納入的14維參數及總體樣本的均值見表1。

表1 孕產婦的基本資料及數據范圍Table 1 The basic data and data scope of pregnant women

2.2 應用預實驗選出最優算法SVR

應用基于多層感知機的神經網絡、決策樹回歸、多元線性回歸、LightGbm、SVR算法對現有數據進行預實驗,共計18維,有效數據1 442條,其中1 297條作為訓練數據,145條作為測試數據,計算MAPE、MAE、RMSE及胎兒體重預測準確率。

LightGbm算法的10%誤差預測準確率最高,Linear-Regression算法的250g誤差預測準確率最高,SVR算法的5%誤差預測準確率最高,且SVR算法有最小的MAPE、MAE和RMSE。LightGbm算法在尋找最優解時,依據的是最優切分變量,未將最優解受所有特征綜合影響考慮進去,多元線性回歸算法對于數據特征間具有相關性多項式回歸難以建模,BP算法預測精度不高。對于特征維度少的數據,SVR不易造成過擬合,添加的松弛變量可以提高模型的泛化性。LinearSVR應用線性核函數,在實驗過程中難以收斂;NuSVR預測MAE較SVR低。因此選擇SVR作為預測算法。

觀察實驗結果發現,在應用全部數據的條件下,不同算法得到預測模型的預測性能指標見表2。

2.3 應用SVR建立新模型

2.3.1 選出建模參數

分別計算每個特征與新生兒出生體重的皮爾遜相關系數,其中,P值作為判斷變量之間是否存在相關性的指標,當P>0.05時,相關性系數無統計學意義,即該特征與觀測值無相關性;當P≤0.05時,表示兩者具有相關性,此時r值越大,代表相關性越高,兩者間的線性相關性越大。如:B超胎兒腹圍數據P值接近0,說明該特征與觀測值顯著相關。新生兒性別的r值為負數,該特征與觀測值呈負相關。

表2 不同算法的預測準確率及預測誤差Table 2 The prediction accuracy and error of different algorithms

根據皮爾遜相關系數的結果,P>0.05表明該特征與新生兒出生體重相關性小,因此孕婦年齡(r=0.03,P=0.19)不予采用;考慮在收集數據時對采集時間有1周內的限制,因此采集時間(r=0.01,P=0.77)予以保留;是否為GDM(r=-0.05,P=0.04)中P值接近0.05,且r值很小,因此不予采用;雖然胎兒性別(r=-0.12)、分娩方式(r=0.15)、孕次(r=0.06)、產次(r=0.07)的P<0.05,但其r值均較小,且胎兒性別及分娩方式在出生前臨床上無法獲知,因此這些特征不予采用,見表3。根據皮爾遜相關性分析,雖然分娩孕周相關性相對尚可(r=0.42,P=4.56×10-64),但考慮到臨床應用的方便,不便采納過多的參數,因此分別應用包含12維特征及去除分娩孕周的11維數據進行建模,結果顯示兩者的預測誤差在250g以內分別為72.41%和73.10%,因此,分娩孕周不予采用。

最后篩選出建模所需的11維參數分別為:身高、體重、孕期增重、宮高、孕婦腹圍、雙頂徑、頭圍、股骨長、胎兒腹圍、羊水指數和采集時間(采集時間距分娩的天數)。

表3 新生兒出生體重與不同參數的皮爾遜相關系數Table 3 Pearson correlation coefficient between newborn birth weight and different parameters

應用SVR算法對11維參數進行權重對比,數值越大表示參數影響越大,本資料顯示宮高的SVR權重最大,說明在新模型中影響最大,見表4。

表4 納入建模參數的SVR算法權重對比Table 4 Weight comparison of the SVR algorithm incorporating the modeling parameters

2.3.2 構建新模型

應用SVR對篩選后的11維參數及18維參數分別建模,并對其建模結果進行對比。應用18維參數構建的模型10%預測準確率與應用11維參數構建的模型預測準確率相同,均為88.28%,從MAPE、MAE及RMSE方面而言差別也較小;換而言之,應用18維與11維兩種參數建模所得到的預測模型在預測性能方面相差無幾,見表5。考慮臨床應用的實際情況,不宜選擇過多的參數,因此選擇應用11維參數構建的模型為新模型。

表5 應用不同維度參數建模的性能對比Table 5 Performance comparison of modeling with different dimension parameters

2.4 評估新模型性能

將新模型與經典胎兒體重預測模型(Hadlock1模型及Intergrowth-21st模型)對比,以MAPE、MAE、RMSE及胎兒體重預測準確率評估新模型的性能。與Hadlock1及Intergrowth-21st模型相比,預測誤差在5%以內的胎兒體重預測準確率為54.48%、預測誤差在10%以內的為88.28%、預測誤差在250g以內的為73.10%,新模型具有最高的胎兒體重預測準確率。此外,胎兒體重預測新模型還具有最低的MAPE(5.24%)、MAE(178.43g)、RMSE(230.15g),見表6。

表6 新模型與經典模型的對比Table 6 Comparison of the new model and the classical model

3 討論

3.1 新模型的預測性能及原因分析

本研究表明,與Hadlock1模型及Intergrowth-21st模型相比,新模型具有最高的胎兒體重預測準確率,即54.48%胎兒的預測體重與實際出生體重之間誤差不超過5%,88.28%胎兒的預測體重與實際出生體重之間誤差不超過10%,73.10%胎兒的預測體重與實際出生體重差距在250g以內。另外,新模型還具有最低的MAPE(5.24%)、MAE(178.43g)和RMSE(230.15g),說明新模型預測誤差最小。因此,新模型具有最優的預測性能。

本研究顯示,Hadlock1模型比Intergrowth-21st模型的預測準確率高(87.59%,77.93%;<10%),預測誤差小(189.00g,236.66g;MAE),這與既往的研究結論[20]相符合,即基于3~4個參數預測模型較1~2個參數預測模型的預測準確率高,誤差小。既往研究表明,不同超聲醫師[21]測量、胎先露不同[22]、羊水量[23-25]、孕產婦肥胖[26-27]等都會影響胎兒超聲體重預測模型的準確性[20,27-28]。而Hadlock1模型僅僅是基于超聲測量的胎兒雙頂徑、股骨長、頭圍及腹圍,未聯合羊水指數、臨床數據等參數,且在建模時應用線性回歸的方法。這些可能就是其預測準確率有待提高的原因。

3.2 SVR的優勢

機器學習與傳統的參數回歸模型相比有著不可替代的優越性,可以進行自動化學習,以任意精度逼近任意復雜的非線性映射[19]。因此,本研究將機器學習算法引入胎兒體重預測模型,使得聯合多維參數構建胎兒體重預測模型成為可能。為了構建最佳的新模型,本研究從以下幾方面做出了努力。首先,新模型聯合了多維參數,彌補了既往模型參數較少的缺點;其次,通過預實驗,對比不同的機器學習算法,從而選出最適合的機器學習算法,即SVR;最后,如何選擇合適的建模參數,即如何才能應用最少維度的參數得到最佳的預測性能也是本研究的重點。

本研究初期收集了盡可能全面的18維參數,考慮數據中可能存在混雜因素,因此計算每個參數與新生兒出生體重的皮爾遜相關系數,相關性小的參數不予采用,最終得到建模所需的11維參數,包括:身高、體重、孕期增重、宮高、孕婦腹圍、雙頂徑、頭圍、股骨長、胎兒腹圍、羊水指數及采集時間(采集時間距分娩的天數)。為了進一步驗證應用11維參數構建模型的預測準確率,本研究對11維參數模型與18維參數模型進行了對比,結果顯示應用11維參數構建的新模型與18維參數構建的體重預測模型在預測準確率及誤差等方面相差無幾。因此,本研究最終決定應用11維參數構建胎兒體重預測模型。本研究所納入的11維參數均是臨床病例書寫所必需采集的數據信息,本研究構建的新模型在未來可以直接植入電子病例系統,從電子病例中對所需數據進行提取,從而直接得到預估的胎兒體重,以供臨床參考。

3.3 不足與局限性

本研究為單中心回顧性研究,樣本量相對不足,采集的臨床數據存在測量偏差等不足之處。未來需要更多、更為全面的臨床試驗加以進一步的驗證,這些因素也是未來研究所要考慮的問題。

綜上所述,新模型是一種應用多維參數,基于SVR的新模型。新模型具有預測準確率高、誤差小,且經濟、方便等優勢,值得臨床推廣應用。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久精品免费看一| 亚洲精品午夜无码电影网| 中文字幕欧美日韩高清| 亚洲视频影院| 亚洲三级电影在线播放| 国产在线一区二区视频| 国产欧美日韩视频一区二区三区| 国产jizzjizz视频| 中文字幕乱码中文乱码51精品| 亚洲天堂高清| 欲色天天综合网| 午夜激情福利视频| 人妻精品全国免费视频| 91精品国产无线乱码在线| 国产青青草视频| 日本www在线视频| 国产女同自拍视频| 91精品久久久久久无码人妻| 91无码人妻精品一区二区蜜桃| 国产高颜值露脸在线观看| 99精品国产自在现线观看| 无码区日韩专区免费系列| 国产麻豆精品久久一二三| 欧美笫一页| 欧美色综合网站| 免费国产好深啊好涨好硬视频| 国产欧美专区在线观看| 亚洲欧美日韩天堂| 久久免费视频6| 国产AV无码专区亚洲精品网站| 亚洲一区二区三区中文字幕5566| 亚洲清纯自偷自拍另类专区| 国产一在线| 激情综合图区| 国产欧美日韩一区二区视频在线| 国产一级毛片yw| 美女被狂躁www在线观看| 伊人精品视频免费在线| 日本色综合网| 亚洲综合色婷婷中文字幕| 日韩欧美国产综合| 亚洲综合精品香蕉久久网| 手机永久AV在线播放| 亚洲全网成人资源在线观看| 视频一本大道香蕉久在线播放| 成人精品亚洲| jizz国产视频| 国产区精品高清在线观看| 区国产精品搜索视频| 久久国产精品77777| 精品国产污污免费网站| 在线中文字幕日韩| 亚洲 欧美 日韩综合一区| 婷婷六月激情综合一区| 国产一区二区三区免费观看| 日韩色图区| 亚洲精品麻豆| 国产精品亚洲五月天高清| 国产成人乱无码视频| 亚洲日本一本dvd高清| 黄色在线不卡| 草草影院国产第一页| 国产超碰一区二区三区| 老司机久久99久久精品播放| 亚洲精品动漫在线观看| 精品久久综合1区2区3区激情| 美女视频黄又黄又免费高清| 日日拍夜夜操| 欧美在线观看不卡| 国产女人在线| 伊人精品成人久久综合| 国产综合网站| 日韩欧美国产另类| 伊人网址在线| 在线观看免费人成视频色快速| 99re热精品视频中文字幕不卡| 婷婷综合在线观看丁香| 国产成人综合亚洲欧美在| 精品久久香蕉国产线看观看gif| 全部免费毛片免费播放 | 国产精品19p| 在线色综合|