999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LASSO 變量選擇聯合貝葉斯網絡構建惡性腫瘤相關急性腎損傷(AKI)風險預測模型

2020-09-04 09:38:18陳曉泓王一梅胡家昌沈子妍丁小強
復旦學報(醫學版) 2020年4期
關鍵詞:因素模型

李 陽 陳曉泓 王一梅 胡家昌 沈子妍 沈 波 林 靜 丁小強

(復旦大學附屬中山醫院腎內科 上海 200032)

21 世紀以來,隨著靶向藥物和腫瘤干細胞治療等新型治療技術的發展,惡性腫瘤患者的中位生存時間在過去數十年間已有所改善。與此同時,越來越多的患者出現了腫瘤或腫瘤治療相關的腎臟疾病,進一步加重了全球疾病負擔[1]。急性腎損傷(acute kidney injury,AKI)是惡性腫瘤患者中最常見的并發癥之一,主要表現為腎功能突然下降,進而導致尿素和其他含氮廢物潴留以及細胞外液容量和電解質失調。據估計,全球腫瘤相關AKI 的發病率約為21.3%[2]。惡性腫瘤相關AKI 的發生是腫瘤直接損傷、化療藥物腎毒性、腫瘤治療并發癥和其他致病因素等共同作用的結果[3]。復雜的發病機制使得腫瘤相關AKI 的病因識別困難,進一步加重了臨床預防和診治的難度。與此同時,上述眾多的危險因素彼此存在交互作用,以Logistic 回歸為主的傳統統計分析方法并不適用,亟待開發以大數據處理和人工智能分析為基礎的優化統計方法。貝葉斯網絡(Bayesian network)是基于概率的不確定性推理方法,通過構建有向無環圖直觀反映多因素間的潛在關系,利用條件概率分布表反映關系強度[4]。套 索(least absolute shrinkage and selection operator,LASSO)回歸方法通過構造懲罰函數得到較為精煉的模型,在處理存在多重共線性的樣本數據時有明顯的優勢[5]。因此,本研究利用LASSO 回歸和貝葉斯網絡分析方法,構建適合腫瘤患者AKI發病風險的貝葉斯網絡預測模型,為早期識別高危人群,制訂AKI 精準預防策略,有效提升抗腫瘤治療效果和患者預后提供科學依據。

資料和方法

研究對象納入標準:2014 年10 月1 日至2015年9 月日30 在復旦大學附屬中山醫院就診的經病理學確診的惡性腫瘤住院患者。排除標準:年齡未滿18 周歲,住院時間小于24 h;慢性腎臟病4~5 期患者和接受腎透析或腎移植者。

數據收集本研究所用數據資料摘錄于上述患者的病案記錄和入院體檢數據。在數據提取和分析前,患者個人身份識別信息用編碼代替,以保護個人隱私。本研究納入分析的變量有27 個:年齡、性別、體重指數(body mass index,BMI)、既往疾病(高血壓、糖尿病、心臟病、中風和心力衰竭)、癌癥類型和分期、入院情況、治療方式、基礎肝功能[(丙氨酸轉氨酶(alanine aminotransferase,ALT)、天門冬氨酸轉氨酶(aspartate aminotransferase,AST)和總膽紅素(total bilirubin,TBiL)]、基礎腎功能[血清肌酐值(serum creatinine,SCr)、腎小球濾過率(estimated glomerular filtration rate,eGFR)和血尿酸]、生化指標(白蛋白、血紅蛋白和白細胞計數)以及電解質數據(鈉、鉀、氯、鈣、鎂和磷)。

惡性腫瘤診斷和AKI 定義惡性腫瘤的診斷標準參照國際疾病分類ICD-10,并將其分為28 個小類[6]。根據腫瘤的不同部位和分期,又將其進一步分為血液系統腫瘤、實體瘤、原發腫瘤和轉移腫瘤。AKI 診斷參照“改善全球腎臟病預后組織KDIGO”標 準[7]:48 h 內血清 肌 酐水平升 高≥0.3 mg/dL(≥26.5 μmol/L)或超過基礎值的1.5 倍及以上,且明確或經推斷上述情況發生在7 天之內;或持續6 h 尿量<0.5 mL·kg-1·h-1。本研究經復旦大學附屬中山醫院倫理委員會批準(編號:B2018-175)。

LASSO 回歸方法LASSO 方法的原理是在最小二乘基礎上增加了一個懲罰項來對估計參數進行壓縮,當參數縮小到小于一個閾值時,令它變為0,從而選擇出對因變量影響較大的自變量并計算出相應的回歸系數,常用于處理存在多重共線性的樣本數據。LASSO 回歸復雜度調整的程度由參數λ 控制,λ 越大則模型復雜度的懲罰力度越大。通過LASSO 回歸,可使最終納入模型的變量均為與因變量顯著相關(P<0.05)且考慮變量共線性問題的自變量集合。模型篩選的方法主要包括lambda.min和lambda.1se。lambda.min 是指得到最小目標參量均 值的λ 值;而lambda.1se 是 指 在lambda.min 一 個方差se 范圍內得到最簡單模型的λ 值。由于λ 值到達一定值之后,繼續增加模型自變量個數并不能很顯著地提高模型性能,因此lambda.1se 可以給出一個具備優良性能但是自變量個數最少的模型。

貝葉斯網絡模型基本原理貝葉斯網絡是一種應用概率傳播原理進行不確定性信息的推理和數據分析的統計學方法。它通過構建一個有向無環圖G=(V,A,P)來構建反映變量間的交互作用和概率依賴關系。有向無環圖主要由表示隨機變量的節點vi∈X和描述變量間概率關系的有向邊aij∈A兩部分構成。節點間的概率依賴關系則由條件概率分布表來呈現:P(X)=P(Xi|ΠXi;ΘXi),其中ΘXi表示節點變量Xi的模型參數,ΠXi表示節點變量Xi的父節點集合。貝葉斯網絡分析結合了概率論和圖論的優勢,可以在分析影響因素的同時進一步直觀地描述自變量之間的相互作用以及其與因變量之間的復雜網絡,這有助于全面探討疾病因果聯系和發現未知或潛在的危險因素。

統計學分析采用SPSS 20.0 軟件進行統計描述和單因素分析,檢驗水準均取0.05。基于LASSO回歸的變量選擇在R 3.3.1 軟件的glmnet package 中完成。分類變量在納入模型前先進行啞變量形式進行轉化(27 個自變量轉為43 個候選變量)。最終納入模型的啞變量按照成組變量“同進同出”的原則全部選入分類變量。貝葉斯網絡分析借助于R 3.3.1 軟 件中的bnleam package:(1)禁忌搜 索算法(tabu 函數)進行網絡結構學習;(2)極大似然估計法(bn.fit_MLE 函 數)進 行 網 絡 參 數 學 習;(3)cpquery 函數進行貝葉斯網絡推理和條件概率分布表計算。貝葉斯網絡圖形繪制在Netica 32.0 軟件內完成。在Weka3.8.0 平臺評價AKI 貝葉斯網絡預測模型預測效能,此外本研究將完整數據集按照4∶1的比例隨機劃分為訓練集和測試集,用訓練集重新估計貝葉斯網絡參數,并以測試集來驗證在既定網絡模型結構下外部預測一致性。

結 果

人口學和臨床特征共納入26 914人,平均年齡(58.7±12.5)歲,男性占比66.7%。3 326 名(12.4%)患者在住院期間被診斷為AKI,其中腎癌(27.3%)、多發性骨髓瘤(24.1%)和急性粒細胞白血病(23.9%)患者的AKI 發病率最高。隨著年齡增加,腫瘤相關AKI 發病率由9.5%升至19.4%(P<0.001);男性腫瘤患者AKI 發病率略高于女性(12.7%vs.11.6%);BMI與AKI發生呈負相關(圖1)。

腫瘤相關AKI 發病相關臨床危險因素分析由表1 可知,共患高血壓、糖尿病和既往發生過心力衰竭的腫瘤患者住院期間發生AKI 的風險顯著增加;血液系統腫瘤、存在腫瘤遠處轉移和急診入院的患者AKI 發病率更高,未校正OR 值(crude odds ratio,cOR)依次為1.33、1.14 和1.64。與未治療/姑息治療相比,接受手術治療和化學治療者更容易發生AKI(cOR=3.86 和2.09)。基礎肝腎功能異常與AKI的發生亦顯著相關,eGFR≤59 mL·min-1·1.73 m-2和血尿酸水平≥481 μmol/L 的住院患者發生AKI 的風險最高(cOR=16.40 和5.74)。在生化指標方面,低白蛋白血癥和貧血患者更容易在住院期間出現AKI(cOR=2.26 和3.05)。此外,各種類型的電解質紊亂均與AKI 的發生相關,其中入院時已出現低鈉和高鉀的患者AKI 發生風險為血鈉/鉀正常者的3.11 和10.33 倍。

表1 癌癥患者腫瘤相關AKI 發病臨床相關危險因素單因素分析Tab 1 Clinical factors and univariate analysis for AKI incidence among cancer patients (n=26 914)

(續表1)

基于LASSO 回歸的預測模型變量選擇在研究初期納入的27 個變量在啞變量轉換后(43 個候選變量),通過LASSO 模型回歸最終篩選出22 個與AKI 發生相關性最顯著的變量,包括年齡、性別、BMI、糖尿病史、腫瘤類型、腫瘤分期、治療方式、血鈉、血鉀、血氯、血鈣、血鎂、血磷、ALT、AST、TBiL、eGFR、SCr、血尿酸、白蛋白、血紅蛋白和白細胞計數。圖2 為選用10 倍交叉驗證擬合不同變量組合下的模型,并用接收者操作特征曲線(receiver operating characteristic curve,ROC)下面積(area under the curve,AUC)與參數λ 的Log 值作圖。按照lambda.1se 變量篩選準則,最終在λ 取值0.000 4[log(λ)=-5.34]時獲得具備優良性能但是自變量個數最少的模型。

貝葉斯網絡模型構建按照LASSO 回歸篩選的變量,構建含有23 個節點、43 條有向邊的腫瘤相關AKI 貝葉斯網絡發病預測模型,并獲得各節點的條件概率。從圖3 網絡可見,年齡、性別、BMI、既往病史、腫瘤類型/治療、基礎肝腎功能、生化和電解質指標等變量通過復雜的網絡關系與AKI 建立聯系:血紅蛋白、eGFR、血氯和血磷與AKI 的發生有直接聯系;節點治療方式通過影響血鈉、白蛋白等中間節點聯系,間接地影響AKI 的發生;糖尿病和性別通過節點血尿酸間接相連eGFR,而后者是AKI 的父節點;白蛋白、ALT 和白細胞計數等通過影響血氯和血磷水平,間接與AKI 建立聯系,而AKI 的發生又進一步成為血鉀和血鎂的父節點,這提示電解質紊亂與AKI 的發生存在伴隨關系,通過早期評估基礎腎功能和電解質水平可以有效預防AKI 發生。

貝葉斯網絡模型推理圖4 為血紅蛋白和eGFR 不同水平與腫瘤相關AKI 發病情況之間的條件概率分布。在其他條件一致的情況下,貧血和eGFR≤59 mL·min-1·1.73 m-2的患者發生AKI 的概率最高(55.7%);與之相比,上述指標均正常者AKI發病率最低(3.0%)。這提示基礎腎功能和血紅蛋白在腫瘤相關AKI 的發生和發展中可能存在伴隨關系。與此同時,已知任意節點組合信息都可以通過上述貝葉斯模型估計AKI 的發生概率。例如年齡75 歲、接受手術治療、入院時存在貧血、低鈉和高尿酸血癥的男性患者發生AKI 的概率為34.3%;此時如果及時糾正貧血、血鈉和尿酸情況,其發生AKI 的概率可降至9.6%(圖5)。

貝葉斯網絡預測效能評價Weka 模型評價發現貝葉斯網絡模型的分類準確率為88.8%,AUC 值為0.806(表2);10 倍交叉驗證評價顯示AUC 值亦保持在0.802 的水平。在既定貝葉斯網絡結構下,本研究將數據集按照4∶1 的比例進一步隨機劃分為訓練集和測試集,用訓練集來重新訓練網絡參數,并以測試集來驗證模型外部預測準確性。結果顯示測試集內AKI 預測準確性為88.4%,AUC 值為0.789(95%CI:0.769~0.808),提示模型具有良好的外部一致性。

討 論

本研究發現惡性腫瘤患者中,急性腎損傷的發生概率為12.4%,這一比率亦略低于國內外其他文獻 結 果:法 國(16.9%)[8],日 本(17.9%)[9],美 國(12.0%)[10],中國大陸(18.6%)[11]和中國臺灣地區(23.3%)[12]。AKI 發病率的差異一方面可能與調查人群臨床特征和地區差異等選擇偏倚有關;另一方面,部分患者缺乏持續性肌酐檢測也可能會低估當前的AKI 發病率。國內另一項研究也顯示超七成患者社區獲得性AKI 存在漏診和診斷延誤,僅有28.3%可以及時獲得診斷[13]。這提示有必要研究影響AKI 發生的主要危險因素,并以此構建風險預測模型以早期識別和預防腫瘤相關AKI。

癌癥患者中AKI 的病因通常是多因素相互作用且錯綜復雜的。除年齡、既往高血壓和糖尿病等一般已知危險因素外,本研究發現接受手術治療、化學治療和介入治療等也是AKI 發生的主要危險因素(cOR:1.67~3.86)。手術治療由于涉及血流動力學改變,術后發生AKI 的風險顯著增加。很多化療藥物已經被證實存在潛在腎毒性:Darmon 等[14]研究發現超過80%的腫瘤患者曾服用非甾體抗炎藥、雙磷酸鹽和甲氨蝶呤等。它們可以通過多種影響腎小球、腎小管節段、間質組織和/或腎微血管系統的機制觸發腎損傷。介入治療中靜脈輸注造影劑或大劑量甲氨蝶呤等導致的結晶也可引起腎小管內梗阻。

貝葉斯網絡模型有助于揭示影響腫瘤相關AKI 發病的各危險因素之間的復雜網絡關系。除eGFR 和血紅蛋白等與AKI 直接聯系以外,治療方式、腫瘤類型等變量是通過與血鈉、血氯和血磷等電解質異常聯系,也可以間接影響AKI 的發生,而AKI 有本身又是血鎂和血鉀的父節點。這提示電解質紊亂與AKI 的發生存在伴隨關系,通過入院時早期監測電解質水平有助于早期識別AKI,尤其是社區獲得性AKI 的發生。英國衛生署報告也表示通過入院及時監測電解質水平、早期識別危險因素并實施系統管理可以避免約1/5 的AKI 發生[15]。

在AKI 風險預測方面,本研究發現基于LASSO 回歸聯合貝葉斯網絡分析構建的風險預測模型的分類準確率88.8%,ROC 曲線下面積為0.806。與傳統Logistic 回歸相比,該模型具有較好的預測效果和合理性。在臨床研究領域,醫學數據變量間存在復雜的交互作用,此時使用以變量獨立性為條件的多因素Logistic 回歸分析時往往會因為變量間的多重共線問題而錯誤估計變量效應。因此,如何在海量變量中選擇出性能參數最好的變量且避免模型過度擬合是大數據分析的關鍵問題之一。LASSO 回歸的特點是在擬合廣義估計方程的同時進行變量篩選和復雜度調整,從而有效解決變量共線性問題并最終獲得精簡的統計模型。Huang等[16]利用LASSO 從150 多個臨床指標中篩選出24個關鍵指標并以此開發并驗證了影像組學聯合CT和臨床危險因素列線圖模型,用于預測結直腸癌術前淋巴結轉移的風險。在數據間交互作用方面,Logistic 分析只能揭示出AKI 發病的幾個獨立影響因素,而貝葉斯網絡模型可以通過變量間網絡圖進一步描述各因素間的相互作用及其對AKI 的影響。這一特點有助于全面深入發掘因素間的內部調控關系,進而發現識別關鍵因素和探索潛在因素具有一定的意義。本研究的局限性在于:(1)以醫院為基礎的單中心觀察性研究,惡性腫瘤住院患者分布可能不具有人群代表性,在今后的研究中將聯合多家醫療機構進行研究,以提高樣本代表性,并驗證外部適用性。(2)本研究納入的變量有限,尚未納入腎毒性藥物等其他關鍵變量,這勢必會影響模型的預測準確性,在今后的研究將盡可能前瞻性地收集更多的變量信息以提高模型預測準確性。

綜上所述,AKI 是惡性腫瘤患者中常見并發癥,致病因素眾多且彼此存在紛繁復雜交互作用。入院及時監測電解質水平、識別危險因素和避免腎毒性藥物使用等有助于早期預防和診斷AKI。基于LASSO 回歸聯合貝葉斯網絡分析構建的風險預測模型在影響因素分析中更符合實際理論,在AKI發病風險預測方面具有較好的臨床應用價值。

表2 腫瘤相關AKI 貝葉斯網絡風險預測模型評價Tab 2 Model evaluation for Bayesian network of AKI

猜你喜歡
因素模型
一半模型
腹部脹氣的飲食因素
中老年保健(2022年5期)2022-08-24 02:36:04
四大因素致牛肉價小幅回落
今日農業(2021年17期)2021-11-26 23:38:44
食品安全的影響因素與保障措施探討
群眾路線是百年大黨成功之內核性制度因素的外在表達
當代陜西(2021年12期)2021-08-05 07:45:46
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
短道速滑運動員非智力因素的培養
冰雪運動(2016年4期)2016-04-16 05:54:56
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产精品va| 中文字幕日韩欧美| 色悠久久久久久久综合网伊人| 青青草91视频| 国产免费网址| 国产国拍精品视频免费看| 国产91小视频在线观看| 国产色伊人| 91www在线观看| 国产免费羞羞视频| 91精品国产自产91精品资源| 91成人在线观看| 青青久在线视频免费观看| 久久成人免费| 亚洲精品无码久久久久苍井空| 高潮爽到爆的喷水女主播视频| 欧美成人第一页| 好吊色国产欧美日韩免费观看| 亚洲精品天堂在线观看| 丁香六月综合网| 欧美一级大片在线观看| 热久久综合这里只有精品电影| 在线观看网站国产| 2020久久国产综合精品swag| 国产国语一级毛片| 亚洲欧美日韩成人在线| 亚洲色偷偷偷鲁综合| 青青极品在线| 丰满人妻中出白浆| 91成人免费观看在线观看| 免费毛片全部不收费的| 欧美精品v欧洲精品| 成人av专区精品无码国产 | 日韩黄色大片免费看| a国产精品| 丰满人妻被猛烈进入无码| 亚洲九九视频| 日本免费精品| 亚洲成人一区二区| 亚洲成在线观看 | 在线看AV天堂| 九色91在线视频| 日韩在线1| 欧美日韩91| 丁香婷婷在线视频| 国产最新无码专区在线| 激情無極限的亚洲一区免费| 精品少妇三级亚洲| 好吊色国产欧美日韩免费观看| 亚洲国产日韩欧美在线| 狠狠色香婷婷久久亚洲精品| 精品无码人妻一区二区| 在线播放精品一区二区啪视频| 成人精品视频一区二区在线| 国产又大又粗又猛又爽的视频| 欧美成人h精品网站| 青青草欧美| 全色黄大色大片免费久久老太| 极品国产在线| 国产精品偷伦视频免费观看国产| 国产爽歪歪免费视频在线观看| 亚洲天堂首页| 影音先锋丝袜制服| 国产亚洲精品自在久久不卡| 亚洲色无码专线精品观看| 国产成人1024精品下载| 999国产精品永久免费视频精品久久| 无码又爽又刺激的高潮视频| 欧美在线黄| 日本免费新一区视频| 99爱在线| 亚洲国产成人在线| 无码久看视频| 亚洲人成日本在线观看| 婷婷激情亚洲| 欧美日韩在线亚洲国产人| 日本一区中文字幕最新在线| AV片亚洲国产男人的天堂| 国产鲁鲁视频在线观看| 亚洲午夜国产精品无卡| 999福利激情视频| 亚洲性色永久网址|