








文章編號:2096-1472(2024)03-0015-06
DOI:10.19644/j.cnki.issn2096-1472.2024.003.004
摘"要:為了有效預測重癥監護室膿毒癥患者的死亡風險并分析影響結局的因素,建立了膿毒癥患者死亡風險預測模型,為膿毒癥患者的早期預防和死亡風險控制提供科學的參考依據。本研究以重癥監護醫學信息市場數據庫作為數據來源,從中挑選符合要求的病患,使用貝葉斯網絡模型訓練相關特征預測膿毒癥患者的死亡風險。納入2 352例膿毒癥患者,以患者是否死亡作為最終結局建立模型,模型的風險預測準確率為78.7%,優于邏輯回歸模型(72.3%)和決策樹模型(71.0%)。貝葉斯網絡模型相較于其他模型具有更高的信服力,能夠準確預測膿毒癥患者的死亡風險,模型的可解釋性能夠輔助醫護人員進行臨床決策,同時能夠更加合理、科學地分配醫療資源。
關鍵詞:膿毒癥;貝葉斯網絡;重癥監護室;死亡預測
中圖分類號:TP391"""""文獻標志碼:A
Mortality Risk Prediction for Patients with Sepsis in Intensive Care Unit Based on Interpretable Machine Learning
LIU Kun1, LING Chen2, SHI Xiaoqiang1, ZHOU Mengyu1, XU Naiyue1
(1.School of Health Science and Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China;
2. Medical Instrumentation College, Shanghai University of Medicine and Health Sciences, Shanghai 201318, China)
lkun11111@163.com; lingc@sumhs.edu.cn; 19117200027@163.com; zhou_meng_yu_66@163.com; xunaiyue21@163.com
Abstract: To effectively predict the mortality risk of sepsis patients in the Intensive Care Unit (ICU) and analyze the factors affecting outcomes, this paper proposes a mortality risk prediction model for sepsis patients to provide scientific reference for early prevention and mortality risk control of sepsis patients. In this study, the MIMIC-Ⅲ (Medical Information Mart for Intensive Care Ⅲ) database is used as the data source, from which patients who meet the requirements are selected. Bayesian network model is used to train relevant features to predict the mortality risk of sepsis patients. With a sample size of 2 352 sepsis patients, the model, using patient mortality as the ultimate outcome, demonstrates a risk prediction accuracy of 78.7%, surpassing the logistic regression model (72.3%) and the Decision Tree model (71.0%). The Bayesian network model, compared to other models, exhibits higher credibility, accurately predicting the mortality risk of sepsis patients. The interpretability of the model can assist medical staff in clinical decision-making and realize a more rational and scientific allocation of medical resources.
Key words: sepsis; Bayesian network; ICU; mortality prediction
0""引言(Introduction)
膿毒癥(Sepsis)是一種宿主對感染的反應失調,從而導致危及生命的器官功能障礙。全球每年有近5 000萬例膿毒癥患者,他們感染的部位和致病菌因地理位置和年齡不同而有所差異,常見的有呼吸系統和胃腸道系統的感染[1]。2017年,因膿毒癥死亡的患者數量約為1 100萬人,占全球所有死亡人數的近20%。當膿毒癥患者需要進入重癥監護室時,1/3的患者的存活時間不超過30 d,死亡率與患者的年齡、疾病狀態和器官功能障礙類型密切相關[2]。國內的研究顯示,重癥監護室(Intensive Care Unit, ICU)中膿毒癥患者的死亡率為28.7%,早期診斷發現并且積極治療可以起到降低死亡率的作用[3]。ICU膿毒癥患者的死亡率由多種因素造成,包括年齡、生理特征、器官狀況等[4]。除死亡風險高之外,治療膿毒癥的費用也非常高,因為膿毒癥患者平均住院時間相較于其他疾病患者要長得多。因此,對膿毒癥患者治療期間的死亡風險進行預測是必要的預防措施和治療輔助手段。
1""相關研究(Correlational research)
機器學習(Machine Learning, ML)旨在確定患者身體中哪些因素對病情的發展起到關鍵作用。采用機器學習算法得出的最終結果會因數據集的數量、類型、結構而產生差異,其中神經網絡和Logistic回歸以及貝葉斯網絡的應用最為廣泛[5]。將機器學習算法模型與APACHE Ⅱ(Acute Physiology and Chronic Health Evaluation Ⅱ)[6]、SAPS(Simplified Acute Physiology Score)[7]和SOFA(Sequential Organ Failure Assessment)[8]評分進行死亡率預測的比較表明,機器學習算法可以提高重癥監護決策指標的效率。ADRIE等[9]根據患者的臨床資料,建立了嚴重膿毒癥患者第1次至第4次發作后14 d內的死亡預測模型;TAYLOR等[10]使用機器學習方法建立模型,用于預測膿毒癥患者住院期間的死亡率。隨著對膿毒癥定義的更新(膿毒癥3.0),出現了一些新的預測模型。FANG等[11]利用生物標志物建立了免疫功能障礙評分系統模型,預測膿毒癥患者28 d內的死亡率,該模型的AUC(Area Under the Curve)為0.789。YIN等[12]研究的模型發現,缺血修飾白蛋白水平可能是預測嚴重膿毒癥患者短期死亡率的有效預測指標(AUC為0.742)。KONG等[13]使用4種機器學習方法預測ICU膿毒癥患者住院期間的死亡率,其中梯度增強機器模型的預測效果最好,AUC為0.845。
膿毒癥的死亡是由多個相互關聯的器官衰竭造成的。使用貝葉斯網絡(Bayesian Network, BN)方法,結合所需的特征數據和參數優化,預測ICU患者膿毒癥引發的死亡率,通過受試者工作特性曲線下面積(Area Under the Receiver Operation Characteristic Curve, AUROC)評估預測性能。貝葉斯網絡建模技術的特點是捕捉變量之間的條件依賴性,可以用于描述生物標志物之間的關系,以便更好地預測死亡率[14]。貝葉斯網絡在獲取醫學不確定性知識方面非常受歡迎,在疾病診斷中得到了廣泛的應用。貝葉斯網絡是一類專門用于分類問題的機器學習算法,在醫療保健領域得到了廣泛的應用。當生物標志物相關時,貝葉斯網絡比替代分類器表現更好,同時保持了數學的簡單性。
2""數據與方法(Data and methods)
2.1""數據
數據從重癥監護醫學信息市場(Medical Information Mart for Intensive Care Ⅲ, MIMIC-Ⅲ)數據庫中提取,按照Sepsis-3標準篩選符合條件的膿毒癥患者。MIMIC-Ⅲ數據庫包含2001—2012年ICU收治的53 423名成年患者(年齡≥16歲),收錄了人口統計學信息、實驗室檢測信息、患者用藥信息、護理人員以及患者護理級別、患者檢測成像報告、患者出入院信息、主治醫師等大量數據,醫療數據充足且齊全。
膿毒癥的診斷符合膿毒癥的定義(膿毒癥3.0),即患者有感染且序列性器官衰竭評估(SOFA)評分急性變化≥2分[15]符合以下標準的患者被納入:(1)膿毒癥患者;(2)年齡≥18歲。本文研究的是ICU膿毒癥患者,選取的病人數據要求如下:(1)ICU患者;(2)入院24 h內的檢測數據;(3)只選取第一次進入ICU患者的數據[16]。在數據方面排查了異常值、重復值及缺失值。異常值排查方面遵循Z分數法[17],若一個數據點的Z分數絕對值大于3(因為平均值±3個標準差覆蓋了99.7%的面積),則表明該數據值與其他值有較大差異,視為異常值,公式如下:
通過閱讀相關文獻、醫學資料及進行數據清洗[19-21],本次實驗最終選取患者進入ICU 24 h內的人口統計學特征、生命體征、實驗室測量值等數據,結果為ICU患者離院時的存活情況,特征數據如下。
(1)人口統計學特征:年齡(Age)、性別(Gender)。
(2)生命體征:心率(Heart Rate, HR)、呼吸頻率(Respiratory Rate, RR)、體溫(Temperature, Temp)、血壓(Blood Pressure, BP)、疼痛(Pain)、血氧飽和度(SpO2)。
(3)實驗室測量值:白細胞計數(White Blood Cell Count, WBC)、血紅蛋白(Hemoglobin, HB)、肌酸酐(Creatinine, Cre)、血細胞比容(Hematocrit, HCT)、國際標準化比值(International Normalized Ratio, INR)、部分凝血活酶時間(Partial Thromboplastin Time, PTT)、葡萄糖(Glucose, GLU)、鉀(K)、鈣(Ca)、鈉(Na)、鎂(Mg)、血尿素氮(Blood Urea Nitrogen, BUN)、氯化物(Chloride,CL)、PH、碳酸氫根(HCO3)、凝血酶原時間(Prothrombin Time, PT)。
2.2""方法
本文建立了一個離散的BN用于估計數據的聯合分布,作為對感興趣的情況進行推斷和預測的基礎。使用決策樹模型、Logistic回歸模型進行對比。BN節點中的變量便是上文介紹的特征數據。使用Python當中的Pgmpy庫學習數據,并且搭建BN的結構圖。
對于貝葉斯網絡來說,算法模型都是基于離散型的數據展開的,有效的離散方法可以減少算法的時間,提高對數據樣本的分類聚類能力以及抗噪聲水平。本文使用的醫學數據離散化方法的依據來源于醫生的建議以及醫學手冊[22-23]。分組標準是BUN:7~20 mg/dL為正常組;CL:98~106 mmol/L為正常組;Ca:8.8~10.4 mg/dL為正常組;GLU:70~110 mg/dL 為正常組;HCO3:22~28 mmol/L為正常組;HR:60~100次/分鐘為正常組;INRlt;2為正常組;Mg:1.6~2.6 mg/dL為正常組;Na:135~145 mmol/L為正常組;PT:11~13.5 s為正常組;PTT:25~35 s為正常組;RR:12~20次/分鐘為正常組;Temp:36.5~37.5°C為正常組;WBC:4 500~11 000 cells/mcL為正常組;BP:90~119 mmHg為正常組(一般指收縮壓);K:2.86~4.09 mEq/L為正常組;PH:7.35~7.45為正常組;SpO2gt;95%為正常組;Age:“少年期”為18歲至30歲,“青年期”為31P歲至50歲,“中年期”為51歲至70歲,“老年期”為71歲以上;Pain:“無痛”對應的評分是0分,“輕度疼痛”對應的評分為1~3分,“中度疼痛”對應的評分為4~6分,“嚴重疼痛”對應的評分為7~10分;Cre:“男”是0.6~1.1 mg/dL為正常組,“女”是0.5~0.9 mg/dL為正常組;HB:“男”是13~18 g/dL為正常組,“女”是12~16 g/dL為正常組;HCT:“男”是40%~54%為正常組,“女”是36%~48%為正常組。
數據分析以及變量篩選選用Python、SPSS等軟件。采用SPSS 26.0進行分析,以膿毒癥患者最終是否死亡為因變量,采用多元Logistic回歸對模型納入的變量進行篩選(表1),然后以篩選的變量為基礎通過Python中貝葉斯網絡算法搭建結構圖。
貝葉斯網絡廣泛應用于處理和建模不確定性事件,并對其進行建模。模型搭建的主要工作是進行結構學習和參數學習,通常結構學習方法主要分為兩種:(1)算法學習自動建立網絡結構圖并生成條件概率表;(2)專家經驗加上算法搭建結構圖并確定條件概率表。本文應用Python 3.7軟件中的Pgmpy包進行貝葉斯網絡結構學習及參數學習。由于最終目標是使用搭建的模型結構圖分析和預測對膿毒癥患者影響較大的影響因素,因此使用Netica軟件進行貝葉斯網絡推理,首先在搭建結構圖方面嘗試了3種算法,分別是爬山搜索算法、樹搜索之Chow-Liu算法、TAN樸素貝葉斯算法,最終通過結構圖、準確率等因素選擇在爬山搜索算法基礎上,結合專家知識搭建貝葉斯網絡結構圖。通過受試者曲線下面積(AUC)評價模型的預測效果。
3""結果(Results)
3.1""患者數據
MIMIC-Ⅲ數據庫共納入2 352例膿毒癥患者,年齡分布在(65.24-14.89)歲到(65.24+14.89)歲。其中,男性為1 281例(54.5%),死亡患者為690例(29.3%)。膿毒癥患者數據流程圖如圖1所示,膿毒癥患者的特征如表1所示。
3.2""影響膿毒癥患者住院期間死亡預測的因素
以膿毒癥患者是否死亡為因變量,篩選具有統計學意義的相關因素為自變量。通過Logistic回歸結果顯示,初步選取的變量有Temp、CL、Ca、K、Na、HR、SpO2、Pain、WBC、BUN、HB、PTT、HCO3、Age,均有統計學意義(Plt;0.05)。
3.3""模型的搭建
將Logistic回歸篩選的變量因素作為貝葉斯網絡的節點,依據爬山算法構建的膿毒癥貝葉斯網絡結構圖如圖2所示。結構學習方面結合爬山算法以及專家知識,其中BUN、HCO3、Na、SpO2、PTT、K、Temp與膿毒癥患者死亡有直接聯系。本次實驗使用十折交叉驗證確保實驗結果的準確性,參數學習采用最大似然估計法,生成各個節點的條件概率。
3.4""模型可解釋性
貝葉斯網絡的可解釋性主要體現在3個方面[24-25]:(1)直觀的圖形化表示;(2)變量之間的概率關系;(3)可以進行概率推斷。
直觀的圖形化表示:貝葉斯網絡的圖形化可以使用有向無環圖(DAG)表示,網絡結構圖當中的節點表示隨機變量,有向邊表示變量之間的相互依賴關系,即父節點指向子節點,一般情況下,父節點表示能夠影響子節點的因素,子節點表示受影響的結果。通過圖2可以發現,BUN、HCO3、Na、SpO2、PTT、K、Temp與膿毒癥患者的死亡有直接關聯,BUN、HCO3、Na、SpO2、PTT、K、Temp是膿毒癥患者死亡的父節點,對患者的死亡有直接影響。膿毒癥是一種全身性感染炎癥反應綜合征,在膿毒癥發作時,機體的免疫系統會產生強烈的炎癥反應,其中包括體溫升高。膿毒癥導致患者體溫升高的主要機制是炎癥反應中的熱原性物質的釋放。炎癥反應會導致白細胞和其他免疫細胞釋放細胞因子,這些細胞因子可以直接或間接地作用于患者的體溫調節中樞,引起體溫升高。血尿素氮(BUN)是評估腎功能血液檢測的重要指標之一,BUN水平升高通常表明腎功能異常或者腎臟受損,而膿毒癥患者常常伴有多器官功能衰竭,也包括腎功能受損,有一些早期的研究發現,BUN水平高與膿毒癥患者的預后不良有關。例如,一項發表在《臨床腎臟病學》雜志上的研究發現,入院時BUN水平高的膿毒癥患者的死亡率較高。另一項發表在《感染》雜志上的研究則表明,即使在治療后BUN水平仍然高的患者,其死亡率也相對較高,因此BUN水平的升高可能與膿毒癥患者的病情嚴重程度和預后不良有關,這也正好符合結構圖指向關系。因果關系的建模使得貝葉斯網絡能夠提供對觀察到的數據背后的因果機制的解釋,圖形化將復雜的因果關系和概率關系以直觀的方式展示出來,使得模型的結構和變量之間的關系非常直觀,便于人們理解和解釋。
變量之間的概率關系:貝葉斯網絡使用概率分布表示變量之間的關系。網絡結構中的邊表示條件概率,即給定父節點的取值情況下子節點的概率分布。這樣,貝葉斯網絡能夠提供對變量之間概率關系的解釋。從圖2可以看出,BUN、HCO3、Na、SpO2、PTT、K、Temp是與膿毒癥患者死亡風險直接相關的影響因素,是death的父節點。通過離散化數據,將BUN、HCO3、Na、SpO2、PTT、K、Temp分別分為正常和異常兩種情況,不同的排列組合形成膿毒癥患者死亡風險的概率(表2),因為數據過多,所以只列出部分概率表。通過表2可以看出,當相關影響因素都為異常時,死亡率相較于其他情況高出一些,當全部是正常的情況下,存活的概率則大大提高了;當BUN、HCO3、Na全部正常時,膿毒癥患者的死亡率大大降低,未來可以將研究重點放在這些指標上。通過表2還發現,在只有PTT、K正常的情況下,患者的生存率很高,這應該屬于出現誤差的情況。
可以進行概率推斷:貝葉斯網絡可以使用貝葉斯推斷方法進行概率推斷,通過給定一些觀測值,可以計算出其他未知變量的概率分布。這種推理能力可以用于解釋觀測數據中的現象,揭示變量之間的關系,并預測未來的事件。同時,通過對推理過程的解釋,可以了解模型對觀測數據的解釋和預測是如何得出的,這使得貝葉斯網絡在決策支持和預測方面具有很強的可解釋性。使用貝葉斯網絡進行風險預測,運用Netica軟件搭建模型結構圖,點擊節點修改單個影響因素的信息,從而對膿毒癥患者的死亡風險進行預測。如圖3所示,已知某研究對象Age在71~90歲,WBC指標異常,BUN指標異常,Temp指標異常,Na指標異常,此患者發生死亡風險的概率為46.7%,即P=0.467(膿毒癥死亡風險Age=3,WBC=0,BUN=0,Temp=0,Na=0)。
3.5""預測模型的評估
使用AUC值衡量模型的檢驗效能,結果顯示:貝葉斯網絡模型的AUC為 0.726,準確率為0.787。BN模型的準確率以及AUC與決策樹、Logistic回歸模型相比的結果如圖4所示,其中決策樹模型準確率為0.710,Logistic回歸模型準確率為0.723。通過圖4可以發現,構建的貝葉斯網絡模型效果良好,優于其他模型。
4""結論(Conclusion)
為了將人工智能應用于醫學領域,本文提出使用貝葉斯網絡方法建立可解釋性預測模型,對重癥膿毒癥患者進行院內死亡預測。使用公共數據集MIMIC-Ⅲ中的數據對模型進行驗證。根據網絡模型結果表明,BUN、HCO3、Na、K、Ca、SpO2、PTT、Temp等是影響膿毒癥患者死亡的重要變量。Age是膿毒癥患者死亡風險的常見因素,很少有研究探討K或Ca與膿毒癥患者之間的關系。本文的研究結果顯示:K和Ca是膿毒癥患者院內死亡的重要變量。預測模型的AUC為0.726,與其他模型相比效果并不理想。原因可能是建立模型的想法不同,本文側重于可解釋性方面,在準確性方面可能不如其他模型。與其他研究相比,本文的研究將人口統計學特征、生命體征、實驗室測量值添加到人群的納入標準中。
本研究也有一定的局限性。首先,模型在公共數據集中的擬合不是很好,這可能是提取MIMIC-Ⅲ數據庫時提取的數據及方法不夠準確。其次,未來的研究中應該考慮一些可能對膿毒癥患者死亡有影響但MIMIC-Ⅲ數據庫中缺乏的生物標志物。
參考文獻(References)
[1] RHEE C,DANTES R,EPSTEIN L,et al. Incidence and trends of sepsis in US hospitals using clinical vs claims data,2009—2014[J]. JAMA,2017,318(13):1241-1249.
[2] XIE J F,WANG H L,KANG Y,et al. The epidemiology of sepsis in Chinese ICUs: a national cross-sectional survey[J]. Critical care medicine,2020,48(3):209-218.
[3] VINCENT J L,MARSHALL J C,AMENDYS-SILVA S A,et al. Assessment of the worldwide burden of critical illness: the intensive care over nations (ICON) audit[J]. The lancet respiratory medicine,2014,2(5):380-386.
[4] SINGER M,DEUTSCHMAN C S,SEYMOUR C W,et al. The third international consensus definitions for sepsis and septic shock (sepsis-3)[J]. JAMA,2016,315(8):801-810.
[5] 虎磐,劉曉莉,毛智,等. 基于集成機器學習的ICU老年多器官功能不全早期死亡風險預測模型[J]. 解放軍醫學院學報,2019,40(6):513-518.
[6] KNAUS W A,DRAPER E A,WAGNER D P,et al. APACHE Ⅱ: a severity of disease classification system[J]. Critical care medicine,1985,13(10):818-829.
[7] "LE GALL J R,LEMESHOW S,SAULNIER F. A new Simplified Acute Physiology Score (SAPS Ⅱ) based on a European/North American multicenter study[J]. JAMA,1993,270(24):2957-2963.
[8] AWAD A,BADER-EL-DEN M,MCNICHOLAS J,et al. Predicting hospital mortality for intensive care unit patients: time-series analysis[J]. Health informatics journal,2020,26(2):1043-1059.
[9] ADRIE C,FRANCAIS A,ALVAREZ-GONZALEZ A,et al. Model for predicting short-term mortality of severe sepsis[J]. Critical care,2009,13:1-14.
[10] TAYLOR R A,PARE J R,VENKATESH A K,et al. Prediction of in-hospital mortality in emergency department patients with sepsis:a local big data-driven,machine learning approach[J]. Academic emergency medicine,2016,23(3):269-278.
[11] FANG W F,DOUGLAS I S,CHEN Y M,et al. Development and validation of immune dysfunction score to predict 28-day mortality of sepsis patients[J]. PLOS ONE,2017,12(10):e0187088.
[12] YIN M,LIU X Z,CHEN X M,et al. Ischemia-modified albumin is a predictor of short-term mortality in patients with severe sepsis[J]. Journal of critical care,2017,37:7-12.
[13] KONG G L,LIN K,HU Y H. Using machine learning methods to predict in-hospital mortality of sepsis patients in the ICU[J]. BMC medical informatics and decision making,2020,20:1-10.
[14] 魏珍,張雪雷,饒華祥,等. 禁忌搜索算法的貝葉斯網絡模型在冠心病影響因素分析中的應用[J]. 中華流行病學雜志,2016,37(6):895-899.
[15] JOHNSON A E W,ABOAB J,RAFFA J D,et al. A comparative analysis of sepsis identification methods in an electronic database[J]. Critical care medicine,2018,46(4):494-499.
[16] SEYMOUR C W,LIU V X,IWASHYNA T J,et al. Assessment of clinical criteria for sepsis: for the third international consensus definitions for sepsis and septic shock (sepsis-3)[J]. JAMA,2016,315(8):762-774.
[17] FILZMOSER P,HRON K. Outlier detection for compositional data using robust methods[J]. Mathematical geosciences,2008,40:233-248.
[18] SHAH A D,BARTLETT J W,CARPENTER J,et al. Comparison of random forest and parametric imputation models for imputing missing data using MICE: a CALIBER study[J]. American journal of epidemiology,2014,179(6):764-774.
[19] ZHI D Y,ZHANG M,LIN J,et al. Establishment and validation of the predictive model for the in-hospital death in patients with sepsis[J]. American journal of infection control,2021,49(12):1515-1521.
[20] JIANG Z Y,BO L L,XU Z H,et al. An explainable machine learning algorithm for risk factor analysis of in-hospital mortality in sepsis survivors with ICU readmission[J]. Computer methods and programs in biomedicine,2021,204:106040.
[21] HERNANDEZ-SUAREZ D F,KIM Y,VILLABLANCA P,et al. Machine learning prediction models for in-hospital mortality after transcatheter aortic valve replacement[J]. JACC: Cardiovascular interventions,2019,12(14):1328-1338.
[22] KAVEY R E W,DANIELS S R,LAUER R M,et al. American Heart Association guidelines for primary prevention of atherosclerotic cardiovascular disease beginning in childhood[J]. Circulation,2003,107(11):1562-1566.
[23] CARLSON R W,LARSEN J K,MCCLURE J,et al. International adaptations of NCCN Clinical Practice Guidelines in Oncology[J]. JNCCN,2014,12(5):643-648.
[25] MOREIRA C,CHOU Y L,VELMURUGAN M,et al. LINDA-BN: an interpretable probabilistic approach for demystifying black-box predictive models[J]. Decision support systems,2021,150:113561.
作者簡介:
劉"坤(1998-),男,碩士生。研究領域:醫療數據分析。
凌"晨(1980-),男,博士,講師。研究領域:新媒體大數據,電子商務,智慧醫療。本文通信作者。
史小強(1999-),男,碩士生。研究領域:醫學圖像處理。
周夢雨(1999-),女,碩士生。研究領域:醫學圖像分割。
徐乃岳(1999-),男,碩士生。研究領域:醫學數據處理。