吳卓熙, 陳 勤, 陳 鳳, 任玉坤, 王 卓, 李 洪
陸軍軍醫大學第二附屬醫院 麻醉科,重慶 400037
急性腎損傷(acute kidney injury,AKI)是一種常見術后并發癥,與高病死率、高發病率、住院時間延長等有關[1-2]。圍術期發生缺血、交感神經系統激活、系統性炎癥、腎毒性藥物等均為術后AKI的促發因素,準確預測術后患者是否發生AKI并及時采取干預措施至關重要[1,3-5]。既往AKI預測相關研究多針對重癥監護室中的危重患者、潛在腎毒性暴露的特定患者、心臟手術等[6-7]。關于開發重癥監護室外住院患者的AKI預測模型的研究較少[8-14]。現如今,基于機器學習方法已被廣泛且成熟應用于預測模型領域[15-17]。本研究旨在探討基于機器學習方法對非心臟手術后AKI的預測價值。現報道如下。
1.1 一般資料 選取陸軍軍醫大學新橋醫院自2014年6月至2022年9月收治的24 611例接受非心臟手術患者為研究對象。納入標準:年齡>18歲;電子病歷系統與手術麻醉系統數據齊全。排除標準:介入手術,心臟手術。其中,男性12 074例,女性12 537例;年齡 18~98歲,平均年齡(57.36±13.54)歲。本研究經醫院倫理委員會批準。所有患者均簽署知情同意書。
1.2 研究方法
1.2.1 數據收集及預處理 用于建立模型的患者術前數據來自電子病歷系統,包括:人口統計學信息、術前合并癥、術前檢查和檢驗數據、術前用藥史、術前相關治療史等。術中數據來自UEESOFT手術麻醉臨床信息系統,包括:術中用藥情況、患者信息、手術信息等。
1.2.2 主要結局定義 根據改善腎疾病全球結局AKI工作小組最新指南,整合RIFLE分類與AKIN分類,AKI定義為48 h內血清肌酐(serum creatinine,SCr)升高≥0.3 mg/dl或7 d內SCr增加至基線的1.5倍以上[18-20]。
1.2.3 機器學習方法 采用隨機數字表法將患者分為訓練組(n=17 227)與驗證組(n=7 384)。采用包括邏輯回歸、隨機森林、支持向量機、簡單決策樹、極端梯度提升和集成模型在內的機器學習方法訓練模型。采用受試者工作特征(receiver operator characteristic,ROC)曲線及ROC曲線下面積(area under ROC curve,AUC)評價模型的整體性能。采用沙普利可加性特征解釋法(shapley additive explanation,SHAP)評估每個特征對預測結果的貢獻程度[21-22]。
2.1 兩組患者一般資料比較 非心臟手術后AKI發生率為11.3%(2 780/24 611)。訓練組與驗證組患者各項一般資料比較,差異均無統計學意義(P>0.05)。見表1。
表1 兩組患者一般資料比較/例(百分率/%)
2.2 模型效能 6種機器學習方法構建的模型預測非心臟手術后AKI的ROC曲線見圖1。集成模型預測非心臟手術后AKI的AUC為0.749,大于邏輯回歸、隨機森林、支持向量機、簡單決策樹、極端梯度提升單獨預測。見表2。隨機森林模型重要性矩陣圖顯示,體質量指數、術前尿素氮、術前腎小球濾過率、麻醉時長、術前平均動脈壓、術前血紅蛋白、年齡、術中出血量為對模型貢獻度重要的前8個變量。見圖2。
圖1 6種機器學習方法構建的模型預測非心臟手術后AKI的ROC曲線
圖2 隨機森林特征重要性矩陣圖
表2 6種機器學習方法構建的模型的預測價值比較
2.3 模型分析 隨機森林模型中貢獻度較高的20個特征的SHAP值見圖3。紅色代表SHAP值較高的特征,藍色代表值較低的特征。變量的SHAP值越高, 發生AKI風險越大。20個特征中,手術相關特征有8個,分別為麻醉時長、普通胸外科手術、骨科手術、手術中總失液量、急診手術、手術中晶體液輸注總量、手術中血液制品使用量、手術中膠體液輸注總量和擇期手術。
圖3 隨機森林模型中貢獻度較高的20個特征SHAP值總結圖
既往針對AKI的預測模型大多集中在重癥監護室與心臟手術患者中,重癥監護室外非心臟手術患者的AKI危險因素及預測工具相關研究較少。邏輯回歸作為篩選變量的傳統方法,根據統計顯著性選擇進入模型的變量可能錯失對提高模型預測能力極具價值的變量信息。機器學習不需設定輸入變量與輸出變量的關系假設,變量篩選過程完全由數據驅動而不依賴于預設規則。使用機器學習構建預測模型是一種更合理的方法[13]。
本研究結果顯示,訓練組與驗證組患者各項一般資料比較,差異均無統計學意義(P>0.05)。這提示,數據在兩個數據集中分布平均。此外,集成模型預測非心臟手術后AKI的AUC為0.749,大于邏輯回歸、隨機森林、支持向量機、簡單決策樹、極端梯度提升單獨預測。這提示,集成模型預測性能最優,在單一模型中隨機森林的AUC為0.747。集成模型相對于單一模型更加復雜,需要更多的計算資源和時間來訓練和調優。從對結果的可解釋性以及資源利用上,隨機森林可能是更適合的方案。有研究報道,術中維持動脈壓>65 mmHg可以降低AKI風險[14]。本研究結果顯示,在隨機森林模型中影響較大的前20個特征中,手術相關特征占8個。這提示,手術相關和術中變量對預測AKI具有重要價值。
綜上所述,采用機器學習方法開發的非心臟手術后AKI的預測模型,可進一步加強對AKI的預防,從而優化和改善患者預后。但本研究存在一定局限性:缺少術中時序數據,例如連續逐次采集的血壓、心率等生命體征;僅針對是否發生AKI進行預測模型的開發,后續研究可進一步針對AKI分級預測開發模型。