陳潮金, 饒靜怡, 葉欣妍, 余文潔, 段 博, 李 璠, 楊基榮, 黑子清
1.中山大學(xué)附屬第三醫(yī)院 麻醉科,廣東 廣州 510630;2.中山大學(xué) 醫(yī)學(xué)院,廣東 深圳 518107
急性腎損傷(acute kidney injury,AKI)是術(shù)后常見并發(fā)癥之一[1],其發(fā)生率隨著年齡的增長(zhǎng)逐漸增加,年齡>65歲的患者發(fā)生率達(dá)10.5%[2]。AKI進(jìn)展迅速,發(fā)展為終末期腎病患者總病死率可達(dá)40%~70%[3]。隨著年齡增加,腎結(jié)構(gòu)及功能發(fā)生退行性變,儲(chǔ)備功能下降;對(duì)圍術(shù)期腎損傷因素的敏感性增加,極易發(fā)生術(shù)后AKI并向慢性腎病轉(zhuǎn)化,影響遠(yuǎn)期預(yù)后[4]。早期識(shí)別和干預(yù)術(shù)后AKI高危患者能促進(jìn)老年患者的圍術(shù)期安全及快速康復(fù)。然而,如何準(zhǔn)確預(yù)測(cè)術(shù)后AKI,仍然是老年圍術(shù)期器官功能保護(hù)領(lǐng)域的主要難點(diǎn)。開發(fā)操作簡(jiǎn)單、易于推廣的術(shù)后AKI預(yù)測(cè)模型,對(duì)于推動(dòng)圍術(shù)期老年脆弱腎功能保護(hù)具有重要的臨床意義和迫切的臨床需求。
隨著大數(shù)據(jù)、人工智能等技術(shù)在醫(yī)學(xué)領(lǐng)域的廣泛應(yīng)用,機(jī)器學(xué)習(xí)(machine learning,ML)技術(shù)已用于多個(gè)專科手術(shù)術(shù)后AKI的風(fēng)險(xiǎn)因素分析和預(yù)測(cè)模型構(gòu)建,包括:全膝關(guān)節(jié)置換術(shù)[5],腎癌患者腎切除術(shù)[6],成人肝移植術(shù)[7],心臟手術(shù)[8]和主動(dòng)脈弓置換術(shù)[9]等。ML算法建立在對(duì)大量數(shù)據(jù)內(nèi)在聯(lián)系的探索之上,通過訓(xùn)練集建立預(yù)測(cè)模型,并利用測(cè)試集進(jìn)行驗(yàn)證,充分保證預(yù)測(cè)模型的有效性。然而,由于ML模型內(nèi)部機(jī)制難以理解,ML的黑箱算法無法在臨床上得到有效的利用[10]。由Lundberg等[11]開發(fā)的SHapley Additive exPlanations(SHAP)方法是一種基于游戲的評(píng)估貢獻(xiàn)程度的方法,其中,個(gè)體特征在預(yù)測(cè)任務(wù)中充當(dāng)參與者,SHAP值有助于在特征之間公平地分配預(yù)測(cè)性能[12]。這種方法使ML的黑箱算法在總體及單個(gè)樣本層面上均能夠得到解釋。既往研究建立的AKI預(yù)測(cè)模型缺少對(duì)老年患者術(shù)后AKI的獨(dú)立預(yù)測(cè)[13-14],且關(guān)于SHAP方法對(duì)相關(guān)AKI預(yù)測(cè)模型進(jìn)行解釋的報(bào)道較少見。本研究將立足于術(shù)后AKI高發(fā)的老年人群,基于可解釋的ML技術(shù)開發(fā)老年患者行全身麻醉非心臟術(shù)后AKI預(yù)測(cè)模型,為圍術(shù)期決策提供理論支持。現(xiàn)報(bào)道如下。
1.1 研究對(duì)象 回顧性分析自2015年10月至2021年10月在中山大學(xué)附屬第三醫(yī)院擇期行全身麻醉非心臟手術(shù)、年齡≥65歲的9 512例患者的臨床資料,根據(jù)排除標(biāo)準(zhǔn),最終納入5 780例患者為研究對(duì)象。排除標(biāo)準(zhǔn):(1)腎切除病史;(2)腎移植術(shù)后;(3)先天性單腎;(4)終末期腎病需行連續(xù)性腎替代治療;(5)術(shù)后血清肌酐值缺失;(6)急診手術(shù);(7)美國(guó)麻醉醫(yī)師協(xié)會(huì)(American society of anesthesiologists,ASA)分級(jí)Ⅳ級(jí)及以上;(8)術(shù)前7 d造影劑暴露。通過我院圍術(shù)期專病數(shù)據(jù)庫(kù)收集患者術(shù)前、術(shù)中及術(shù)后的臨床資料,包括人口統(tǒng)計(jì)學(xué)數(shù)據(jù)、術(shù)前指標(biāo)、術(shù)中資料、預(yù)后數(shù)據(jù)等。本研究經(jīng)醫(yī)院倫理委員會(huì)批準(zhǔn)。
1.2 終點(diǎn)事件 終點(diǎn)事件為術(shù)后7 d內(nèi)發(fā)生AKI。根據(jù)改善全球腎病預(yù)后組織標(biāo)準(zhǔn)[15],采用血清肌酐定義:血清肌酐在術(shù)后48 h內(nèi)絕對(duì)值增加>26.4 μmol/L,或7 d內(nèi)增加達(dá)1.5倍基礎(chǔ)肌酐值。
1.3 數(shù)據(jù)收集 共選擇43個(gè)變量納入分析。其中,術(shù)前資料包括:(1)人口統(tǒng)計(jì)學(xué)特征:性別、年齡、體質(zhì)量、身高;(2)術(shù)前指標(biāo):抽煙、糖尿病、外周血管疾病、腦血管疾病、高血壓、慢性阻塞性肺疾病、近期心肌梗死(術(shù)前1個(gè)月內(nèi))、腦卒中病史、既往和/或近期心臟手術(shù)、近期造影劑暴露(術(shù)前7 d內(nèi))、紐約心臟協(xié)會(huì)心功能分級(jí)、術(shù)前最后1次血紅蛋白濃度、血清白蛋白、尿酸水平、血小板計(jì)數(shù)、血鈣濃度、血鉀濃度、血鈉濃度、血糖濃度、谷草轉(zhuǎn)氨酶、谷丙轉(zhuǎn)氨酶、血清肌酐、尿素氮、高密度脂蛋白、低密度脂蛋白水平,以及術(shù)前口服藥物使用情況等。術(shù)中資料包括:手術(shù)時(shí)間、術(shù)中低血壓、血管活性藥物使用情況、利尿劑使用情況、血制品輸注量、輸注液體類型、液體量、抗生素使用情況等。預(yù)后資料包括實(shí)際住院時(shí)間、總住院費(fèi)用和住院期間心跳驟停發(fā)生情況。其中,術(shù)中低血壓定義為平均血壓(mean blood pressure,MBP)<60 mmHg(1 mmHg=0.133 kPa)或MBP下降>20%基礎(chǔ)值,且持續(xù)時(shí)間>30 min[16]。
對(duì)于缺失比例<10%的指標(biāo),使用鏈方程算法計(jì)算模式變量和連續(xù)變量[17]。為了最小化特征高維帶來的潛在過度影響,只選擇在單變量檢驗(yàn)中具有統(tǒng)計(jì)學(xué)意義(P<0.05)的特征,進(jìn)行最小的絕對(duì)收縮,并利用LASSO回歸方法進(jìn)行特征選取。最后,利用套索回歸后的非零坐標(biāo)特征建立預(yù)測(cè)模型。
1.4 模型構(gòu)建與評(píng)估 研究隊(duì)列按照8∶2的比例隨機(jī)分為訓(xùn)練集和測(cè)試集。應(yīng)用LASSO回歸篩選訓(xùn)練集中有意義的變量納入模型構(gòu)建。本研究采用決策樹(decision tree,DT)、隨機(jī)森林(random forest,RF)、邏輯回歸(logistic regression,LR)、高斯樸素貝葉斯(gaussian naive bayes,GNB)、自適應(yīng)增強(qiáng)(adaptive discriminator augmentation,ADA)、梯度提升機(jī)(gradient boosting machine,GBM)、輕度梯度提升機(jī)(light gradient boosting machine,LGBM)和多層神經(jīng)網(wǎng)絡(luò)模型(multilayer perceptron neural network,MLP)共8種機(jī)器學(xué)習(xí)算法進(jìn)行建模。計(jì)算受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC)、敏感度、特異度、準(zhǔn)確性及F1分?jǐn)?shù)進(jìn)行模型評(píng)估,選出最優(yōu)預(yù)測(cè)模型。為進(jìn)一步驗(yàn)證模型的有效性,本研究選取了Wu等[13]構(gòu)建的預(yù)測(cè)模型在同一數(shù)據(jù)庫(kù)中進(jìn)行比較。
2.1 基線特征比較 5 780例患者中,789例被診斷為術(shù)后AKI,發(fā)生率為13.65%(789/5 780),設(shè)為AKI組;另4 991例設(shè)為非AKI組。一般資料方面,與非AKI組比較,AKI組的患者年齡更大,男性患者更多,身高更高,體質(zhì)量更大,ASA分級(jí)Ⅲ級(jí)比例更高,且血紅蛋白濃度、血小板計(jì)數(shù)、血鈣濃度、血鈉濃度、血清白蛋白、高密度脂蛋白、低密度脂蛋白水平更低,血糖濃度、谷草轉(zhuǎn)氨酶、血清肌酐、尿素氮更高,兩組比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。見表1。麻醉手術(shù)因素方面,與非AKI組比較,AKI組患者手術(shù)時(shí)間更長(zhǎng),術(shù)中低血壓事件發(fā)生率更高,術(shù)中膠體補(bǔ)液量、紅細(xì)胞、白蛋白、血漿、冷沉淀和5%碳酸氫鈉量輸注量更多,術(shù)中多巴胺、多巴酚丁胺、去甲腎上腺素、腎上腺素、間羥胺等血管活性藥物使用更多,甘露醇使用更多,抗病毒藥物、抗真菌藥物、氨基糖甙類抗生素使用更多,兩組比較,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。見表2。
表1 AKI患者與非AKI患者的一般資料比較/M(Q1,Q3)
表2 AKI患者與非AKI患者術(shù)中資料比較/例(百分率/%)
2.2 預(yù)后情況比較 患者預(yù)后情況中,AKI組患者的實(shí)際住院天數(shù)長(zhǎng)于非AKI組,總住院費(fèi)用及住院期間心跳驟停發(fā)生率均高于非AKI組,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。見表3。
表3 AKI患者與非AKI患者術(shù)后預(yù)后比較/M(Q1,Q3)
2.3 特征變量篩選及模型構(gòu)建 單因素分析后共有33個(gè)顯著變量,LASSO回歸分析選擇了12個(gè)特征,包括手術(shù)時(shí)長(zhǎng)、白蛋白、血清肌酐、鈉離子、血糖、年齡、膠體、體質(zhì)量、血紅蛋白、術(shù)中輸注紅細(xì)胞、谷草轉(zhuǎn)氨酶和血小板。基于上述12個(gè)特征構(gòu)建8個(gè)ML模型。其中,GBM模型具有最大的AUC值0.77,準(zhǔn)確性為0.71,敏感度為0.67,特異度為0.71。因此,本研究最終選擇了GBM模型進(jìn)行下一步的分析和應(yīng)用。見表4、圖1。
圖1 所有機(jī)器學(xué)習(xí)模型ROC曲線圖
表4 所有機(jī)器學(xué)習(xí)模型預(yù)測(cè)效能/均值(95%可信區(qū)間)
2.4 預(yù)測(cè)效能橫向比較 將GBM模型與Wu等[13]
開發(fā)的AKI預(yù)測(cè)模型進(jìn)行比較,結(jié)果顯示,對(duì)照模型預(yù)測(cè)老年術(shù)后AKI的AUC為0.70,通過delong-test發(fā)現(xiàn)兩者存在統(tǒng)計(jì)學(xué)差異(P<0.001),表明本研究構(gòu)建的GBM模型的預(yù)測(cè)效能更優(yōu)。見表5、圖2。
圖2 GBM模型與Nomogram模型ROC曲線圖
表5 GBM模型與Nomogram模型的預(yù)測(cè)性能比較/均值(95%可信區(qū)間)
2.5 最優(yōu)模型解釋與可視化 SHAP結(jié)果顯示,貢獻(xiàn)度前5的特征分別為手術(shù)時(shí)長(zhǎng)、術(shù)前白蛋白、血清肌酐、血糖及血清鈉離子濃度(圖3)。較長(zhǎng)的手術(shù)時(shí)長(zhǎng)、較低的血清白蛋白水平、較高的血清肌酐、較高的血糖和較低的血鈉濃度與較高的SHAP值相關(guān),術(shù)后AKI的發(fā)生率更高(圖4)。
圖3 全局SHAP解釋特征重要性
圖4 SHAP特征重要性
AKI在術(shù)后達(dá)到超過10%的發(fā)病率,為各年齡段患者的術(shù)后恢復(fù)造成了極大的困擾,其中,老年患者較多,約較其他年齡段的患者高出3%左右。術(shù)后AKI在所有手術(shù)中發(fā)病率大約為11%,而其中非心臟手術(shù)占到了7.5%,說明非心臟手術(shù)后AKI的發(fā)生率占所有手術(shù)的比例較高。因此,構(gòu)建針對(duì)非心臟手術(shù)后的老年患者術(shù)后AKI的預(yù)測(cè)模型具有較高的臨床價(jià)值。本研究納入的5 780例接受全身麻醉非心臟手術(shù)的老年患者中,AKI的發(fā)生率為13.65%(789/5 780),且合并術(shù)后AKI可導(dǎo)致患者心跳驟停發(fā)生率更高、住院時(shí)間更長(zhǎng)、住院總費(fèi)用更高。本研究通過LASSO回歸篩選了12個(gè)廣泛使用的臨床特征,包括手術(shù)時(shí)長(zhǎng)、白蛋白、血清肌酐、鈉離子、血糖、年齡、膠體、體質(zhì)量、血紅蛋白、術(shù)中輸注紅細(xì)胞、谷草轉(zhuǎn)氨酶和血小板,進(jìn)而構(gòu)建了一種基于GBM算法的可解釋的機(jī)器學(xué)習(xí)模型,在預(yù)測(cè)老年患者非心臟手術(shù)后AKI的發(fā)生上達(dá)到了中等準(zhǔn)確度(AUC=0.77),且預(yù)測(cè)效能優(yōu)于其他研究報(bào)道的AKI預(yù)測(cè)模型,可為圍術(shù)期決策提供理論支持。
SHAP值表明,在非心臟手術(shù)后老年患者發(fā)生術(shù)后AKI的12個(gè)特征中,排在前5位的分別是手術(shù)時(shí)長(zhǎng)、血清白蛋白、血清肌酐、血糖濃度、血鈉濃度。其中,手術(shù)時(shí)長(zhǎng)是最重要的特征,這與既往研究[18]結(jié)果不一致。其不常見于預(yù)測(cè)模型的構(gòu)建,可能對(duì)后續(xù)的研究有啟發(fā)作用。隨著手術(shù)時(shí)長(zhǎng)的增加,患者術(shù)中麻醉藥物用量及手術(shù)創(chuàng)傷程度增加,術(shù)后AKI的風(fēng)險(xiǎn)也隨之增加。第二大影響因素為術(shù)前血清白蛋白濃度。當(dāng)白蛋白水平過低時(shí),機(jī)體免疫力降低,術(shù)后容易發(fā)生感染等并發(fā)癥,故低白蛋白血癥是術(shù)后AKI的獨(dú)立危險(xiǎn)因素。排在第3位的是術(shù)前血清肌酐水平。在本研究中排除了術(shù)前患有腎疾病的患者,但術(shù)前肌酐較高水平的患者可能存在潛在的腎損傷,因此,更容易發(fā)生術(shù)后AKI。排在第4位的是術(shù)前高血糖。術(shù)前高血糖說明患者腎有著更大的葡萄糖重吸收負(fù)擔(dān),因此,術(shù)前長(zhǎng)期高血糖患者術(shù)后AKI的風(fēng)險(xiǎn)也較高。排在第5位的影響因素為血鈉濃度,低鈉血癥通常是由于鈉離子丟失過多,常見于腎皮質(zhì)不全、糖尿病等疾病,也預(yù)示著該患者存在潛在腎損傷,圍術(shù)期易誘發(fā)AKI。
本研究圍繞高齡患者全身麻醉非心臟手術(shù)后AKI的預(yù)測(cè),構(gòu)建了8個(gè)機(jī)器學(xué)習(xí)模型,并通過與其他團(tuán)隊(duì)所開發(fā)預(yù)測(cè)模型的橫向比較,進(jìn)一步體現(xiàn)出所采用模型的優(yōu)越性。另外,傳統(tǒng)機(jī)器學(xué)習(xí)可以處理海量、高維的復(fù)雜數(shù)據(jù),但無法獲知預(yù)測(cè)結(jié)果與各個(gè)特征變量之間的量效關(guān)系,本研究借助SHapley法著重解決了這個(gè)問題,通過把每例患者的預(yù)測(cè)過程可視化來使醫(yī)師和患者更清楚地了解主要的危險(xiǎn)因素,進(jìn)而實(shí)施個(gè)性化的二級(jí)預(yù)防措施。
本研究存在一定局限性。首先,本研究對(duì)象大多來自中山大學(xué)附屬第三醫(yī)院,作為廣州市內(nèi)三甲醫(yī)院其收治疑難重癥患者較多,住院期間AKI發(fā)生率能否代表華南地區(qū)乃至全國(guó)綜合醫(yī)院的平均水平需進(jìn)一步驗(yàn)證。其次,在本研究的模型中,可以看出AKI可由多種危險(xiǎn)因素導(dǎo)致致病率的升高,不同的地域、患者的家庭生活水平等都可能對(duì)結(jié)果產(chǎn)生一定的影響,因此,本研究結(jié)果仍需要引進(jìn)外部數(shù)據(jù)進(jìn)行驗(yàn)證。
綜上所述,GBM模型預(yù)測(cè)非心臟手術(shù)老年患者術(shù)后AKI發(fā)生風(fēng)險(xiǎn)的效能最優(yōu),可為圍術(shù)期麻醉決策提供參考。