鄭 詩 梅游英 王詣涵 潘若玲 南曉領
溫州市中西醫(yī)結(jié)合醫(yī)院血液凈化中心,325000 浙江 溫州
血管通路是血液透析患者賴以生存的生命線[1],自體動靜脈內(nèi)瘺(arteriovenous fistulas,AVF)因其操作簡便、費用低、預后良好等諸多優(yōu)勢,已成為長期血液透析患者的最佳血管通路類型[2-3]。但AVF并非終身使用,其可因各種原因引起血管狹窄或者閉塞,從而導致內(nèi)瘺失功。研究表明AVF失功是導致血液透析患者預后不良的重要原因之一[4]。因此,了解AVF失功的危險因素并構(gòu)建其相關預測模型,對預防和早期干預AVF失功至關重要。隨機森林模型作為一種新興的、靈活度高的機器學習算法,與logistic回歸等傳統(tǒng)分類算法相比具有抗噪聲、高準確性、可評估各個特征的重要性及不依賴于全部數(shù)據(jù)特征等優(yōu)點[5-7]。本研究分別采用隨機森林算法和logistic回歸模型構(gòu)建維持性血液透析患者AVF失功預測模型,并對其應用效果進行比較分析,為早期預防AVF失功的發(fā)生提供參考依據(jù)。
以2017年5月至2020年11月在溫州市某中西醫(yī)結(jié)合醫(yī)院血液凈化中心進行維持性血液透析的患者為研究對象。
納入標準: 1)入院年齡>18歲;2)在該院單上臂首次造瘺,且行頭靜脈-橈動脈端側(cè)吻合形成AVF者;3)AVF術后 1個月以上者。
排除標準:1)于外院行 AVF成形術者;2)改用腹膜透析等腎臟替代治療方式而放棄使用AVF者;3)既往行血管內(nèi)手術者。
采用統(tǒng)一設計的個案數(shù)據(jù)表,對研究對象的資料進行回顧性收集。
1)一般資料,包括性別、年齡、體質(zhì)量指數(shù)(BMI)、吸煙史、糖尿病史、高血壓史及Charlson合并癥指數(shù)[8];
2)透析資料,包括透析中低血壓、透析脫水量;
3)實驗室指標,包括血紅蛋白濃度、嗜酸性粒細胞、血小板計數(shù)及紅細胞比容;
4)生化及凝血相關指標,包括鈣磷乘積、C反應蛋白、凝血酶原時間、纖維蛋白原以及國際標準化比值;
5)營養(yǎng)指標,包括營養(yǎng)風險指數(shù)、血漿白蛋白、堿性磷酸酶、甘油三酯以及膽固醇。
AVF失功定義為開始透析后發(fā)生至少以下1種情況[9]:
1)觸診內(nèi)瘺震顫減弱或無法觸及,聽診血管雜音無法聞及;
2)血流量過低(<200 mL/min)無法滿足透析需要,血管彩色多普勒超聲檢查提示通路狹窄(血管狹窄程度≥50%,或吻合口直徑<2.0 mm、內(nèi)瘺靜脈直徑<2.7 mm)。
共558例維持性血液透析患者納入最終研究。發(fā)生AVF失功的患者96例,其中男性56例,女性40例,年齡范圍42~87歲,平均年齡(56.88 ± 15.21)歲;未發(fā)生AVF失功的患者462例,其中男性240例,女性222例,年齡范圍35~82歲,平均年齡 (51.10±13.91)歲。
單因素分析結(jié)果顯示,年齡(χ2=-3.640) 、有吸煙史(χ2=8.266) 、糖尿病史 (χ2=18.521)、鈣磷乘積(t=-4.332)、營養(yǎng)風險指數(shù)(t=8.830)以及透析中低血壓(χ2=5.552)在血透患者動靜脈內(nèi)瘺正常組與失功組的組間差異有統(tǒng)計學意義(P<0.05)。見表1。

表1 血透患者AVF失功危險因素的單因素分析
共有395個訓練集用于建立隨機森林模型。根據(jù)基尼指數(shù)減少平均值對23個變量進行排序,營養(yǎng)風險指數(shù)、堿性磷酸酶、年齡、血小板計數(shù)、紅細胞比容為預測血透患者動靜脈內(nèi)瘺失功發(fā)生重要性前5位指標。見表2。當決策樹數(shù)量為31時隨機森林預測誤差曲線趨于平穩(wěn),可得到最優(yōu)模型,此時袋外錯誤率為6.83%。見圖1。

表2 各變量基尼指數(shù)減少平均值情況及重要性排序

圖1 隨機森林預測誤差與決策樹數(shù)量的動態(tài)變化關系
2.4 多因素logistic 回歸分析結(jié)果
以年齡、吸煙史、糖尿病史、鈣磷乘積、營養(yǎng)風險指數(shù)及透析中低血壓作為自變量,以血透患者是否發(fā)生動靜脈內(nèi)瘺失功為因變量進行多因素logistic回歸分析。變量賦值見表3。結(jié)果顯示,年齡、吸煙史、糖尿病史、鈣磷乘積升高以及透析中低血壓是血透患者動靜脈內(nèi)瘺失功發(fā)生的危險因素(P<0.05),而營養(yǎng)風險指數(shù)升高是血透患者動靜脈內(nèi)瘺失功發(fā)生的保護因素(P<0.001)。見表4。

表3 變量賦值表

表4 血透患者AVF失功的多因素logistic回歸分析
采用測試集數(shù)據(jù)比較2種模型對血透患者動靜脈內(nèi)瘺失功的預測效果。隨機森林預測模型的特異度、陰性預測值低于logistic預測模型;敏感度、準確性、陽性預測值高于logistic預測模型。見表5。

表5 兩種模型的預測性能比較
隨機森林預測模型的AUC為 0.911(95%CI:0.857~0.964,P<0.001),見圖2。logistic回歸預測模型的AUC為0.755(95%CI:0.649~0.862,P<0.001),見圖3。隨機森林預測模型的AUC大于logistic回歸預測模型的AUC(Z=2.600,P=0.009) 。

圖2 基于隨機森林預測模型的ROC曲線

圖3 基于logistic預測模型的ROC曲線
本文基于隨機森林模型和多因素logistic回歸模型建立AVF失功的預測模型,結(jié)果表明隨機森林算法可以有效地區(qū)分可能發(fā)生AVF失功的個體和不會發(fā)生AVF失功的個體,且其預測準確性高于logistic回歸模型。此外,隨機森林預測模型結(jié)果顯示,營養(yǎng)風險指數(shù)、堿性磷酸酶、年齡、血小板計數(shù)、紅細胞比容、鈣磷乘積、C反應蛋白、凝血酶原時間、性別、甘油三酯等為預測血透患者AVF失功發(fā)生重要性位列前10的因素。logistic回歸模型結(jié)果可根據(jù)效應值的大小直觀地解釋營養(yǎng)風險指數(shù)、年齡、吸煙史、糖尿病史、鈣磷乘積以及透析中低血壓等因素與發(fā)生AVF失功風險間的關系,且其在特異度、陰性預測值等模型性能指標上的表現(xiàn)優(yōu)于隨機森林預測模型。
營養(yǎng)風險指數(shù)作為一個評估營養(yǎng)評分的客觀指標,可能是預測AVF失功發(fā)生的最重要因素。隨著營養(yǎng)狀態(tài)的惡化,血管內(nèi)皮受損、修復功能障礙,內(nèi)源性凝血途徑由于膠原暴露而被激活,這些變化均可促使血栓形成[10-11]。湯?,摰萚11]應用競爭風險模型探討血透中心老年患者AVF失功的危險因素,發(fā)現(xiàn)較低的營養(yǎng)風險指數(shù)是導致老年患者AVF失功的獨立危險因素;本研究進一步表明營養(yǎng)風險指數(shù)可作為全年齡段患者發(fā)生AVF失功的獨立預測指標。研究還顯示維持性血液透析患者發(fā)生AVF失功的風險每增加1歲就會增加0.035倍的風險。研究通過多因素logistic回歸模型表明糖尿病史是AVF失功的獨立危險因素。機制研究表明糖尿病與AVF失功的發(fā)生與其致動脈粥樣硬化和胰島素抵抗有關;這可以通過增強凝血因子及血小板功能加速血栓形成[12]。吸煙作為公認的心血管疾病和靜脈血栓形成危險因素[13-14],在本研究中也被證實與AVF失功發(fā)生有關;可能是因為長期吸煙損害內(nèi)皮細胞的抗凝功能,從而導致AVF血栓形成和失功。鈣磷代謝紊亂是慢性腎臟疾病患者常見的并發(fā)癥,鈣磷乘積升高可以促進血管平滑肌細胞增殖,血管鈣化加速,繼而影響血管舒縮功能,使血管狹窄或閉塞[15]。本研究中AVF失功組患者的鈣磷乘積顯著高于正常組,也證實了鈣磷代謝紊亂與AVF失功發(fā)生有關。1項納入12篇病例對照研究的meta分析發(fā)現(xiàn)透析中低血壓患者發(fā)生AVF失功的風險是其他患者的3.27倍[9],本研究通過多因素logistic回歸模型也表明透析中低血壓是AVF失功的危險因素,其可能與血漿滲透壓相對快速變化有關[16]。
本研究有以下幾點優(yōu)勢:首先,研究使用隨機森林來預測維持性血液透析患者發(fā)生AVF失功的風險,隨機森林可將所有可能風險因素納入分析,然后篩選出重要變量并建立預測模型,使模型的預測更加準確;此外,建立預測模型的所需數(shù)據(jù)可在臨床中獲取,并有助于臨床醫(yī)護人員迅速評估個體發(fā)生AVF失功的風險,并對高危個體實施個性化干預。本研究局限性:鑒于本研究為一項單中心研究,可能導致建立的模型在其他人群中使用效果不佳;同時本研究建立基于隨機森林算法和logistic回歸模型構(gòu)建的維持性血液透析患者AVF失功預測模型,仍需通過多中心、前瞻性研究進一步驗證。
綜上所述,隨機森林模型相較于logistic 回歸模型對AVF失功發(fā)生總體預測效果好,但logistic回歸模型能直觀地解釋結(jié)果,兩種模型可互為補充,從各個方面描述影響AVF失功發(fā)生的因素及作用。