






[摘要]"目的"基于極限梯度提升(extreme"gradient"boosting,XGBoost)構建胸腰椎骨折內固定術后發生下肢深靜脈血栓(deep"vein"thrombosis,DVT)的預測模型。方法"選取2019年1月至2022年12月于溫州醫科大學附屬第一醫院行胸腰椎骨折內固定術患者220例,分為訓練集(154例)和測試集(66例)。訓練集經過合成少數類過采樣技術處理,基于XGBoost建立預測模型,在測試集上采用受試者操作特征曲線下面積、準確率、F1得分、敏感度和特異性指標比較性能,并基于SHAP值量化影響因素的貢獻程度進行可解釋性分析。結果"XGBoost模型在多個指標上的表現優于邏輯回歸、支持向量機和隨機森林模型,其在原測試集上的曲線下面積為0.761,臨床決策曲線表明其有一定的臨床應用價值。結論"基于年齡、體質量指數及術后白蛋白、D-二聚體、總蛋白、紅細胞沉降率、凝血酶原時間建立的XGBoost模型可有效預測胸腰椎骨折內固定術后下肢DVT的發生,在臨床實踐中具有良好的應用前景。
[關鍵詞]"胸腰椎骨折;下肢深靜脈血栓;合成少數類過采樣技術;極限梯度提升;可解釋性分析
[中圖分類號]"R619""""""[文獻標識碼]"A""""[DOI]"10.3969/j.issn.1673-9701.2024.33.010
A"XGBoost"model"for"risk"prediction"of"lower"extremity"deep"vein"thrombosis"after"internal"fixation"surgery"for"thoracolumbar"fractures
LIAO"Jiajia,"LIANG"Xiaona,"XU"Xiaojing,"ZHAN"Jiangxian
391"Ward"of"Spine"Surgery,"the"First"Affiliated"Hospital"of"Wenzhou"Medical"University,"Wenzhou"325000,"Zhejiang,"China
[Abstract]"Objective"To"construct"a"predictive"model"for"the"occurrence"of"lower"extremity"deep"vein"thrombosis"(DVT)"after"internal"fixation"surgery"for"thoracolumbar"fractures"by"using"extreme"gradient"boosting"(XGBoost)."Methods"Data"of"220"patients"who"underwent"internal"fixation"surgery"for"thoracolumbar"fractures"in"the"First"Affiliated"Hospital"of"Wenzhou"Medical"University"from"January"2019"to"December"2022"was"collected."The"dataset"was"divided"into"a"training"set"(154"cases)"and"a"testing"set"(66"cases)."The"training"set"was"processed"by"using"the"synthetic"minority"over-sampling"technique"and"the"predictive"model"was"build"based"on"XGBoost."The"performance"was"compared"on"the"testing"set"by"using"area"under"receiver"operating"characteristic"curve,"accuracy,nbsp;F1"score,"sensitivity"and"specificity."The"interpretability"analysis"base"on"SHAP"was"conducted"to"quantify"the"degree"of"contribution"of"influencing"factors."Results"The"XGBoost"model"outperformed"logistic"regression,"support"vector"machine"and"random"forest"models"on"multiple"metrics,"with"an"area"under"the"curve"of"0.761"on"the"original"testing"set."The"decision"curve"indicated"that"the"XGBoost"model"has"clinical"application"value."Conclusion"The"XGBoost"model"based"on"factors"such"as"age,"body"mass"index,"and"postoperative"albumin,"D-dimer,"total"protein,"erythrocyte"sedimentation"rate,"prothrombin"time"can"effectively"predict"the"occurrence"of"lower"extremity"DVT"after"internal"fixation"surgery"for"thoracolumbar"fractures,"which"has"good"potential"for"clinical"application.
[Key"words]"Thoracolumbar"fractures;"Deep"vein"thrombosis;"Synthetic"minority"over-sampling"technique;"Extreme"gradient"boosting;"Interpretability"analysis
胸腰椎骨折多由骨質疏松或外力作用(車禍、摔倒或高墜等)所致,因其特殊的解剖功能特點,臨床上多以手術治療為主,而術后下肢深靜脈血栓(deep"vein"thrombosis,DVT)是最常見和最危險的并發癥之一,嚴重者可導致肺栓塞,危及患者的生命[1]。研究顯示脊柱外科術后患者下肢DVT發生率為0.3%~"31.0%[2]。因此,及時評估患者的血栓形成風險并采取預防措施尤為重要。目前,關于胸腰椎骨折術后下肢DVT事件發生的危險因素還未形成共識。本研究通過回顧性分析探討胸腰椎骨折內固定術后發生下肢DVT的危險因素。以機器學習為代表的數據驅動方法近年來在包括醫學在內的領域得到大量有效的驗證。Tseng等[3]使用多個機器學習模型預測患者心臟手術相關的急性腎損傷,Chang等[4]使用極限梯度提升(extreme"gradient"boosting,XGBoost)模型和聚類算法分析高血壓相關癥狀的概率。然而,機器學習模型常被視為一個“黑箱”,其中間過程和內在機制難以解釋[5]?;赟hapley值解釋(Shapley"additive"explanation,SHAP)的方法可量化每個特征對預測結果的貢獻,提高模型的可解釋性。本研究利用XGBoost構建風險預測模型,評價其性能并利用SHAP對模型進行可解釋性分析,探究術后發生下肢DVT的關鍵因素,以期為早期預防、診斷和治療DVT提供參考。
1""資料與方法
1.1""研究對象
采取回顧性研究方法選取2019年1月至2022年12月于溫州醫科大學附屬第一醫院行胸腰椎骨折內固定術患者220例。參考《深靜脈血栓形成的診斷和治療指南(第三版)》[6]中關于下肢DVT的診斷標準,根據術后超聲結果將患者分為無血栓形成組(無DVT組)和血栓形成組(DVT組)。其中無DVT組194例,DVT組26例。本研究經溫州醫科大學附屬第一醫院倫理委員會審批通過[倫理審批號:(2024)第(R146)號]。
納入標準:①經影像學檢查確診為胸腰椎骨折;②行胸腰椎骨折切開復位內固定術;③術前影像學檢查均未發生下肢DVT;④術后住院期間行下肢靜脈超聲檢查。排除標準:①既往有DVT或肺栓塞史;②有長期應用抗凝藥或激素史;③有下肢靜脈手術史;④合并下肢外周血管病變;⑤合并下肢靜脈病變;⑥合并除胸腰椎外其他部位骨折;⑦合并休克、全身嚴重多發傷、顱腦損傷、意識不清或表達障礙;⑧合并惡性腫瘤,嚴重心、肺、肝、腎等臟器功能障礙及凝血功能障礙。
1.2""方法
通過查閱電子病歷系統收集患者的臨床資料。①一般資料:性別、年齡、體質量指數(body"mass"index,BMI)、吸煙史、飲酒史、手術時長;②并發癥:高血壓、糖尿病、高血脂、冠心?。虎坌g后化驗檢測指標:D-二聚體、血小板計數、纖維蛋白原、活化部分凝血活酶時間、凝血酶時間、凝血酶原時間(prothrombin"time,PT)、紅細胞沉降率(erythrocyte"sedimentation"rate,ESR)、總蛋白、白蛋白、C反應蛋白。
1.3""統計學方法
采用SPSS"26.0統計學軟件對數據進行處理分析。計數資料以例數(百分率)[n(%)]表示,組間比較采用c2檢驗;計量資料先行Shapiro-Wilk檢驗,符合正態分布的計量資料以均數±標準差()表示,組間比較采用t檢驗,不符合正態分布的計量資料以中位數(四分位數間距)[M(Q1,Q3)]表示,組間比較采用Mann-Whitney"U檢驗。部分化驗指標缺失數據使用平均值填充。P≤0.05為差異有統計學意義。
在機器學習中,偏差刻畫模型預測值與真實值之間的差,方差刻畫模型預測值的離散程度。XGBoost模型在提升法的基礎上,利用正則化、樹剪枝和子采樣等方法有效降低方差。因此,XGBoost模型具有卓越的性能并廣泛應用于各種場景。
首先,將原始數據集(220例)按7∶3的比例劃分為訓練集(154例)和測試集(66例)。針對訓練集中樣本不平衡的問題,對訓練集樣本進行合成少數類過采樣技術(synthetic"minority"over-sampling"technique,SMOTE)的處理,設置最后的無DVT組與DVT組比例相同,將過采樣后產生的數據集劃分為SMOTE后訓練集和SMOTE后測試集,訓練集和測試集比例為9∶1。其次,采用Python"3建立XGBoost模型,在原測試集上計算受試者操作特征曲線下面積(area"under"the"curve,AUC)、準確率、F1得分、敏感度和特異性并比較性能,利用SHAP對特征進行重要性排序,挑選個例進行可解釋性分析。
2""結果
2.1""兩組患者的臨床資料比較
兩組患者的性別、年齡、D-二聚體、血小板計數、ESR、總蛋白、白蛋白比較,差異有統計學意義(P≤0.05),見表1。
2.2""模型效果對比
邏輯回歸(logistic"regression,LR)、支持向量機(support"vector"machine,SVM)、隨機森林(random"forest,RF)和XGBoost是4種常用的機器學習算法,在原測試集上評估的結果見表2,其中XGBoost模型在AUC、準確率、F1得分和特異性上均優于其他模型,受試者操作特征曲線(receiver"operating"characteristic"curve,ROC曲線)見圖1。利用原測試集繪制決策曲線,見圖2。相比LR模型和SVM模型,RF模型和XGBoost模型的決策曲線大部分位于全部采取干預措施曲線和不采取干預措施曲線上方,說明其在臨床實踐中具有一定的實用性和效益。
2.3""影響因素可解釋性分析
2.3.1""特征重要性分析""本研究納入的影響因素包括性別、年齡、BMI、高血壓、糖尿病、高血脂、冠心病、吸煙史、飲酒史、手術時長、D-二聚體、術后血小板計數、術后纖維蛋白原、活化部分凝血活酶時間、凝血酶時間、PT、ESR、總蛋白、白蛋白、C反應蛋白。為對模型進行直觀性解釋,對胸腰椎骨折內固定術后患者發生下肢DVT的特征重要性進行分析。特征權重排序見圖3,結果顯示影響患者術后發生下肢DVT的因素從大到小依次為年齡、白蛋白、D-二聚體、BMI、總蛋白、ESR、PT。
模型的平均特征重要性分布見圖4,正數代表該特征使模型傾向于預測發生DVT,負數代表該特征使模型傾向于預測不發生DVT,絕對值大小量化特征的貢獻程度。色帶圖代表特征值的大小,顏色越藍代表特征值越小,顏色越紅代表特征值越大。如高齡使模型傾向于預測發生DVT,低齡使模型傾向于預測不發生DVT。
2.3.2""典型預測的解釋""選取1例預測為DVT的樣本,其SHAP解釋見圖5,該樣本為術后發生下肢DVT的77歲患者,白蛋白27.3g/L低于正常范圍,而D-二聚體20mg/L、ESR"72mm/h遠高于正常范圍,其中高齡和低白蛋白水平是模型預測該患者發生DVT的重要因素。
3""討論
3.1""胸腰椎骨折內固定術后下肢DVT的危險因素
基于SHAP值分析可知,高齡、術后低白蛋白、術后D-二聚體水平高、BMI高、術后總蛋白水平異常、術后ESR高、術后PT縮短均是胸腰椎骨折內固定術后下肢DVT的危險因素。高齡患者術后更易發生下肢DVT,其原因可能為隨著年齡的增長,血管壁逐漸失去彈性和柔韌性而變得脆弱;血管內皮功能退化及心臟泵血能力下降可使血液流動減慢,血液中的凝血因子更容易聚集在一起[7-8]。此外,高齡患者因手術后疼痛致活動減少,使血液運行滯緩,加劇術后發生下肢DVT的風險。白蛋白是一種主要由肝臟合成的蛋白質,廣泛存在于血液中,具有天然抗凝作用,與血液中凝血因子結合以減少凝血因子在血栓形成中的活性,通過抗氧化作用減少血管內皮的氧化應激。低白蛋白水平可通過增加炎癥反應和血液黏度等多種機制提高下肢DVT形成的風險。D-二聚體是一種反映纖溶酶激活與交聯蛋白形成的特異性分子標志物。因其水平穩定性、對纖溶及凝血狀態評價的特異性及敏感度可直觀反映機體纖溶活性與凝血功能狀態,對DVT的形成與發展發揮重要作用[9]。Yamasaki等[10]研究發現,患者腰椎術后1周D-二聚體為19.5μg/ml時DVT風險增加4.09倍。Jiang等[11]研究顯示D-二聚體異常升高程度與血栓形成概率及其大小呈正相關。BMI作為衡量體質量的重要指標,本研究中DVT組患者BMI達到(25.05±3.85)kg/m2,屬于超重。研究發現超重患者體內脂肪含量明顯高于正常人群,脂肪堆積可增加靜脈系統的壓力,尤其是下肢靜脈,進而導致血液回流不暢,增大下肢DVT發生的風險[12]。此外,超重患者手術過程中可因術野暴露困難而導致周圍組織和軟組織損傷較多[13]。總蛋白組成成分的變化對血栓形成有重要影響,這些變化直接影響血液黏度和凝固特性,或間接通過慢性疾病和全身炎癥狀態增加下肢DVT風險。陳小蘭等[14]研究發現ESR與下肢DVT形成顯著相關。炎癥反應可導致血液中凝血因子的活化和血小板聚集,從而提高ESR,增加下肢DVT風險。PT是外源凝血系統較為靈敏和最為常用的篩選指標,主要反映凝血因子Ⅶ、Ⅹ、Ⅱ、Ⅴ及組織因子在體內的活性。當PT縮短時表面凝血過程加速,提示機體處于高凝狀態,下肢DVT風險增加[15]。
3.2""XGBoost模型效能和臨床價值
本研究構建胸腰椎骨折內固定術后下肢DVT風險預測模型,并利用SHAP值彌補機器學習模型“黑箱”的缺點。模型在臨床中作為一種輔助工具,可有效識別高風險患者,預防下肢DVT的發生。XGBoost模型在測試集上的表現優于LR等模型,且在臨床決策上具有一定應用價值。利用SHAP值模型揭示年齡、白蛋白、D-二聚體、BMI、總蛋白、ESR、PT與發生下肢DVT的非線性關系,有助于進一步探索下肢DVT發生的機制,為制定合理的干預方案提供依據。對高齡患者,在病情允許的情況下可適當下床活動以加快下肢血液流速,預防DVT發生。術后白蛋白較低的患者可予圍手術期白蛋白及營養補充治療。術后應對患者的D-二聚體、ESR、凝血功能等指標進行動態監測,及時給予低分子量肝素等抗凝藥物以預防下肢DVT的發生。同時,應做好基礎預防、物理預防,包括正確使用彈力襪、間歇性充氣加壓裝置等。
綜上所述,基于XGBoost的胸腰椎骨折內固定術后下肢DVT風險預測模型具有較好的效果。本研究將SHAP值用于量化每個特征對預測結果的貢獻,從而幫助醫護人員理解影響因素與預測結果之間的復雜關系。年齡、白蛋白、D-二聚體、BMI、總蛋白、ESR、PT可作為識別高風險患者并進行干預的參考依據。針對每一個樣本,SHAP解釋圖可清晰展現各個因素對預測結果的影響程度。本研究屬于回顧性研究,且所有數據均來源于單中心調查,可能存在一定偏倚,后續應進行外部多中心、大樣本量的研究進行驗證,以進一步探討其在臨床中的應用價值。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻]
[1] FUJI"T,"AKAGI"M,"ABE"Y,"et"al."Incidence"of"venous"thromboembolism"and"bleeding"events"in"patients"with"lower"extremity"orthopedic"surgery:"A"retrospective"analysis"of"a"Japanese"healthcare"database[J]."J"Orthop"Surg"Res,"2017,"12:"1–9.
[2] GLOTZBECKER"M"P,"BONO"C"M,"WOOD"K"B,"et"al."Thromboembolic"disease"in"spinal"surgery:"A"systematic"review[J]."Spine,"2009,"34(3):"291–303.
[3] TSENG"P"Y,"CHEN"Y"T,"WANG"C"H,"et"al."Prediction"of"the"development"of"acute"kidney"injury"following"cardiac"surgery"by"machine"learning[J]."Crit."Care,nbsp;2020,"24:"1–13.
[4] CHANG"W,"LIU"Y,"XIAO"Y,"et"al."A"machine-learning-based"prediction"method"for"hypertension"outcomes"based"on"medical"data[J]."Diagnosis,"2019,"9(4):"178.
[5] MEDICINE"T"L"R."Opening"the"black"box"of"machine"learning[J]."The"Lancet,"2018,"6(11):"801.
[6] 李曉強,"張福先,"王深明."深靜脈血栓形成的診斷和治療指南"(第三版)[J]."中國血管外科雜志,"2017,"9(4):"250–257.
[7] TOMINAGA"H,"SETOGUCHI"T,"TANABE"F,"et"al."Risk"factors"for"venous"thromboembolism"after"spine"surgery[J]."Medicine,"2015,"94(5):"e466.
[8] ZHAO"C"M,"ZHANG"Y,"YANG"S"D,"et"al."Risk"factors"for"lower"limb"deep"vein"thrombosis"in"patients"with"single-level"lumbar"fusion:"A"prospective"study"of"710"cases[J]."Clin"Appl"Thromb/Hemost,"2018,"24(9_suppl):"157S–162S.