張建楠, 李榮華, 周紅梅, 徐敏逸, 蔡靚羽
(江蘇省無錫市中醫醫院 麻醉科, 江蘇 無錫, 214071)
下肢骨科手術(LEOS)包括選擇性全髖關節置換術(THR)、全膝關節置換術(TKR)、髖骨骨折手術(HFS)等,若未及時采取血栓預防措施,患者術后極易發生深靜脈血栓形成(DVT)[1-4]。DVT的發生不僅會延長患者的住院時間,影響患者的康復進程,還可能引發致命的肺栓塞(PE)[5], 因此早期診斷及預測DVT具有重要的臨床意義。研究[6]顯示,影像學檢查、D-二聚體檢測等方法可在一定程度上有效診斷DVT。目前,術前概率評估、D-二聚體和超聲聯合檢測被推薦為診斷DVT的一線方案[7]。盡管抗凝治療可以降低復發性血栓的發生風險,但亦會增加大出血的發生風險,故預測DVT風險具有重要意義[6]。近年來,相關研究[8-9]構建了DVT風險預測模型,其中年齡、性別均為關鍵特征變量。目前, LOES患者術后DVT風險預測模型的相關研究較少,這可能與數據收集難度大或對復合診斷的不確定有關。本研究通過鏈式方程多元插補(MICE)方法整合缺失值,旨在確定LOES患者術后DVT的潛在預測因素并構建術后DVT風險預測模型,現報告如下。
回顧性收集2017年1月—2019年10月無錫市中醫醫院收治的住院LEOS患者的基線資料、既往史和實驗室指標檢測結果,所有數據來自住院電子病歷系統。排除標準: ① 年齡<18歲者; ② 有精神異常、語言障礙和意識障礙者; ③ 多發傷患者。根據開發臨床預測模型的要求[10]納入充足樣本量,本研究最終共納入5 773例患者,將其隨機分為訓練集4 041例和驗證集1 732例。本研究嚴格遵循赫爾辛基宣言的原則,已獲得無錫市中醫醫院醫學倫理委員會審核批準(SWJW2019082907), 并確認免除患者知情同意。
搜索已發表文獻中的無時間和語言限制的DVT相關變量,為增強實用性和解釋性,采用德爾菲法選擇與臨床相關的合理變量。收集患者的基線資料,包括年齡、手術時間、體質量指數(BMI),其中手術時間作為連續變量之一,使用預設時限點(<2 h或2~3 h或>3 h)轉換為離散變量。收集患者的既往史,包括吸煙史、飲酒史、輸血史、高血壓病和糖尿病病史。收集患者的實驗室指標檢測結果,包括紅細胞(RBC)、白細胞(WBC)、血小板(PLT)、血紅蛋白(Hb)、淋巴細胞(LYM)、中性粒細胞(NEU)、紅細胞壓積(HCT)、紅細胞平均血紅蛋白(MCH)、紅細胞平均血紅蛋白濃度(MCHC)、紅細胞平均體積(MCV)、血小板分布寬度(PDW)、紅細胞分布寬度(RDW)、谷丙轉氨酶(ALT)、谷草轉氨酶(AST)、尿酸(UA)、膽堿酯酶(CHE)、總蛋白(TP)、球蛋白、D-二聚體、凝血酶原(FIB)、活化部分凝血活酶時間(APTT)、凝血酶時間(TT)和凝血酶原時間(PT)。如果患者存在多個醫療記錄,僅選取最新數據。
術后下肢DVT的判定依據: ① 受影響肢體的腹股溝或小腿出現飽滿感或劇烈疼痛,伴有明顯觸痛; 受影響肢體皮膚呈暗紅色,溫度升高; 表淺靜脈興奮; Homans征陽性; ② 有臥床、手術、創傷、惡性腫瘤、血栓性傾向、靜脈血栓栓塞癥(VTE)、妊娠史以及其他DVT風險因素史; ③ 多普勒超聲和靜脈造影可確認診斷; ④ D-二聚體水平急性升高; ⑤ 排除急性動脈栓塞、急性淋巴管炎、丹毒、盆腔原發腫瘤、下肢局部血腫或肌筋膜炎。
提取數據并存儲于電子表格中,導入R軟件(4.2.1版本)進行初步處理。納入和排除之前,將非結構化和異常數據通過刪除或適當替換方法進行手動篩選與處理。年齡(1%)、BMI(12%)變量存在少量缺失,根據數據分布情況以均值填補。此外,部分實驗室指標檢測數據也存在不同比例的缺失。假設缺失是隨機缺失(MAR),通過MICE方法填補缺失值。

將單因素分析中P<0.05的變量納入多因素Logistic回歸分析,應用向后逐步選擇法確定DVT的潛在預測因素。繪制受試者工作特征(ROC)曲線,獨立評估各預測因子的預測效能。通過一致性指數(C指數)和曲線下面積(AUC)評估預測模型的區分能力,通過Hosmer-Lemeshow擬合優度檢驗和校準曲線評估預測模型的校準能力,通過決策曲線評估預測模型的臨床實用性(閾值概率、凈收益)。通過敏感性分析驗證MAR假設的有效性,在原始數據集中進行多因素Logistic回歸分析。P<0.05為差異有統計學意義。
訓練集、驗證集患者的DVT發生率分別為0.74%(30/4 041)、1.27%(22/1 732), 差異無統計學意義(P=0.07)。訓練集、驗證集中, DVT患者的年齡均高于非DVT患者,差異有統計學意義(P<0.05); 訓練集中, DVT患者的高血壓病史與非DVT患者比較,差異有統計學意義(P<0.05), 見表1。除高血壓病以外,訓練集與驗證集的其他變量均表現相似,分布也相似。

表1 訓練集與驗證集患者的基線資料及既往史比較[M(P25, P75)][n(%)]
訓練集中, DVT患者的RBC、Hb、LYM、HCT、MCHC、PDW、UA水平均低于非DVT患者, TT短于非DVT患者, WBC、NEU、D-二聚體、FIB水平均高于非DVT患者,差異有統計學意義(P<0.05); 驗證集中, DVT患者的RBC、Hb、LYM、HCT、MCHC、PDW、UA、CHE水平均低于非DVT患者, NEU、RDW、D-二聚體、FIB水平均高于非DVT患者,差異有統計學意義(P<0.05), 見表2。除WBC、RDW、CHE、TT以外,訓練集與驗證集的其他變量表現相似。

表2 訓練集與驗證集患者實驗室指標檢測結果比較
基于訓練集進行的單因素分析結果顯示, 31個協變量中共篩選出14個潛在預測因素,分別為年齡、高血壓病、RBC、Hb、LYM、HCT、MCHC、PDW、UA、TT、WBC、NEU、D-二聚體、FIB。將這些變量進一步納入多因素Logistic回歸分析,應用向后逐步選擇法最終共篩選出5個預測因素(無多重共線性問題)。多因素Logistic回歸分析結果顯示,年齡、MCHC、D-二聚體、PDW、TT均為LEOS患者術后DVT的獨立預測因素(P<0.05), 見表3。

表3 下肢骨科手術患者術后發生DVT的多因素Logistic回歸分析結果
根據5個預測因素構建DVT風險列線圖預測模型,每個預測因素對應至標尺可得到相應分值,將各項分值相加即得到總分值,進而可獲得DVT風險概率,見圖1。該預測模型的C指數為85.8%; 在訓練集中進行2 000個分層引導法復制后,該模型預測DVT的AUC為0.859, 在驗證集中預測DVT的AUC則為0.857, 表明該預測模型具有良好的區分能力,見圖2。

圖1 基于5個預測因素構建的列線圖預測模型

A: 訓練集; B: 驗證集。
校準曲線顯示,預測模型在訓練集、驗證集中的表現與理想模型一致性良好,僅略微偏離,說明該模型具有良好的校準能力,見圖3。Hosmer-Lemeshow擬合優度檢驗結果顯示,P=0.879, 表明該模型校準度高。決策曲線顯示,與“所有患者干預”和“無患者干預”臨床方案相比,當閾值概率為0.01~0.16時, DVT預測模型將提供正凈獲益,見圖4。

A: 訓練集; B: 驗證集。

圖4 DVT風險列線圖預測模型的決策曲線
在未使用缺失值填補的數據集中進行多因素Logistic回歸分析,得到了類似結果,見表4。由此提示,缺失值填補是穩定的,即證明MAR假設是有效的。

表4 2個多因素Logistic回歸模型的敏感性分析
本研究5 773例LOES患者中, 52例術后發生DVT, 發生率為0.9%。本研究從31個協變量中初步篩選出14個潛在預測因素,并通過向后逐步選擇法最終篩選出5個預測因素(年齡、MCHC、D-二聚體、PDW和TT)構建列線圖預測模型,該模型在訓練集中的AUC為0.859, 在驗證集中的AUC為0.857, 提示該模型具有良好的區分能力。
本研究訓練集中, DVT患者和非DVT患者的中位年齡分別為74.9歲和60.3歲,主要為中老年人。相關研究[11-12]顯示,中年患者(40~44歲)的DVT發生率為PE的3倍,而老年患者(80~84歲)的情況則正好相反。由于D-二聚體在老年人群中的特異性較低,許多研究[13-14]采用≥50歲患者的年齡乘以10倍的D-二聚體切點值,與傳統標準(500 μg/L)相比,其表現通常更好。本研究中, D-二聚體特異性較低,可能是因為DVT患者年齡較大。研究[15-16]顯示, D-二聚體聯合PDW或TT具有區分DVT和非DVT的顯著效果,與本研究結論一致。MCHC作為反映凝血功能的常用指標,亦是本研究DVT風險預測模型中的預測因素之一。相關研究[17]顯示, MCHC是VTE的風險因素之一。
將機器學習方法與傳統方法聯合應用于DVT篩查中,可改善DVT疑似患者的診療過程,并減少醫療資源的浪費[18]。與傳統方法相比,機器學習方法診斷DVT大多是及時有效的(除各自缺陷外)[19-20]。然而,由于中國各醫院醫療數據的差異性較大和完整性不足,數據挖掘困難,人工智能(AI)算法在預測模型構建中的應用受到限制。鑒于此,首先需要優化數據清理步驟,其中MICE方法起著關鍵作用。從方法論角度出發,多變量填補(MI)在臨床預測模型中處理遺漏數據時常被推薦使用[21]。相關研究開發了預測患者DVT發生風險的模型,發現在缺失重要預測因素(D-二聚體)、較弱預測因素(小腿周長差異)或兩者皆有的3種情況下, MI導致校準截距最接近真值。
綜上所述,本研究通過MICE方法整合缺失值,構建了由5個關鍵預測因素(年齡、MCHC、D-二聚體、PDW和TT)組成的LEOS患者術后DVT風險預測模型,該模型具有良好的區分能力、校準能力和臨床實用性,有助于醫生對下肢骨科手術后DVT患者進行分類并制訂早期治療方案。但本研究的臨床數據來自單中心,且僅涉及術后DVT風險,未來還需結合術前DVT風險預測進一步開展多中心研究加以驗證。