徐湘妍玉,吉昕宇,宋昀杰,徐曉霜,徐海萍,張汝陽
(1.南京醫科大學公共衛生學院 生物統計學系,江蘇 南京,211166;2.復旦大學公共衛生學院 流行病與衛生統計學系,上海,200032;3.南京醫科大學第一附屬醫院 乳腺科,江蘇 南京,210036)
手臂輸液港是惡性腫瘤患者的常用治療措施,臨床常采用X射線定位靜脈導管頭端。近年來,采用心電圖進行靜脈導管頭端定位者逐漸增多。完全植入式靜脈輸液港(TIVAP)是完全植入人體內的閉合輸液裝置,包括頭端位于上腔靜脈的導管部分和埋植于皮下的港座部分,其中靜脈導管部分與經外周靜脈置入中心靜脈導管(PICC)相似。臨床應用輸液港可減少許多并發癥的發生,如靜脈炎、血栓、纖維蛋白鞘等[1]。與PICC相比,輸液港增加了1個港座,保留的時間更長,更適合長期化療[2]。輸液港應用過程中的關鍵問題之一是保證導管頭端定位的精準性,若靜脈導管頭端位置定位不精準,可能會引發相關并發癥[3]。心電圖引導技術具有安全性高、精準率高、無輻射等優點[4-7],近年來已被廣泛應用于臨床。LIU G等[8]的一項關于心電圖引導PICC研究的Meta分析結果顯示,成年患者置入PICC過程中采用心電圖引導相較于X射線法具有更高的定位精度,精準度可達89.7%,且沒有重大的安全性問題。與傳統的解剖標志定位相比,心電圖引導方法也具有明顯的優勢[9-10]。本研究基于隨機森林算法探討心電圖技術引導手臂輸液港靜脈導管頭端精準定位的影響因素,現報告如下。
選取2018年9月—2019年9月南京醫科大學第一附屬醫院乳腺病科收治的338例植入輸液港的女性乳腺癌化療患者作為研究對象。應用心電圖引導靜脈導管頭端定位,并收集患者的相關信息。患者年齡、婚姻狀況、文化程度、家庭月收入、醫療費用支付方式的資料來自問卷調查。新輔助治療、手術方式來自患者在醫院接受治療時的資料。身高、體質量、輸液港植入側臂圍數據于置港前由護士統一測量所得。導管置入位置、導管置入靜脈、導管置入長度、穿刺點至胸鎖關節長度數據在植入手臂港過程中獲取。
導管進入上腔靜脈時,出現高尖P波。導管到達上腔靜脈與右心房的上壁交界連接點(CAJ)時,P波達到最高峰。若導管進入右心房,則會出現負向P波。本研究中,當P波振幅達到QRS波高度50%時,將此時的導管長度視為導管置入靜脈的長度。手臂輸液港囊袋中的港座與導管連接帽的長度為1 cm,最終記錄的導管長度為導管置入靜脈的長度再加上1 cm。
2016年美國靜脈輸液護理學會發布的新版《輸液治療實踐標準》[11]指出,導管的頭端位置位于CAJ為安全性最佳。本研究中,導管頭端位置在CAJ或位于CAJ上端1個椎體,均視為導管頭端位置精準。
隨機森林是一種機器學習算法,由BREIMAN L[12]于2001年提出,其基本思想是從1個樣本量為N、特征數為M的數據集中,利用Bootstrap法有放回地抽樣產生1個樣本量為N、特征數為m[常設為sqrt(M)]的Bootstrap數據用于模型訓練。理論上,原始數據中約有1/3的樣本不會被抽取,稱為袋外(OOB)數據。重復以上過程k次,可得含有k棵決策樹的隨機森林。本研究設置5 000棵決策樹。
決策樹首先選定所有樣本為根節點,繼而根據某變量生成2個子節點。根據節點中各結局的頻率,可計算出根節點與2個子節點之間基尼不純度的差值。建樹時,選取使基尼不純度變化最大的變量劃分根節點。每個子節點都重復上述過程進行劃分,直至子節點中基尼不純度不再減小。在整個森林中,可以計算出某變量使整個森林平均減少的基尼不純度,稱為平均不純度減小(可作為變量的重要性評分)。
本研究采用滑動窗口序貫向前選擇法(SWSFS)篩選變量[13-14]。按照重要性評分從大到小依次納入變量,每加入1個變量重新進行隨機森林分析。選擇使得OOB錯誤率最小時對應變量集進行后續分析。
首先,將原數據集按照2∶1比例隨機劃分為訓練集與測試集。基于訓練集,采用所篩選的變量構建“導管頭端定位精準”的決策樹。在測試集中,評價決策樹的靈敏度、特異度、陽性預測值、陰性預測值、準確率和受試者工作特征(ROC)曲線的曲線下面積(AUC)。重復上述步驟1 000次,得到各統計量的抽樣分布。

6個連續變量(年齡、身高、體質量、穿刺點至胸鎖關節長度、導管置入長度、輸液港植入側臂圍)的t檢驗結果提示,2組身高、導管置入長度比較,差異有統計學意義(P<0.05)。7個無序分類變量(導管置入位置、導管置入靜脈、婚姻狀況、文化程度、醫療費用支付方式、新輔助治療、手術方式)的卡方檢驗結果提示,2組上述指標比較,差異無統計學意義(P>0.05)。等級變量(家庭月收入)的秩和檢驗結果顯示,2組家庭月收入比較,差異無統計學意義(P>0.05)。見表1。

表1 精準組與不精準組患者的基線資料比較
采用隨機森林法評價13個變量的重要性評分,由高至低依次為:身高17.7分,年齡17.3分,體質量13.5分,輸液港植入側臂圍12.1分,穿刺點至胸鎖關節長度11.9分,家庭月收入5.4分,教育程度3.8分,醫療費用支付方式3.6分,置入位置2.8分,新輔助治療2.2分,置入靜脈2.1分,手術方式1.9分,婚姻狀況1.2分。當進入模型的變量數量為3時,模型錯判率最低(見圖1),即前3個變量使得模型OOB數據錯誤率最低,因此重要變量分別為身高、年齡和體質量。

在訓練集中,基于重要變量構建決策樹。在測試集和全人群數據中,評價該決策樹的效果。結果提示,所構建模型的準確率(0.84)、靈敏度(0.98)、陽性預測值(0.85)尚可,特異度(0.19)、陰性預測值(0.54)、曲線下面積(AUC)(0.67)較低。見圖2、表2。


表2 決策樹模型在測試集及全人群中的各統計量結果
基于全人群數據集的決策樹提示,身高<155 cm、體質量>52 kg、年齡49~63歲的患者更易發生手臂輸液港靜脈導管頭端定位不精準的情況。見圖3。

本研究隨機森林和決策樹模型的結果提示,身高、體質量和年齡可能是手臂輸液港靜脈導管頭端定位不精準的影響因素。身高較低的患者,上腔靜脈一般較短,因此操作過程中導管的移動空間較小,易導致頭端定位不精準,與徐海萍等[15]Logistic回歸模型研究結論一致。除了患者本身的特征外,心電圖圖像的穩定性也是影響導管頭端定位精準性的重要因素。郭素萍等[16]研究表明,約5%的患者在心電圖引導靜脈導管置入術中不能獲得穩定心電圖。此外有學者[17]指出,除了心電圖信號本身外,其他無線電信號和周圍醫療設備的干擾也可能對心電圖的圖像產生影響。
多項研究[15,18-20]結果顯示,不同體質量、年齡對心電圖P波改變或靜脈導管頭端定位精準性比較,差異無統計學意義(P>0.05)。這可能是因為大多數研究只考慮了體質量、年齡的主效應,而忽視了其與其他因素間的聯合效應或交互作用。本研究采用的決策樹模型能夠很好地識別變量之間的復雜效應。然而,體質量、年齡影響導管頭端定位精準性的機制仍待進一步研究。本研究結果提示,臨床醫師應著重關注身高<155 cm、體質量>52 kg、年齡49~63歲的患者,因為此類患者更易發生靜脈導管頭端定位不精準的情況。
本研究采用隨機森林算法評估了靜脈導管尖端定位精確性的影響因素,隨機森林可對變量進行重要性排序,排序結果顯示了各變量對結局的貢獻大小。作為一個初步探索性研究,本研究為后續確證性研究提供了思路。本研究局限性在于僅以女性乳腺癌化療患者為研究對象,且只收集了常見的、易獲取的研究指標,未來有待選取其他腫瘤患者為研究對象且擴大樣本量、研究指標進行更深入的后續研究。