胡明,楊云杰,趙振華,石明,徐勛,張湛英,關禮賢,馮權堯
尿膿毒血癥是泌尿外科常見的急危重癥之一,該病進展迅速,極易進展為感染性休克,甚至出現多器官功能衰竭[1-2]。尿膿毒血癥常見的病因是泌尿道梗阻,如尿路結石、前列腺增生和泌尿系先天性解剖異常等,其中輸尿管結石最為普遍[3]。本中心近年收治的進展為尿膿毒血癥的輸尿管結石患者中,入院尚未實施手術,甚至院前即出現尿膿毒血癥患者人數逐年增加,但是目前大量研究都聚焦于內鏡碎石術后并發尿膿毒血癥的危險因素,指導意義有限。前期我科建立和優化了輸尿管結石進展為尿膿毒血癥的預測模型,并利用列線圖方法對其進行可視化呈現,預測模型顯示性別、功能性孤立腎、腎積液平均CT值、尿白細胞計數(WBC)及尿亞硝酸鹽是輸尿管結石進展為尿膿毒血癥的預測因素[4-5]。該模型對臨床早期識別尿膿毒血癥患者的預測能力顯著,為及時、有效的治療提供了依據。但是根據國際通用的TRIPOD清單和闡述文件[6]要求,新建預測模型需要經過本中心其他樣本或其他中心樣本的外部驗證,才能真實反映該模型的預測效能。因此筆者前瞻性收集本中心新收治的輸尿管結石患者臨床資料,對預測模型進行外部驗證,評估其臨床應用價值。
1.1 預測模型介紹 回顧性分析既往輸尿管結石患者的臨床資料,通過單因素和多因素Logistic回歸分析,初步構建輸尿管結石進展為尿膿毒血癥的個體化預測模型。結果顯示:性別、功能性孤立腎、腎積水平均CT值、尿細菌培養、尿WBC及尿亞硝酸鹽6個因素是輸尿管結石進展為尿膿毒血癥的獨立危險因素。但是在臨床應用和推廣過程中,發現尿細菌培養變量存在滯后性,預測模型存在局限性。故根據預測模型的缺陷所在,本研究將舊模型6個變量剔除尿細菌培養變量,重新構建新的預測模型,并用各個變量對應的偏回歸系數構建回歸方程[4-5],預測模型如下:預測概率P=ex/(1+ex),其中e為自然對數,X=-5.800+1.513×(性別)+1.105×(功能性孤立腎)+1.155×(腎積水平均CT值)+1.078×(尿WBC)+1.551×(尿亞硝酸鹽)。各變量賦值如下:性別(男=0,女=1)、功能性孤立腎(陰性=0,陽性=1)、腎積水平均CT 值(<8 HU=0,8~15 HU=1,>15 HU=2)、尿WBC(陰性=0,“+”=1,“++”=2,“+++”=3)、尿亞硝酸鹽(陰性=0,陽性=1)。
1.2 驗證對象 收集2016 年1—12 月我院收治的輸尿管結石患者317 例。其中輸尿管結石進展為尿膿毒血癥患者29例納入尿膿毒血癥組,同時期住院的未進展為尿膿毒血癥的輸尿管結石患者288例納入非尿膿毒血癥組。尿膿毒血癥組男9例,女20例,中位年齡52(41,64)歲。非尿膿毒血癥組男161例,女127例,中位年齡51(41,66)歲。
1.3 納入及排除標準 納入標準:(1)經泌尿系彩超或尿路平片(KUB)或排泄性尿路造影(IVU)或非增強CT(NCCT)檢查確診為輸尿管結石。(2)序貫相關器官衰竭評分(SOFA)快速增加,累計≥2分[7]。(3)患者本人及家屬同意并簽署知情同意書。排除標準:(1)雙側輸尿管結石患者(尿膿毒血癥組如出現雙側輸尿管結石,根據臨床癥狀及影像學資料判斷患側,病例不剔除)。(2)輸尿管結石體積小,未導致上尿路梗阻,無明顯腎積水者。(3)免疫缺陷或人類免疫缺陷病毒(HIV)抗體陽性者。(4)存在嚴重肝腎疾病、心血管疾病、血液病或惡性腫瘤者。(5)實驗室檢查或影像學資料缺失者。本研究經醫院倫理委員會審核批準,納入對象個人標識符被完全刪除,數據分析完全匿名。
1.4 一般臨床資料收集 根據預測模型的獨立危險因素,收集患者性別、腎積液平均CT值、功能性孤立腎、尿WBC及尿亞硝酸鹽的相關臨床數據。患者腎積水平均CT值由我院影像存檔和傳輸系統(PACS)顯示并檢測獲得,對于不規則形腎積液取其中最大環形范圍內HU值作為腎積液平均CT值。功能性孤立腎定義為:(1)單側腎切除病史或先天性腎缺如。(2)腹部CT顯示腎實質菲薄,且放射性核素顯像證實單側腎排泌功能重度受損。
1.5 模型驗證 通常考察和評估預測模型兩個維度,即區分度和校準度。區分度是指預測模型區分輸尿管結石患者進展為尿膿毒血癥和未進展為尿膿毒血癥的能力。利用受試者工作特征(ROC)曲線下面積(AUC)對預測模型區分度進行量化。預測模型的校準度是指輸尿管結石患者進展為尿膿毒血癥的預測概率和實際觀測概率之間的一致性。預測模型的校準能力的考察采用GiViTI校準曲線帶。
1.6 統計學方法 采用SPSS 20.0進行數據處理。計數資料以例(%)表示,組間比較采用χ2檢驗。用MedCalc 軟件繪制ROC 曲線,RMS 和GiViTI 軟件包繪制GiViTI 校準曲線帶。P<0.05為差異有統計學意義。
2.1 2組患者臨床資料比較 與非尿膿毒血癥組相比,尿膿毒血癥組患者女性比例偏高、腎積水平均CT 值升高、尿WBC 及尿亞硝酸鹽陽性比例升高(P<0.05),2組功能性孤立腎比例差異無統計學意義(P>0.05)。見表1。
2.2 預測模型的外部驗證 預測模型外部驗證人群的AUC=0.874(95%CI:0.804~0.945,P<0.001),預測模型區分度良好,見圖1。預測模型外部驗證人群GiViTI 校準曲線帶的95%CI區域均未穿過45°對角平分線(P=0.176),測模型的預測概率與實際觀測概率接近,具有較強的一致性,見圖2。
尿膿毒血癥是指由尿路感染所引起的膿毒血癥,約占所有膿毒血癥病例的9%~31%[3]。近十年來,國內外關于尿膿毒血癥的研究逐年增加,泌尿外科醫生對該病的認識得到極大提高,病死率逐年降低,但是發病率仍逐年增加。一項多中心監測數據顯示,泌尿外科救治的尿路感染患者中,尿膿毒血癥患病率高達12%[8]。經筆者所在科室統計,在尿膿毒血癥的諸多病因中,輸尿管結石占比高達91.3%,是尿膿毒血癥最為常見的致病原因,與國外文獻報道一致[3]。這也是筆者建立預測模型的初衷,即精確預測輸尿管結石進展為尿膿毒血癥的風險概率,從而提高此類高危患者的早期識別和篩選能力。

Tab.1 Comparison of the clinical data of patients with ureteral calculi between two groups表1 2組輸尿管結石患者的臨床資料比較例(%)

Fig.1 ROC curve and AUC for validating the discrimination power of the prediction model in validation group圖1 預測模型外部驗證人群ROC曲線及AUC

Fig.2 GiViTI calibration belt for validating the calibration power of the prediction model in validation group圖2 預測模型外部驗證人群GiVITI校準曲線帶
通常情況下,通過數據擬合而新建立的預測模型會盡可能多地揭示患者臨床資料所包含的信息,導致模型擬合度高于臨床數據和描述符合的變化性,從而導致模型的過度擬合。在這種情況下,如果轉至另一個模型應用場景,更換一批新的臨床數據后,模型預測準確性則明顯降低[9]。因此對構建預測模型準確性的評估,更強調外部驗證的規范和準確[10]。本課題組前期建立的輸尿管結石進展為尿膿毒血癥的預測模型,經內部驗證顯示預測模型顯示良好的區分度和校準度[5]。但為避免預測模型在建模數據中出現過度擬合,筆者在預測模型建立之后,前瞻性收集輸尿管結石進展為尿膿毒血癥患者的臨床資料,利用其對預測模型進行外部驗證。
預測模型的區分度是指在模型的預測值中,是否能夠找到一個截點,使得把陽性結局患者和非陽性結局患者正確區分開來。如果越容易區分開,且與實際情況越符合,則提示該模型的區分度越高。區分度通常采用計算受試者ROC 曲線的AUC 評估[11-12]。本預測模型外部驗證ROC 曲線的AUC=0.874,較模型建模人群內部驗證的AUC(0.913)僅下降0.039[5],說明預測模型從輸尿管結石患者中識別尿膿毒血癥患者的能力強,提示預測模型區分度良好。
預測模型的校準度是指模型陽性結局概率預測值和實際陽性結局概率觀測值是否相一致。如果模型的預測值與實際發生概率越接近,則提示模型的校準度就越好。模型校準能力的考察通常采用Hosmer-Lemeshow 擬合優度檢驗。但Hosmer-Lemeshow 擬合優度檢驗的準確性很大程度上依賴于臨床樣本量。樣本量越大,檢驗結果則越準確,而對于尿膿毒血癥此類稀有結局事件的檢驗則存在一定局限性。另外Hosmer-Lemeshow擬合優度檢驗原理是將患者樣本數據根據預測概率分為10組,進而計算每組中因變量觀測概率和期望概率,實際上并未不考慮單個患者樣本的具體特性[13]。此外,根據檢驗結果繪制出的經典校準曲線實際上是相互獨立的10 個點的連線,并不是真正意義上的平滑曲線[14]。為克服Hosmer-Lemeshow擬合優度檢驗以上諸多局限性,筆者使用GiViTI 校準曲線帶來進行校準度的可視化呈現[15]。
GiViTI 校準曲線帶是通過擬合多項式Logistic回歸函數來揭示模型預測概率和實際觀測概率之間的關系,并計算校準帶圖中80%CI(淺灰色區)和95%CI(暗灰色區)。當95%CI區域不穿過45°對角平分線時,提示預測模型擬合度好[16]。正常情況下只有極少數患者處于特定風險區間,因此更寬的置信區間被認為是更高的不確定性。如GiViTI校準曲線帶圖的P<0.05 說明預測模型的擬合度不夠完美,P值過大則表明預測模型擬合不佳,缺乏有力證據。本預測模型外部驗證人群GiViTI校準曲線帶的95%CI區域未穿過45°對角平分線(P=0.176),說明預測模型預測尿膿毒血癥發生概率與實際觀測概率接近,校準度良好。
本研究亦有不足之處:(1)本研究為回顧性病例對照研究,因此無法避免選擇偏倚。(2)驗證預測模型的數據雖然獨立于建模數據,但數據仍來自于同一醫療中心,亦存在病例選擇偏倚。在后續的研究工作中,本課題組計劃與其他中心進行合作,利用其臨床數據資料對預測模型進行更加廣泛、更加深入的外部驗證。