毛鈐鑲, 承垠林, 賴聰, 湯壯, 許可慰, 周毅
(1.中山大學生物醫學工程學院,廣州 510006;2.中山大學孫逸仙紀念醫院,廣州 510030;3. 中山大學中山醫學院醫學信息教研室,廣州 510080)
泌尿系結石是泌尿外科常見病之一,具有發病率高、復發率高等特點。加拿大、瑞典、美國等國家的泌尿系結石發病率在5%~10%[1],而我國的泌尿系結石發病率也在1%~5%[2]。約1/17的中國成年人患有腎結石,其中男性發病率為6.5%,女性發病率為5.1%[3]。大量研究表明,世界各地的泌尿系結石發病率和流行率還在不斷上升[4]。泌尿系結石的患者中大部分是腎結石,治療腎結石的方法有很多,經皮腎鏡碎石取石術(PCNL)因其安全可視、取石徹底、創口微小及治療快捷,常用于直徑在2 cm以上的腎結石[5],但由于結石患者的情況復雜,個體差異較大,術后仍然會出現結石殘留的情況。
在現代醫學決策中,有效的預測工具有助于患者的術前規劃與準備。臨床上關于結石預測評估的研究主要圍繞各種腎結石評分系統展開,包括Guy′s評分、S.T.O.N.E.評分、S-ReSC評分、CROES列線圖、SHA.LIN協和評分等[6-10],這些模型均有一定的預測效能[11-12]。而影響結石殘留的因素較多,作用方式復雜且臨床數據易存在缺失值,因此,在臨床應用中存在較大局限性。目前尚無一個受到廣泛認可、性能相當的評分體系或預測模型可以對PCNL術后的清石率進行預測評估。
機器學習是以計算機輔助的數據挖掘技術為核心建立的人工智能預測方法,預測結果較為穩定,在醫學領域已有廣泛應用[13-15]。特別是隨機森林(RF)算法,在疾病風險預測、預后評估及臨床決策中發揮著重要作用,已有相關研究體現其良好的性能[16-17]。目前相關研究非常有限,主要有Aminsharifi等[18-20]運用人工神經網絡、支持向量機(SVM)等方法預測PCNL術后結石清除情況,樣本量較少,且由于種族、地域等不同,該研究結果是否適用于其他國家和地區還有待驗證。張鵬等[21]用人工神經網絡預測體外沖擊波碎石治療腎結石的成功率,朱學華等[22]將機器學習算法應用于腎結石輸尿管軟鏡碎石術后早期結石清除率的預測,模型準確性良好。因此,基于機器學習的PCNL術后結石殘留情況預測,對于提升臨床治療水平有著十分積極的意義。
本研究對近些年在中山大學孫逸仙紀念醫院治療的腎結石病例進行回顧性分析,全面收集可能影響PCNL術后結石清除率的指標,用RF、XGBoost 和SVM算法等算法構建PCNL術后結石清除預測模型,檢驗模型預測價值,嘗試找到適用于臨床普及的方法。
本研究數據來自中山大學孫逸仙紀念醫院泌尿外科2014年1月至2018年12月收治的行PCNL的腎結石患者,收集整理以下資料:
(1)一般情況包括:年齡、性別、身體質量指數(body mass index, BMI)。
(2)術前情況包括:既往同側手術史、抗凝藥服用史、高血壓病史、糖尿病史、高尿酸血癥史、術前血白細胞(white blood cell,WBC)、血紅蛋白(hemoglobin, Hb)、血小板(blood platelet,PLT)、術前尿白細胞(urine white blood cell count,UWBC)、尿紅細胞(urinary red blood cell,URBC)、術前血清肌酐(creatinine,CREA)、術前尿培養結果。
(3)結石和腎臟特征:結石位置類型(腎盂、腎上盞、腎中盞、腎下盞、鹿角形腎結石)、是否存在輸尿管狹窄、結石負荷、結石數量、腎積水程度、結石CT值、經皮腎通道長度,Guy′s結石評分,S.T.O.N.E.評分,S-ReSC評分。
(4)手術情況包括:美國麻醉醫師協會(American Standards Association,ASA)手術危險性分級、手術時間。
(5)術后情況:住院時間、是否結石殘留。
相關數據收集及測量方法說明如下:
(1)身體質量指數(BMI):身體質量指數=體重/身高2(Kg/m2)。
(2)結石負荷:結石負荷=長徑×短徑×0.78(mm)。
(3)結石CT值:取結石CT掃描最大層面測量結石核心位置及邊緣四點位置的CT值,取平均值則定義為結石CT值。(見圖1)

圖1 結石CT值測量方法
(4)腎積水程度:①沒有或輕度腎積水:腎集合系統分離0~3 cm;②中重度腎積水:腎盂腎盞較明顯擴張,實質變薄,腎集合系統分離>3 cm。(見圖2)

圖2 腎積水程度測量方法
(5)經皮腎通道長度:在CT橫截面上,測量0°、45°、90°結石中心到皮膚的距離然后取三者平均值。(見圖3)

圖3 經皮腎通道長度測量方法
(6)Guy′s評分方法見表1,將所有患者清除風險分成4等級。

表1 Guy′s評分系統
(7)S.T.O.N.E.評分方法見表2,將所有患者清除風險評為5~13分。

表2 S.T.O.N.E.評分系統
(8)S-ReSC評分方法見表3,將所有患者結石清除風險評為1~9分。

表3 S-ReSC評分系統
(9)是否結石殘留: 術后一個月隨訪已行PCNL手術的患者,依據復查的KUB、泌尿系CT或泌尿系B超檢查未發現殘留結石或殘留結石直徑≤4 mm且無臨床癥狀定義為無結石殘留。
對數據進行預處理,利用統計學方法進行變量相關性檢驗,進行初步的特征選擇。采用RF、XGBoost和SVM等機器學習算法分別對數據進行訓練,通過準確率、特異性、靈敏度、AUC等指標評價各PCNL術后結石殘留預測模型性能。
2.2.1數據預處理 首先應用Excel軟件建立結石患者數據表,錄入患者基本信息以及術前各項檢查檢驗指標。對數據進行預處理,根據臨床標準對數據進行整理,并剔除有較多缺失值、異常值或者重復出現的數據,具體數據說明見表4,最終有788例納入研究。再采用 SPSS2 6.0軟件對數據進行統計學分析,對變量進行相關性檢驗,P<0.05 為差異有統計學意義,由此來進行初步的特征選擇,基于篩選得到的特征應用機器學習算法構建預測模型。

表4 數據集屬性說明
2.2.2機器學習模型 RF是一種集成算法,比大多數單個算法的準確性高、魯棒性好,具有一定的抗噪聲能力。XGBoost也是一種集成算法,其核心思想是根據基學習器的表現對訓練樣本分布進行調整,直至基學習器數目達到指定值,最終將這些基學習器加權結合。基于XGBoost算法構建預測體外沖擊波碎石術(ESWL)治療后尿路結石患者的結石排出率,預測效能好[23]。SVM是經典的機器學習算法,在小樣本數據集的情況下有廣泛應用[24]。本研究使用 Python 3.8 從 sklearn庫中導入各種算法建立模型,訓練測試數據以8:2劃分,主要調節參數包括RF基分類器數目n_etimators為25,SVM選用高斯核函數(kenel為rbf),其他參數采用默認值。
為了評價模型的性能,采用TP、FP、TN和FN分別表示真陽性、假陽性、真陰性和假陰性,可以計算出準確率(Accuracy)、精度值(Precision)、召回率(Recall)和F值(F-Measure),具體如下:
(1)
(2)
(3)
(4)
除上述評價標準外,我們還使用受試者工作特征(ROC)曲線和曲線下面積(AUC)來評價分類器的優劣。ROC曲線表示真陽性率(TPR)和假陽性率(FPR)之間的權衡,其中TPR和FPR的定義如下:
(5)
(6)
ROC曲線越接近圖的左上角,模型越好。AUC是曲線下的面積,面積越接近1模型效果越好。
2.4.1變量相關性檢驗 分類型變量和連續型變量檢驗的結果見表5,由統計學方法初步篩選出既往同側手術史、術前CREA、術前尿培養、腎中盞結石、鹿角形腎結石、輸尿管狹窄、結石負荷、結石數量、腎積水程度、結石CT值、經皮腎通道長度、ASA分級(ASA)12個與結果相關的變量,基于這些變量構建預測模型。

表5 變量相關性檢驗的結果

表5 變量相關性檢驗的結果(續)
2.4.2機器學習模型 各種機器學習模型的效果見表6,其中RF模型的效果最好。

表6 機器學習模型效果評價
繪制ROC曲線,見圖4,求得曲線下面積(AUC)RF模型為0.838,XGBoost模型為0.818,而SVM模型為0.839。

圖4 機器學習模型的ROC曲線
RF和XGBoost變量重要性得分占比見圖5,其中RF影響因素排序從大到小依次為結石負荷、結石數量、鹿角形腎結石、術前CREA、腎積水程度、結石CT值、術前尿培養結果、ASA、既往同側手術史、經皮腎通道長度、腎中盞結石、輸尿管狹窄。XGBoost影響因素主要性分析排序從大到小為結石負荷、結石數量、結石CT值、腎積水程度、術前CREA、術前尿培養結果、既往同側手術史、ASA、經皮腎通道長度、腎中盞結石、鹿角形腎結石、輸尿管狹窄。

圖5 變量重要性得分占比
2.4.3機器學習預測模型與Guy′s、S.T.O.N.E.、S-ReSC的比較 國內外的一些研究顯示Guy′s評分系統、S.T.O.N.E.評分系統等對術后結石清除率的評估均有一定的效能[25-27]。對納入構建機器學習預測模型的患者進行Guy′s評分、S.T.O.N.E.評分以及S-ReSC評分,對比預測效能差異。見圖6,結果顯示Guy′s評分的AUC為0.725,S.T.O.N.E.評分的AUC為0.737,S-ReSC評分的AUC為0.763。機器學習(RF、SVM、XGBoost)預測模型的AUC均高于結石評分系統(Guy′s評分、S.T.O.N.E.評分、S-ReSC評分)。

圖6 各預測模型的ROC曲線對比
在我國腎結石患者基數大,需行手術治療的患者數量多,然而目前臨床上還未廣泛使用性能相當的術后結石殘留及并發癥預測的評分體系或預測模型。相比于傳統基于Logistic 回歸模型分析建立評分系統的方法,本研究基于RF、XGBoost和SVM等機器學習方法構建了PCNL術后結石殘留預測模型,具有較好的預測能力。
RF和XGBoost模型進行分類的同時,可以得到各個變量的重要性,由此推測結石殘留的重要影響因素。結果表明,結石負荷、結石數量、結石CT值、腎積水程度、術前CREA等指標在兩種模型的決策中作用較大。有研究顯示,是否為鹿角形結石和結石負荷是影響PCNL結石清除的獨立危險因素,結石數量是預測PCNL術后結石殘留的重要預測因子[28]。術前CREA可影響術后碎石的排出,進而影響PCNL手術的結石清除。腎積水程度、結石CT值和經皮腎通道長度是否可影響PCNL術后結石清除仍存在爭議[29-30],未來需要更多的研究以確定這些指標是否影響PCNL術后結石清除。
綜上,本研究基于機器學習算法建立的模型可于術前預測腎結石患者PCNL術后結石殘留情況,并為臨床決策及預后評估提供參考,但模型的可靠性還需要多中心的外部資料進行驗證,并在推廣過程中不斷優化和提高其預測性能。