基金項目 新疆維吾爾自治區自然科學基金資助項目,編號:2022D01C299
作者簡介 李志宏,護士,碩士研究生在讀
通訊作者 蔡迎彬,E?mail:42912844@qq.com
引用信息 李志宏,蔡迎彬,王巖,等.基于機器學習算法預測早期結直腸腺癌病人內鏡治療后的癌癥特異性生存狀態[J].護理研究,2024,38(14):2459?2467.
Prediction of cancer?specific survival status of patients with early colorectal adenocarcinoma after endoscopic therapy based on machine learning algorithms
LI Zhihong, CAI Yingbin, WANG Yan, FAN Hua, Yiliminuer Ahemai, LI Zimei
School of Nursing, Xinjiang Medical University, Xinjiang 830011 China
Corresponding Author" CAI Yingbin, E?mail: 42912844@qq.com
Abstract" Objective:To construct a cancer?specific survival status prediction model for patients with early colorectal adenocarcinomanbsp; after endoscopic treatment used machine learning algorithms.Methods:Based on SEER database,the data of 1 786 patients with early colorectal adenocarcinoma after endoscopic treatment were obtained,and the information" included" age,sex,race,cancer" primary" site,degree of cancer cell differentiation,pathological type of cancer tissue,radiotherapy,chemotherapy,tumor size,pathological condition,and marital status were extracted.After univariate Logistic regression and multivariate Logistic regression analysis,independent influencing factors of survival prognosis of patients with early colorectal adenocarcinoma after endoscopic treatment were determined.The patients were divided into training set and test set at a ratio of 8∶2.the factors with statistical differences in regression analysis were" substituted" into Logistic regression,random forest,extreme gradient boosting,support vector machine,decision tree,gradient boosting decision tree which were constructed by machine learning algorithm.To interpret results based on optimal" machine" learning" models.Results:The" results of multivariate Logistic regression showed that age,cancer primary site,degree of cancer cell differentiation,tumor size,pathological condition,and marital status were independent influencing factors of survival prognosis of patients with early colorectal adenocarcinoma after endoscopic treatment(Plt;0.05).The area under the curve of receiver operator characteristic of random forest in the training set and test set were 0.876 and 0.858,respectively.And the F1 score were 0.791 and 0.739,respectively.The interpretability analysis of the model based on random forest showed that age,marital status and tumor size were more important,while higher age,larger tumor diameter,poor differentiation,and existence of submucosal infiltration were risk factors for death,and married were protective factors.Patients with the primary site of cancer in the right colon had poorer survival compared to those with the primary site of cancer in the left colon.Conclusions:The prognostic model constructed by machine learning for patients with colorectal cancer has good performance.It can provide accurate individualized prediction.
Keywords""" machine learning; early colorectal cancer;" adenocarcinoma;" endoscopic" therapy;" survival state;" predictive models;" influencing factor; nursing
摘要" 目的:基于機器學習算法構建早期結直腸腺癌病人經內鏡治療后的癌癥特異性生存狀態預測模型。方法:基于流行病學和最終結果數據庫獲取1 786例經內鏡治療后的早期結直腸腺癌病人資料,提取病人年齡、性別、種族、癌癥原發部位、癌細胞分化程度、癌癥組織病理學類型、放療情況、化療情況、腫瘤大小、病理情況、婚姻狀況信息。經單因素Logistic回歸與多因素Logistic回歸分析確定早期結直腸腺癌病人內鏡治療后生存預后的獨立影響因素。以8∶2的比例將病人分為訓練集與測試集,將回歸分析中有統計學意義的因素代入以機器學習算法構建的邏輯回歸、隨機森林、極限梯度提升、支持向量機、決策樹、梯度提升決策樹,基于最優機器學習模型對結果進行解釋。結果:多因素Logistic回歸結果顯示,年齡、癌癥原發部位、癌細胞分化程度、腫瘤大小、病理情況、婚姻狀態是早期結直腸腺癌病人內鏡治療后生存預后的獨立影響因素(Plt;0.05),隨機森林在訓練集與測試集中的受試者工作特征曲線下面積(AUC)分別為0.876和0.858,F1分數分別為0.791和0.739,基于隨機森林的模型可解釋性分析結果表明,年齡、婚姻狀態、腫瘤大小重要性較高,年齡較高、腫瘤直徑較大、分化程度較差及存在黏膜下浸潤為死亡的危險因素,已婚為保護因素,癌癥原發部位為右半結腸的病人相較于左半結腸病人生存狀態較差。結論:機器學習構建的結直腸癌病人預后模型性能較好,可提供精準的個體化預測。
關鍵詞" 機器學習;早期結直腸癌;腺癌;內鏡治療;生存狀態;預測模型;影響因素;護理
doi:10.12102/j.issn.1009-6493.2024.14.003
結直腸癌是一種具有多種危險因素、高度異質性的原發性上皮惡性腫瘤。國際癌癥機構統計數據顯示,結直腸癌發病率位居癌癥發病率第3位,是癌癥相關性死亡的第二大原因[1]。我國結直腸癌疾病負擔較重[2]。早期發現癌前病變并給予針對性干預和治療對于降低結直腸癌發病率及死亡率至關重要。早期結直腸癌是指病變局限于黏膜或黏膜下層,無論其有無淋巴結轉移。腺癌為結直腸癌的常見類型,由息肉發展至腺瘤最終演變為腺癌[3]。近年來,隨著內鏡技術的不斷發展,內鏡下黏膜切除術(EMR)、內鏡下黏膜剝離術(ESD)等內鏡微創技術逐漸成熟,對于癌前病變及癌細胞局限于黏膜內或黏膜下層的結腸癌,可采取內鏡下治療作為首選方式[4]。但內鏡治療也可能存在漏診或病灶切除不完整的問題,殘留局部具有復發病變的風險[5],且受浸潤深度、腫瘤大小等因素影響,癌癥病人術后如發生淋巴結轉移或周圍組織浸潤,則需要追加手術或其他對癥治療,增加了過度治療風險,影響病人生存狀態。因此,精準預測早期結直腸腺癌的治療預后對于提高病人術后生存狀態具有重要意義。機器學習(machine learning,ML)作為計算機科學方法,是指機器從一組數據中識別和學習的能力[6]。機器學習可以依托大數據,從廣泛數據中篩選出關鍵因素,挖掘數據潛在的規律并預測未來趨勢做出決策[7]。目前機器學習已廣泛應用于腫瘤診斷、治療、預后等方面[8],部分學者探索并建立了新型、實用、具有前瞻性的機器學習理論及算法,通過整合臨床數據,旨在更加契合臨床,推動醫學信息化、現代化的發展[9?10]。機器學習算法主要包括監督學習和無監督學習,二者的區別在于是否給定已知的標簽類別[11],監督學習廣泛應用于臨床疾病風險預測模型,其常見算法包括決策樹(decision tree,DT)、邏輯回歸(Logistic regression,LR)、支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)等。流行病學和最終結果(Surveillance,Epidemiology,and End Results,SEER)數據庫是美國的大型公共癌癥數據平臺,收錄了大量癌癥病人的臨床信息。本研究通過SEER數據庫獲取病人信息,從而建立機器學習算法模型,以預測早期結直腸腺癌病人接受內鏡治療后的癌癥特異性生存狀態,為臨床決策提供有效的評估工具,制訂有效的治療策略。
1" 資料與方法
1.1 數據來源
在SEER*Stat軟件中調用SEER Research Data 17 Registries,Nov2022 Sub(2000-2020)版本,該版本于2023年4月發布,病人癌癥信息源自美國癌癥研究所(National Cancer Institute,NCI)及癌癥控制和人口科學部(Division of Cancer Control and Population Sciences,DCCPS)截至2022年11月統計的相關數據。在字段Primary Site?Labeled中選取“C18.0?C19.9,C20.9”作為原發部位,選取RX Summ?Surg Prim Site (1998+)字段“A20、A22、A26、A27、A28”作為內鏡下治療,采用第7版美國癌癥聯合委員會(American Joint Committee on Cancer,AJCC)TNM分期。納入標準:1)經組織病理學診斷確診為結直腸癌;2)選擇T1N0M0或原位癌病人;3)結直腸癌為最先診斷的原發腫瘤,排除其他癌癥干擾;4)生存狀態為存活或由于結腸、直腸(包括直乙交界)癌癥導致死亡的病人。排除標準:1)其他組織學類型,如神經內分泌瘤、胃腸道間質瘤等;2)病人臨床信息(如分化程度、腫瘤大小、病理情況等)存在未知或空白情況;3)未隨訪或隨訪時間及生存時間信息缺失。
1.2 數據分類
在SEER數據庫中選擇年齡、性別、種族、癌癥原發部位、癌細胞分化程度、癌癥組織病理學類型、放療情況、化療情況、腫瘤大小、病理情況、婚姻狀況11個變量。年齡增長對于結直腸癌的進展至關重要,≥60歲的老年病人發病率較高且癌前病變特征與lt;60歲的人群相比具有顯著差異[12?13],故將納入的病人分為兩個年齡組(lt;60歲,≥60歲);按照腫瘤大小常用分類節點[14]將腫瘤大小分為3組(直徑lt;2 cm、直徑2~5 cm、直徑gt;5 cm)。將所有數據中低頻變量合并,降低數據噪聲。
1.3 模型建立
機器學習建模與評估均使用Python(3.11.1),采用pandas庫進行數據預處理,機器學習算法采用scikit?learn進行模型訓練和測試,將數據以8∶2的比例分為訓練集與測試集,使用十折交叉驗證方法測試模型性能并防止過擬合,單因素及多因素Logistic回歸篩選機器學習模型的候選變量,采用6個機器學習算法[邏輯回歸、支持向量機、隨機森林、極限梯度提升(extreme gradient boosting,XGBoost)、決策樹、梯度提升決策樹(gradient boosting decision tree,GBDT)]建立模型。采用準確率、精確率、召回率、F1分數、受試者工作特征(ROC)曲線下面積(AUC)評估模型,AUC取值范圍為0.0~1.0,越接近于1.0表示模型判別能力越強,近似于0.5表明趨于隨機猜測,模型無應用價值。基于SEER數據庫的病人生存狀態存在不平衡,采用SMOTE過采樣算法進行數據增強。采用SHAP包對模型進行進一步可解釋性分析。
1.4 統計學方法
采用SEER*Stat(8.4.1版本)獲取內部建模病人,采用R 4.2.2進行基本數據分析,定性資料以頻數及百分比(%)表示,采用χ2檢驗進行組間比較,將單因素Logistic回歸篩選出的變量納入多因素Logistic回歸,并計算其比值比(odds ratio,OR)及95%置信區間(CI),以Plt;0.05為差異有統計學意義。
2" 結果
2.1 病人一般資料
從SEER數據庫中納入1 786例病人,將1 424例病人作為訓練集,362例病人作為測試集。病人篩選""""""""" 流程見圖1,病人一般資料見表1。
結直腸癌為第一原發腫瘤、經組織學確診為陽性(n=8 637)
2.2 訓練集早期結直腸腺癌病人內鏡治療后生存預后的影響因素
單因素Logistic分析結果顯示,年齡、癌癥原發部位、癌細胞分化程度、癌癥組織病理學類型、放療情況、化療情況、腫瘤大小、病理情況、婚姻狀態與生存預后相關(Plt;0.05)。將單因素Logistic分析中有統計學意義的因素納入多因素Logistic回歸,結果顯示,年齡≥60歲、癌癥原發部位為右半結腸與直腸、癌細胞分化程度為低分化及未分化、腫瘤直徑≥2 cm、存在黏膜下浸潤是早期結直腸腺癌病人內鏡治療后生存預后較差的獨立危險因素(Plt;0.05),已婚是早期結直腸腺癌病人內鏡治療后生存預后較差的獨立保護因素(Plt;0.05)。自變量賦值方式見表2,內鏡治療后早期結直腸腺癌生存預后影響因素分析結果見表3。
2.3 10折交叉驗證結果及建模參數
通過設置樣本比例劃分訓練集、測試集,將數據集隨機分配,可能造成過度擬合的偶然性,故應用10折交叉驗證評估模型性能,有利于保證最終模型評估結果的客觀性、驗證方法的有效性。表4結果顯示,模型預期效果較好,隨機森林的整體測試性能均優于其他模型,建立模型使用的參數見表5。
2.4 模型的建立與評估
鑒于癌癥組織病理學類型與結局事件具有效應關系,將年齡、癌癥原發部位、癌細胞分化程度、癌癥組織病理學類型、腫瘤大小、病理情況、婚姻狀態7個特征變量代入機器學習模型,結果顯示,隨機森林模型的AUC高于其他模型,其在訓練集與測試集中的AUC分別為0.876和0.858;梯度提升決策樹的AUC僅低于隨機森林,其在訓練集與測試集中的AUC分別為0.786和0.764。F1分數為精確率與召回率的調和平均數,隨機森林在訓練集與測試集中的F1分數分別為0.791和0.739,表明該模型穩健性較好。隨機森林、決策數精確率均較高,表明模型識別能力較強。極限梯度提升的召回率高于其他模型,其在訓練集與測試集中的召回率均為0.845,表明該模型具有較好的預測陽性標簽效果。隨機森林、極限梯度提升、梯度提升決策數的綜合性能均優于Logistic回歸。6種模型在訓練集的預測性能見表6,6種模型在測試集的預測性能見表7,6種模型在訓練集中的ROC曲線見圖2,6種模型在測試集中的ROC曲線見圖3。
2.5 模型的可解釋性
基于隨機森林特征對不同因素的SHAP值進行排序,結果表明,年齡、婚姻狀態、腫瘤大小對結直腸腺癌病人接受內鏡治療后癌癥特性生存狀態至關重要,且對于模型的影響輸出結果較大,見圖4。年齡較高、腫瘤直徑較大、癌細胞分化程度較差及黏膜下浸潤對模型的貢獻具有正向影響,造成病人死亡的風險較高,而已婚對于模型具有負向影響,為早期結直腸腺癌病人內鏡治療后生存預后的保護因素,發病部位為右半結腸的病人相較于左半結腸的病人死亡風險較高,此外,癌癥組織病理學類型顏色分布規律不規則,表明各腺瘤性息肉亞型均會增加結直腸罹患腺癌的風險,而SHAP值較高的絨毛狀腺瘤相較于管狀絨毛狀腺瘤死亡風險更高,見圖5。交互式SHAP圖為隨機提取數據中單個病人的可視化結果,紅色數值代表死亡風險貢獻,藍色數值代表生存貢獻,箭頭向左表示SHAP值減少,箭頭向右表示SHAP值增加,箭頭越長表示對結果的貢獻越大。生存病人的交互式SHAP圖顯示,年齡lt;60歲、已婚、腫瘤直徑lt;2 cm為病人生存的保護因素,病人的最終SHAP值為0.01,見圖6。死亡病人的交互式SHAP圖顯示,年齡≥60歲、未婚、存在黏膜下浸潤是病人死亡的促進因素,病人的最終SHAP值為0.17,見圖7。
3" 討論
本研究影響因素分析結果表明,年齡≥60歲、癌癥原發部位為右半結腸與直腸、癌細胞分化程度為低分化及未分化、腫瘤直徑≥2 cm、存在黏膜下浸潤是早期結直腸腺癌病人內鏡治療后生存預后較差的獨立危險因素(Plt;0.05),已婚是早期結直腸腺癌病人內鏡治療后生存預后較差的獨立保護因素(Plt;0.05)。隨著窄帶成像技術(NBI)結合放大內鏡等內鏡增強技術的應用,醫務人員可清晰、直觀地觀察到黏膜表面微血管形態,確定病灶程度及范圍,鏡下診斷及術后病理檢驗對病人預后具有重要意義[15]。但對于分化較差的腺癌及印戒細胞癌不建議行內鏡下黏膜切除術,原因為切緣陽性可能導致病灶復發或發生遠處轉移。研究表明,癌細胞分化程度較低會增加早期結直腸癌淋巴結轉移風險[16]。病灶是否徹底性切除、術中抬舉征是否為陽性均可能提示病變是否侵犯黏膜下層[17]。若術后切緣陽性,需追加內鏡治療手術或外科手術,明確病人的癌細胞分化程度、浸潤深度、腫瘤大小以及有無淋巴結轉移等危險因素,以減少內鏡治療術帶來的負面效應,防止出現非治愈性切除(切緣腫瘤殘余)。腺瘤晚期是指gt;1 cm或伴有管狀、絨毛狀組織學特征的常規腺瘤[18]。Song等[19]研究結果顯示,各息肉亞型病人患結直腸腺癌的風險均較高,且患有管狀腺瘤與絨毛狀腺瘤的病人死亡率較高。Myers等[20]指出,絨毛特征更強烈的腺瘤與高級別異型增生及癌變有關,與本研究SHAP可解釋性分析結果一致。本研究發現,結直腸癌發病的解剖位置對病人內鏡治療后的生存預后具有影響,右半結腸血供豐富,利于腫瘤生長,且更易出現腸梗阻等現象,進而導致臨床特征及癌癥轉歸與左半結腸有所不同。已有研究顯示,與原發腫瘤位置為右半結腸癌病人相比,左半結直腸癌病人生存率較高[21],右半結腸癌作為獨特的癌癥組織學亞型,預后較差。隨機森林重要性排名及SHAP可視化分析結果顯示,年齡、婚姻狀態、腫瘤大小對結直腸腺癌病人接受內鏡治療后癌癥特性生存狀態至關重要。早期結直腸癌的治療效果可能受年齡影響,不同年齡段病人發病特點及術后生存狀態存在顯著差異。樊啟林等[22]的結直腸癌病人預后分析結果顯示,≥65歲的結直腸癌病人預后較差,隨著年齡增長,術后發生并發癥的風險逐步升高, 這可能與老年人對身體不適的敏感性下降有關。本研究結果還顯示,腫瘤直徑≥2 cm是早期結直腸腺癌病人內鏡治療后生存預后較差的獨立危險因素,與已有研究結果[23]相似。隨機森林重要性分析結果顯示,婚姻狀態對結直腸腺癌病人接受內鏡治療后癌癥特性生存狀態至關重要。已有研究顯示,婚姻狀態與癌癥特異性生存率顯著相關[24],婚姻狀態對個人的生活習慣影響較大,同時也與社會心理狀況有關。已有研究結果顯示,結腸癌病人在接受手術治療后,已婚病人比未婚病人具有更高的術后生存率[25],這可能與婚姻會帶來幸福感與歸屬感,已婚病人生活質量滿意度更高有關。
近年來,機器學習結直腸癌預測模型應用廣泛[26?28],在算法中自動學習的架構有利于更好地解釋癌癥變量,幫助醫務人員進行更加精準的診斷和治療。然而機器學習模型也存在“黑盒”問題[29],解釋性及透明度不佳。醫療決策要求基于循證理念,因此,本研究構建了預測結直腸腺癌病人接受內鏡治療后5年生存狀態的機器學習模型,臨床實踐中需要直觀地了解決策過程,因此模型增加了可解釋性,提供了用于個體化預測的合理依據,有利于使醫生與病人更加清晰地了解危險因素。在機器學習的經典算法中,隨機森林是基于Bagging原理,采用多個決策樹的集成算法思想,通過增強多個弱分類器提升整個模型的性能,因此優于單個決策樹[30],且SHAP交互式算法可以個體化應用,有利于針對病人的特異性表現。本研究比較了6種機器學習模型性能以選擇最優模型,在AUC及F1分數方面,隨機森林表現較優,與傳統的Logistic回歸分析相比,隨機森林能應用隨機化策略降低學習器間的相關性,提高預測準確性,同時基于隨機森林的可解釋性結果可提高實際應用的泛化性。隨著醫學信息技術的進一步發展,基于機器學習的方法能夠拓展結直腸癌更多的預后研究,促進精準醫療及個體化治療的推廣,構建更加精確、實用的臨床預測模型。
4" 局限性
本研究的局限性在于基于SEER數據庫的回顧性信息缺乏內鏡下治療有關的手術過程以及術后并發癥內容,可能存在選擇偏倚;其次,數據庫中亞洲人數據較少,可能對模型的適用性造成影響。在未來應納入更多樣本量以及多中心的外部測試數據以進一步驗證模型可靠性。
5" 小結
年齡、婚姻狀態、腫瘤大小是早期結直腸腺癌病人內鏡治療后生存預后的重要影響因素,對結直腸腺癌病人接受內鏡治療后癌癥特異性生存狀態至關重要,基于隨機森林的機器學習模型預測性能較好,可為后續的臨床決策或術后隨訪提供依據,可視化模型結果方便對個體病人進行動態精準評估。
參考文獻:
[1]" SUNG H,FERLAY J,SIEGEL R L,et al.Global cancer statistics 2020:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J].CA Cancer J Clin,2021,71(3):209-249.
[2]" 李娟娟,張新聞,陳曉云,等.1990和2019年中國與全球結直腸癌疾病負擔和危險因素比較分析[J].中華腫瘤防治雜志,2022,29(18):1317-1322.
LI J J,ZHANG X W,CHEN X Y,et al.Comparative analysis of disease burden and risk factors of colon and rectum cancer between China and the world in 1990 and 2019[J].Chinese Journal of Cancer Prevention and Treatment,2022,29(18):1317-1322.
[3]" LI J X,MA X D,CHAKRAVARTI D,et al.Genetic and biological hallmarks of colorectal cancer[J].Genes Dev,2021,35(11/12):787-820.
[4]" 宋世博,王貴齊.早期結直腸癌及癌前病變的內鏡下治療進展[J].腫瘤研究與臨床,2023,35(3):228-233.
SONG S B,WANG G Q.Progress of endoscopic treatment for early-stage colorectal cancer and precancerous lesions[J].Cancer Research and Clinic,2023,35(3):228-233.
[5]" 趙鑫,竇利州,張月明,等.早期結直腸癌經內鏡非治愈性切除術后癌殘留或淋巴結轉移的風險因素分析[J].中華腫瘤雜志,2023,45(4):335-339.
ZHAO X,DOU L Z,ZHANG Y M,et al.Risk factors for residual cancer or lymph node metastasis after endoscopic noncurable resection of early colorectal cancer[J].Chinese Journal of Oncology,2023,45(4):335-339.
[6]" TING SIM J Z,FONG Q W,HUANG W M,et al.Machine learning in medicine:what clinicians should know[J].Singapore Med J,2023,64(2):91-97.
[7]" 楊劍鋒,喬佩蕊,李永梅,等.機器學習分類問題及算法研究綜述[J].統計與決策,2019,35(6):36-40.
YANG J F,QIAO P R,LI Y M,et al.A review of machine-learning classification and algorithms[J].Statistics amp; Decision,2019,35(6):36-40.
[8]" 譚向龍,趙之明.機器學習在醫學中的應用現狀[J].中華腔鏡外科雜志(電子版),2020,13(1):61-64.
TAN X L,ZHAO Z M.Application of machine learning in medicine[J].Chinese Journal of Laparoscopic Surgery(Electronic Edition),2020,13(1):61-64.
[9]" CHOI R Y,COYNER A S,KALPATHY-CRAMER J,et al.Introduction to machine learning,neural networks,and deep learning[J].Transl Vis Sci Technol,2020,9(2):14.
[10]" 周瑤群,方榮華.人工智能在護理領域的應用現狀及發展前景[J].護理研究,2022,36(6):1053-1057.
ZHOU Y Q,FANG R H.Application status and development prospect of artificial intelligence in nursing field[J].Chinese Nursing Research,2022,36(6):1053-1057.
[11]" GREENER J G,KANDATHIL S M,MOFFAT L,et al.A guide to machine learning for biologists[J].Nat Rev Mol Cell Biol,2022,23(1):40-55.
[12]" 張學云,鄭松柏.老年人結直腸息肉的相關危險因素、內鏡及病理特征[J].老年醫學與保健,2021,27(4):877-880.
ZHANG X Y,ZHENG S B.Related risk factors and features of endoscopic and pathological of colorectal polyps in the elderly[J].Geriatrics amp; Health Care,2021,27(4):877-880.
[13]" SIEGEL R L,WAGLE N S,CERCEK A,et al.Colorectal cancer statistics,2023[J].CA Cancer J Clin,2023,73(3):233-254.
[14]" 童國俊,嚴強,張貴陽,等.腫瘤大小分類對0~Ⅲ期結直腸癌預后的影響[J].浙江醫學,2017,39(19):1664-1666;1734.
TONG G J,YAN Q,ZHANG G Y,et al.Correlation of tumor size classification with TNM classification and prognosis of colorectal cancer[J].Zhejiang Medical Journal,2017,39(19):1664-1666;1734.
[15]" 程慧,卯許有,孫金山.聯動成像技術在下消化道病變內鏡診斷中的研究進展[J].胃腸病學,2021,26(7):433-437.
CHENG H,MAO X Y,SUN J S.Research progress of linked color imaging in endoscopic diagnosis of lower digestive tract diseases[J].Chinese Journal of Gastroenterology,2021,26(7):433-437.
[16]" 李琳,何池義.早期結直腸癌淋巴結轉移的危險因素分析[J].皖南醫學院學報,2023,42(1):36-39.
LI L,HE C Y.Analysis on the risk factors for lymph node metastasis in early colorectal cancer[J].Journal of Wannan Medical College,2023,42(1):36-39.
[17]" 亢倩玉,宋順喆,宮愛霞.結直腸側向發育型腫瘤黏膜下層侵犯的危險因素分析[J].中華消化內鏡雜志,2020,37(12):930-933.
KANG Q Y,SONG S Z,GONG A X.Risk factors of submucosal invasion of laterally developing colorectal tumors[J].Chinese Journal of Digestive Endoscopy,2020,37(12):930-933.
[18]" HE X S,HANG D,WU K N,et al.Long-term risk of colorectal cancer after removal of conventional adenomas and serrated polyps[J].Gastroenterology,2020,158(4):852-861.
[19]" SONG M Y,EMILSSON L,BOZORG S R,et al.Risk of colorectal cancer incidence and mortality after polypectomy:a Swedish record-linkage study[J].Lancet Gastroenterol Hepatol,2020,5(6):537-547.
[20]" MYERS D J,ARORA K,ADENOMA V.Treasure Island[EB/OL].[2023-06-20].https://www.ncbi.nlm.nih.gov/books/NBK470272.
[21]" JANSSENS K,FRANSEN E,VAN CAMP G,et al.A Belgian population-based study reveals subgroups of right-sided colorectal cancer with a better prognosis compared to left-sided cancer[J].Oncologist,2023,28(6):e331-e340.
[22]" 樊啟林,張松,文峰,等.1 474例不同年齡段結直腸癌患者的臨床病理特征及預后分析[J].實用腫瘤雜志,2023,38(2):127-132.
FAN Q L,ZHANG S,WEN F,et al.Clinicopathological features and prognosis of 1 474 colorectal cancer patients of different ages[J].Journal of Practical Oncology,2023,38(2):127-132.
[23]" ALESE O B,ZHOU W,JIANG R J,et al.Predictive and prognostic effects of primary tumor size on colorectal cancer survival[J].Front Oncol,2021,11:728076.
[24]" CHEN Z H,YANG K B,ZHANG Y Z,et al.Assessment of modifiable factors for the association of marital status with cancer-specific survival[J].JAMA Netw Open,2021,4(5):e2111813.
[25]" YANG C C,CHENG L C,LIN Y W,et al.The impact of marital status on survival in patients with surgically treated colon cancer[J].Medicine,2019,98(11):e14856.
[26]" KINAR Y,AKIVA P,CHOMAN E,et al.Performance analysis of a machine learning flagging system used to identify a group of individuals at a high risk for colorectal cancer[J].PLoS One,2017,12(2):e0171759.
[27]" BIRKS J,BANKHEAD C,HOLT T A,et al.Evaluation of a prediction model for colorectal cancer:retrospective analysis of 2.5 million patient records[J].Cancer Med,2017,6(10):2453-2460.
[28]" 周欣毅,丁克峰,李軍.早期結直腸癌的淋巴結轉移風險評估體系的現狀及研究進展[J].中華胃腸外科雜志,2023,26(5):492-498.
ZHOU X Y,DING K F,LI J.Progress in evaluating the risk of lymph node metastasis in early colorectal cancer[J].Chinese Journal of Gastrointestinal Surgery,2023,26(5):492-498.
[29]" 陳珂銳,孟小峰.機器學習的可解釋性[J].計算機研究與發展,2020,57(9):1971-1986.
CHEN K R,MENG X F.Interpretation and understanding in machine learning[J].Journal of Computer Research and Development,2020,57(9):1971-1986.
[30]" ZELNIK-MANOR L,PERONA P.Self-tuning spectral clustering[G]//Proceedings of the 17th International Conference on Neural Information Processing Systems.Vancouver:Annual Conference on Neural Information Processing Systems Fund, Neurlps Fund.2004:1601-1608.
(收稿日期:2023-06-21;修回日期:2024-04-25)
(本文編輯 陳瓊)