999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能線性判別分析算法建立喉癌5年生存狀態預測模型*

2022-03-16 13:00:32李祖飛黃志剛房居高陳曉紅鐘琦李平棟侯麗珍高文張洋
腫瘤預防與治療 2022年2期
關鍵詞:人工智能特征模型

李祖飛,黃志剛,房居高,陳曉紅,鐘琦,李平棟,侯麗珍,高文,張洋

100730 北京,首都醫科大學附屬北京同仁醫院 耳鼻咽喉頭頸外科

喉鱗狀細胞癌(laryngeal squamous cell carcinoma,LSCC)大約占所有新發癌癥病例的0.8%和癌癥死亡病例的0.6%,男性比女性更易發病,發病率男女之比為5∶1,其主要危險因素是煙草,次要因素包括喉咽反流、人乳頭瘤病毒感染、環境或職業暴露以及酒精等,隨著婦女吸煙的增加,婦女喉癌的發病率也隨之增加[1-2]。喉癌的生存率與疾病的初始階段密切相關,早期T1和T2腫瘤的治愈率高達80%~90%,而IV期患者的生存率下降到40%[3]。

近年來,人工智能在腫瘤的診斷、治療及預后方面扮演了重要的角色。通過對患者的人口學資料以及腫瘤的臨床資料,甚至是內鏡圖像、影像學資料、采集到的生理信號等參數進行分析,采用人工智能算法建立模型,可以對腫瘤進行診斷上的輔助,預測腫瘤的預后[4-5]。人工智能算法包括機器學習及深度學習兩大類,其中常用的機器學習算法有:支持向量機(support vector machine,SVM)、決策樹(decision tree,DT)、隨機森林(random forest,RF)、線性判別分析(linear discriminant analysis,LDA)、集成學習(包括AdaBoost,XGBoost等)、K鄰近算法(K-nearest neighbor,KNN)及樸素貝葉斯模型等,不同算法在不同的數據集分別有不同的模型表現[6-7]。人工智能算法應用于頭頸部腫瘤的相關研究已有報道[8-13],如有研究將機器學習方法建立的模型用于指導頭頸腫瘤的輔助治療[8];Smith等[9]通過應用機器學習算法建模,為放療失敗的喉癌患者預測是否值得行挽救性喉切除術,為喉癌的個體化和精準治療提供了數據信息;Zhang 等[10]發現應用深度學習算法建立的模型可以提高術中冰凍病理診斷的準確性,有助于喉癌的外科治療。但是,使用人工智能方法構建預測喉癌患者5年生存率預測模型尚未見報道,我們首次應用人工智能機器學習算法,構建預測喉癌患者5年生存狀態的預測模型,判斷不同年齡、分期,不同治療方法等狀態下喉癌患者5年生存率,為臨床醫生的診治提供參考。

1 資料與方法

1.1 臨床資料

本研究為回顧性分析研究,納入數據均來自北京同仁醫院,共隨訪了確診于2003年7月至2016年3月的147例喉癌患者,隨訪截止時間為2021年3月。納入標準為:1)隨訪時間滿5年(即2016年3月以前于本院就診的喉癌患者);2)年齡18歲以上的成年患者;3)經病理確診證實為喉癌的患者。排除標準為:1)剔除病歷資料不全患者;2)剔除失訪患者;3)排除合并其他腫瘤患者;4)排除在我院就診前已有放化療病史的患者。為保證模型的準確性與可靠性,剔除23例失訪數據,最終納入124例用于預測模型的訓練與測試,其中60%數據為訓練集,另外40%作為測試集,訓練集與測試集的劃分方式為應用基于Python編程語言的sklearn庫里的train_test_split模塊進行隨機分配,隨機種子設置為42。

1.2 特征選擇

將患者的性別(女性賦值0,男性賦值1)、年齡、是否抽煙(不抽煙賦值為0,抽煙賦值1)、是否飲酒(無飲酒史賦值為0,有者賦值1)、TNM分期(T,M,N分為3個特征,其中T分期賦值1、2、3、4,分別代表T1、T2、T3、T4;N為有無淋巴結轉移,有者賦值為1,無者賦值為0;M為是否轉移,無轉移賦值為0,有轉移賦值為1);腫瘤的臨床分期(賦值1、2、3、4分別代表1期、2期、3期與4期)、有無復發(無賦值0,有賦值1),有無放化療(無賦值0,有賦值1)及病理分級(原位癌賦值0,高分化賦值為1,高中分化及中分化賦值為2,中低分化及低分化賦值為3)。上述共計11個臨床參數作為訓練模型的特征。所有特征與5年生存狀態之間的關系采用Spearman相關系數進行相關性分析。此外,我們還對不同特征下喉癌五年生存狀態差異進行分析,采用交叉表卡方檢驗來實現。

1.3 模型建立與評估

機器學習算法主要采用算法,所有參數均設置為默認,除此之外,我們還采用了一些其它常用的機器學習算法進行對比分析,如SVM、RF、DT及KNN等。

采用Python(3.8版本)編程語言實現統計學及模型建立,其中,Spearman相關分析采用基于Python的Pandas庫里的corr模塊進行分析,采用基于Python的seaborn庫和matplotlib庫進行作圖,人工智能機器學習模型建立采用基于Python的sklearn機器學習庫實現。

模型的評估采用以下幾個指標實現:準確率、靈敏度、特異度、曲線下面積(area under the curve,AUC)、F1值和Cohen’s kappa系數。對于模型結果的評估,我們希望最終獲得的結果不能出現某個指標過低的情形,比如,某個算法得出的模型結果,準確率與靈敏度較高,但是特異性極低,那我們將排除此模型作為最終模型的建立。此外,我們還設置了混淆矩陣,以對模型的測試結果進行可視化直觀評估。

1.4 統計學分析

本研究資料滿足使用LDA的條件,納入數據除年齡外,其余數據均為分類變量,在所有分類變量中,除臨床分期、T分期以及病理分級為有序變量資料外,其余皆為無序變量資料。采用SPSS 20.0版本進行統計學分析,不同特征下5年生存狀態差異采用卡方檢驗分析,生存曲線采用Kaplan-Meier法,各變量之間的關系采用Spearman相關分析,P<0.05為差異有統計學意義。

2 結 果

2.1 入組患者人口學資料描述

本研究共納入124例喉癌患者數據,年齡為38~85歲[平均(62.4±11.1)歲],其人口學資料及不同臨床特征下喉癌患者的生存狀態比較見表1,各臨床特征分別作生存曲線圖(圖1)。除年齡與有無放化療史外,其余特征下生存狀態差異均有統計學意義:女性喉癌患者5年生存比率明顯高于男性,預后較佳(χ2=6.323,P=0.012);有抽煙、飲酒史,有淋巴結轉移、遠處轉移者及有復發者,預后較差(均P<0.05);晚期(III~IV期)喉癌患者預后較早期(I~II期)差(χ2=4.336,P=0.047),T1患者預后好于T2~4期患者(χ2=4.237,P=0.042),高、中分化患者預后要好于較低分化者(χ2=26.215,P<0.001)。

表1 入組患者臨床資料表及不同臨床特征下生存狀態比較

圖1 不同臨床特征分組下的生存曲線圖

2.2 特征重要性

特征的重要性以所有納入模型訓練的特征與5年生存狀態之間的相關性分析來判定,見相關性熱圖(圖2),圖中數字為相關系數r,其中正值表示正相關,負值為負相關。可見以下特征與喉癌患者5年生存狀態呈負相關:性別(r=-0.23,P=0.012)、腫瘤的T分期(r=-0.19,P=0.027)、有無淋巴結轉移(r=-0.28,P=0.002)、有無遠處轉移(r=-0.37,P<0.001)、臨床分期(r=-0.27,P=0.004)、病理分級(r=-0.46,P<0.001)、有無復發(r=-0.48,P<0.001)、有無飲酒史(r=-0.2,P=0.028)、有無抽煙史(r=-0.33,P<0.001)。年齡、是否放化療在本研究中與喉癌患者的預后不相關(P=0.182,P=0.603),但是考慮到這些特征均為臨床診治中重要一環,因此我們將這些特征全部納入模型訓練。

圖2 特征與5年生存狀態相關性熱圖

2.3 LDA模型結果

LDA模型的混淆矩陣和ROC曲線圖見圖3,從混淆矩陣中可以看出,測試集中,有11例死亡患者被正確預測,約占85%,僅2例未被正確預測,模型的準確率、靈敏度、特異度、AUC、F1值及Cohen’s kappa值分別為:0.86、0.86、0.85、0.86、0.86和0.66。

圖3 測試集LDA模型的混淆矩陣與ROC曲線

2.4 不同算法模型結果比較

不同算法的結果對比見表2,可見LDA算法獲得最佳模型結果,雖然SVM和RF算法以及ADABoost和XGBoost集成學習算法的準確率及靈敏度較高,但其特異度均過低,因此我們最終選擇LDA作為本研究模型建立的算法。

表2 不同機器學習算法模型結果對比

3 討 論

本文采用LDA算法進行模型建立,除此之外,我們也針對本文的數據采用其他機器學習算法進行了計算,最終發現LDA的模型表現最佳。基于LDA算法建立的預測喉癌患者5年生存率的預后模型的準確率、靈敏度、特異度、AUC、F1值及Cohen’s kappa系數均較滿意,提示本模型可靠且具有一定的應用價值。

對于人工智能機器學習算法建立的模型而言,特征的選擇尤為重要,不同的特征選擇直接關系到模型的準確性與泛化性[14-15]。所有與預測目標相關的因素均可作為潛在的特征,在通過一定算法篩選后,即可作為預測目標的特征。在本研究中,所要預測的目標為喉癌患者5年生存狀態,那么,所有與之有關的如患者的人口學資料和臨床資料均具備作為本模型預測特征的可能性。常用的特征篩選辦法有相關性分析、遞歸特征消除法、主成分分析等方法[16]。本研究采取的特征篩選方法為相關性分析法,將與預測目標有相關性的臨床資料均作為模型的預測特征。本研究發現除了年齡與是否放化療這兩個臨床資料外,其余臨床資料(患者的性別、抽煙史、飲酒史、喉癌的臨床分期、T分期、有無遠處轉移、有無淋巴結轉移、有無復發及腫瘤的病理分級)均與喉癌患者5年生存狀態存在相關性。雖然年齡以及有無放化療這兩個參數與喉癌5年生存狀態之間相關性不明顯,但是考慮到這些參數也是重要的臨床特征,且本研究樣本量相對較小,因此,我們也將這些參數作為特征納入模型訓練。

喉癌的發病具有明顯的性別差異,通常男性發病率遠大于女性,一項研究指出,女性喉癌患者與男性相比,通常預后更好,生存時間更長[17],這點與我們的結果一致:性別與喉癌患者5年生存狀態相關,女性喉癌患者5年生存狀態較男性好。

抽煙史與飲酒史是喉癌發病的獨立危險因素,也與喉癌的預后相關,具有抽煙史和飲酒史的喉癌患者預后更差[18],這點也與我們的研究一致,抽煙史與飲酒史與喉癌患者5年生存狀態呈負相關。喉癌的臨床分期、有無淋巴結轉移與遠處轉移,皆為眾所周知的與喉癌預后明顯相關的臨床因素[2,18],本研究對人口學資料及臨床資料的分析結果顯示,有無遠處轉移、淋巴結轉移、腫瘤的臨床分期也與喉癌患者5年生存狀態呈負相關。因此,上述臨床資料均納入為本模型的預測特征。

本研究中,喉癌的分化水平與其死亡和復發風險顯著相關。有研究顯示,晚期但分化良好的喉癌患者的預后明顯優于早期但分化差的患者[19],因此,喉癌的病理分級水平在喉癌的預后中占有較為重要的比重,一項研究顯示,低分化和高分化LSCC的5年控制率分別為44%和76%,低分化LSCC頸淋巴結轉移率高,生存率低[20],這點與本研究結果一致:5年后喉癌患者生存狀態與其病理分級水平呈負相關,病理分級作為本模型的預測特征之一,占有較大權重。

不同的機器學習算法間,各有優缺點,并不存在某種算法絕對優于另一種算法的情形,不同算法在不同的數據集,各有其表現,比如,在某一數據集中,SVM算法做的模型最佳,但是在另一數據集中,可能會是RF算法效果最佳,因此,沒有最優秀的機器學習算法,只有最合適該數據集的算法[6-7]。在本研究中,雖然SVM、RF算法以及ADABoost和XGBoost集成學習算法的準確率及靈敏度較高,但其特異度均過低,而LDA算法各指標均較滿意,因此我們最終選擇LDA作為建立本研究模型的算法,通過對模型的輸入部分輸入患者的上述特征數據,即可預測該患者5年后的生存狀態,為喉癌患者的個體化治療以及預后預測提供了一個新的輔助手段。

當然,本研究也存在以下兩點不足:1)樣本量過小。由于為確保模型能有準確的數據進行訓練,我們剔除了部分失訪及隨訪不足5年數據,因此樣本量偏小,對模型的穩定性以及泛化能力有一定影響;2)本模型僅適用于對喉癌患者的5年生存狀態做預測,并沒有對患者3年生存狀態做預測,因為3年后還存活的患者比例遠大于已經死亡的喉癌患者,因此訓練時會出現數據分布過于不平衡的問題,因此,我們只對喉癌患者5年生存狀態進行預測。在未來的研究里,我們會納入更多喉癌患者生存數據,并嘗試更多人工智能算法,以對喉癌的人工智能生存預后模型進行進一步研究。

綜上所述,我們成功的采用LDA人工智能算法建立了一個喉癌5年生存狀態的預測模型,本模型可為喉癌臨床診治提供一定參考。人工智能算法有望在喉癌的臨床診治及預后判斷里發揮更多功能。

作者聲明:本文全部作者對于研究和撰寫的論文出現的不端行為承擔相應責任;并承諾論文中涉及的原始圖片、數據資料等已按照有關規定保存,可接受核查。

學術不端:本文在初審、返修及出版前均通過中國知網(CNKI)科技期刊學術不端文獻檢測系統的學術不端檢測。

同行評議:經同行專家雙盲外審,達到刊發要求。

利益沖突:所有作者均聲明不存在利益沖突。

文章版權:本文出版前已與全體作者簽署了論文授權書等協議。

猜你喜歡
人工智能特征模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
抓住特征巧觀察
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美精品高清| 毛片基地视频| 亚洲中文字幕23页在线| 亚洲色图另类| 色爽网免费视频| 国内精品久久久久鸭| 国产黄色免费看| 91麻豆国产视频| 精品视频一区二区观看| 国产在线一区二区视频| 国产成人麻豆精品| 亚洲精品在线观看91| 国产欧美自拍视频| 国产视频入口| 国产免费久久精品99re不卡| 久久综合成人| 欧美日韩国产综合视频在线观看 | 欧美精品不卡| 国产成人综合亚洲欧洲色就色| AV熟女乱| 亚洲天堂在线免费| 日韩欧美高清视频| 在线精品自拍| 91免费国产在线观看尤物| 免费一看一级毛片| 亚洲视频在线网| 亚洲午夜片| 亚洲人成影院午夜网站| 国产精品女熟高潮视频| 亚洲成aⅴ人片在线影院八| 亚洲无码视频一区二区三区| 久久毛片基地| 欧美日韩国产在线观看一区二区三区 | 欧美亚洲日韩不卡在线在线观看| jizz亚洲高清在线观看| 亚洲娇小与黑人巨大交| 午夜精品国产自在| 亚洲大尺度在线| 亚欧美国产综合| 国内精品手机在线观看视频| 国产欧美精品专区一区二区| 91精品国产91久久久久久三级| 999国产精品永久免费视频精品久久 | 成人综合网址| 熟妇丰满人妻| 亚洲欧美另类色图| 亚洲人成网18禁| 激情無極限的亚洲一区免费| 国产在线无码av完整版在线观看| 亚洲性色永久网址| 亚洲国产一成久久精品国产成人综合| 就去吻亚洲精品国产欧美| 欧美午夜小视频| 538国产在线| 91久久偷偷做嫩草影院免费看| 久久精品一卡日本电影 | 91精品国产91久无码网站| 亚洲天堂伊人| 国产一区二区三区夜色| 日韩午夜片| 欧美亚洲国产一区| 亚洲男人天堂2018| 中文字幕波多野不卡一区| 99热最新在线| 欧美一级在线播放| 美女高潮全身流白浆福利区| 在线观看亚洲精品福利片| 国产成人毛片| 福利姬国产精品一区在线| 国产成人做受免费视频| 亚洲国产精品人久久电影| 成人无码一区二区三区视频在线观看 | 亚洲精品午夜天堂网页| 国产激情无码一区二区APP| 亚洲首页国产精品丝袜| 美女无遮挡拍拍拍免费视频| 97无码免费人妻超级碰碰碰| 国产在线视频欧美亚综合| 国产一区二区在线视频观看| 国产午夜一级淫片| 人妻精品全国免费视频| 一级黄色欧美|