999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于人工智能的CT影像預測肺腺癌浸潤性:Meta分析

2022-11-22 02:53:26黃文君周秀秀周陶胡葛艷明董鵬范麗
放射學實踐 2022年11期
關鍵詞:分析模型

黃文君,周秀秀,周陶胡,葛艷明,董鵬,范麗

國際癌癥研究機構更新的最新版GLOBOCAN 2020指出,現今肺癌仍是癌癥死亡的主要原因,同時國內肺癌的整體發病率(56.3/10萬)和死亡率(49.4/10萬)也都居于首位[1]。作為最常見的肺癌亞型,肺腺癌占所有肺癌病例的一半以上[2],可見防控肺腺癌是肺癌防控中的重要一環。隨著常規CT的全面覆蓋和低劑量CT篩查的普及,許多肺腺癌能在早期即被檢出[3-4]。目前很多肺腺癌或其前體病變的CT影像表現是持續存在的磨玻璃結節(ground glass nodule,GGN)[5]。據2015版世衛組織(WHO)分類,肺腺癌包含浸潤前病變——非典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)和原位腺癌(adenocarcinoma in situ,AIS),微浸潤性腺癌(minimally invasive adenocarcinoma,MIA)及浸潤性腺癌(invasive adenocarcinoma,IAC)[6]。針對不同的病理亞型,患者的手術方式和5年無病生存率(disease free survival,DFS)明顯不同,IAC患者較非IAC(包括AAH、AIS和MIA)患者需要更大范圍的肺組織切除術且5年DFS顯著降低[7-9]。因此通過無創的CT影像預測肺腺癌浸潤性能為臨床醫師制定最優治療方案提供更全面的參考依據。近年來人工智能(artificial intelligence,AI)的快速發展能夠利用CT影像鑒別IAC和非IAC,主要通過CT影像組學和深度學習(deep learning,DL)兩種方法實現[10]。目前基于此兩種方法區分IAC和非IAC的研究已有不少,但是不同研究間的樣本量、研究質量及AI算法的差異卻使得AI診斷的性能參差不齊。因此,本文對基于AI的CT影像預測肺腺癌浸潤性的能力進行了Meta分析,旨在為其臨床應用提供更有力的支撐。

材料與方法

1.文獻檢索策略

檢索數據庫:PubMed、Embase、Cochrane圖書館、Web of Science、中國知網(CNKI)、SinoMed (CBM)、萬方和維普等在線數據庫。文獻發表時間:2011年1月1日-2021年6月30日。檢索內容:國內外公開發表的基于AI的CT影像預測肺腺癌浸潤性的所有文章。中文檢索關鍵詞包括:肺結節、磨玻璃結節、純磨玻璃結節、亞實性結節、混雜磨玻璃結節、腺癌、肺癌、CT、計算機斷層掃描、人工智能、深度學習、機器學習、神經網絡、隨機森林、支持向量機、電腦輔助診斷、病理、浸潤、分類、識別、預測等;英文檢索關鍵詞包括:pulmonary nodule,ground glass nodule,pure ground glass nodule,mixed ground glass nodule,subsolid nodule,adenocarcinoma,lung cancer,CT,computed tomography,AI,deep learning,machine learning,computer-aided diagnosis,neural network,random forest,support vector machine,pathology,invasive,classify,predict等。此外,還包括這些詞的同義詞或近義詞,如部分實性結節,非實性結節,肺部腫瘤,part-solid nodule,non-solid nodule,lung nodule,lung neoplasm等。

2.納入與排除標準

檢索的文章使用Endnote 9軟件管理。納入標準:①以漢語或英語公開發表的文獻;②以CT為影像檢查方法,通過AI進行診斷并取得診斷結果的患者;③以病理學檢查結果為肺腺癌(WHO 2015版)為金標準,納入的病理亞型包括IAC、MIA、AIS和AAH;④病灶直徑≤3 cm。排除標準包括:①重復發表的文獻;②無法獲取全文、數據不完整或研究內容不同;③病變直徑>3 cm或對病變大小未作出說明;④其他類型的肺癌或良性病變;⑤文章類型為綜述、Meta分析、動物實驗、會議、通信、述評等。

3.納入文獻質量評價

QUADAS-2診斷準確性試驗質量評價工具用于文獻質量評判[11]。先由3位研究人員(分別有1年、3年和5年影像診斷工作經驗)獨自進行預評估,然后由專家組(由3位有15年以上影像診斷工作經驗的醫生組成)匯總評估結果作出最終決定。評估主要包含“偏倚風險判斷”和“臨床適用性評價”兩部分。前者從病例選擇、待評價試驗、金標準、病例流程和進展狀況四個方面進行評判,分為“是”、“否”、“不清楚”三級;后者主要判斷病例選擇、待評價試驗、金標準與待評價項目的匹配程度,分為“高”、“低”、“不清楚”三級。

4.數據提取

先由2位研究人員提取數據,再由另1位研究人員完成核對。當產生不同意見時,交由專家組討論并作出最終決定。提取的內容包括:①一般特征:第一作者、出版年份、資料來源、患者總數、性別、肺結節總數、結節類型和病理類型(IAC/非IAC)。②診斷特征:AI算法/模型、提取特征、樣本分組、模型分組;以IAC為陽性結果,非IAC為陰性結果,直接提取或經計算得出真陽性(true positive,TP)、假陽性(false positive,FP)、假陰性(false negative,FN)和真陰性(true negative,TN)的樣本量,以金標準為參照組成四格表數據。此外,納入研究一般將數據分為訓練組和測試組兩部分,前者用于對AI診斷模型進行訓練,后者用于最終模型的性能檢驗。因此,本Meta分析僅提取測試組的數據。

圖1 文獻篩選流程圖。

5.統計分析

統計分析軟件包括RevMan 5.3、MetaDiSc 1.4和Stata16.0。RevMan 5.3用于繪制風險偏倚評價的條形圖。MetaDiSc 1.4用于檢測閾值效應、異質性分析、合并指標的計算以及亞組分析。閾值效應引起的異質性使用敏感度對數與(1-特異度)對數之間的Spearman相關系數進行檢測;非閾值效應引起的異質性使用Cochran-Q及I2檢驗進行檢測。組間異質性較低時(I2<50%),采用固定效應模型合并指標;組間異質性較高時(I2≥50%),采用隨機效應模型合并指標。評價指標包含:合并敏感度(pooled sensitivity,Sen合并)、合并特異度(pooled specificity,Spe合并)、合并陽性似然比(pooled positive likelihood ratio,PLR合并)、合并陰性似然比(pooled negative likelihood ratio,NLR合并)、合并診斷比值比(pooled diagnosis odds ratio,DOR合并)、集成受試者操作特征(summary receiver operating characteristic,SROC)曲線以及曲線下面積(area under curve,AUC),其中DOR合并是主要合并指標。亞組分析依照研究對象的特點分組,通過Meta回歸判斷異質性來源,繪制各組的SROC曲線并得到AUC值,計算各組的Sen合并、Spe合并、DOR合并。Stata16.0用于敏感性分析和發表偏倚檢驗。分別剔除敏感性分析篩出的高敏數據,重新繪制SROC曲線并比較AUC值來驗證AI診斷性能的穩定性。Deeks檢驗用于評估發表偏倚。以P<0.05為差異有統計學意義。

結 果

1.納入文獻概述

通過檢索共獲得文獻1207篇,12篇文獻(中文4篇,英文8篇)進入最終的分析[12-23]。文獻篩選流程見圖1,文獻質量評價結果見圖2。納入文獻的一般特征和診斷特征分別見表1和表2,共納入4066例患者的4325枚肺結節,訓練組和測試組的結節數分別為3144枚和1181枚,共提取了34組四格表數據。在性別構成上,10篇文獻根據患者總數列出,其中男性1079人,女性2207人;另有2篇根據結節總數列出,其中男性肺結節297枚,女性肺結節526枚。有10篇文獻詳細說明了結節類型,包括2979枚純磨玻璃結節(pure ground glass nodules,pGGN)、797枚混雜磨玻璃結節(mixed ground glass nodules,mGGN)和113枚實性結節;其余2篇僅指出結節類型為GGN,共436枚。

2.Meta分析結果

閾值效應和異質性檢驗:Spearman相關系數為0.154(P=0.386>0.05),意味著本研究不存在閾值效應。DOR合并的Cochran-Q檢驗得出Cochran-Q=79.09(P<0.001),說明有非閾值效應造成的異質性;且Sen合并、Spe合并、PLR合并、NLR合并、DOR合并的I2值分別為71.6%、72.5%、71.7%、66.4%、58.3%,I2均>50%,進一步說明了較高異質性的存在,故各指標需采取隨機效應模型合并。

各指標合并結果:AI模型的Sen合并=0.86[95%置信區間(95%CI):0.85~0.88)],Spe合并=0.82(95%CI:0.80~0.84),PLR合并=4.55(95%CI:3.61~5.75),NLR合并=0.19(95%CI:0.15~0.23),DOR合并=28.31(95%CI:19.76~40.54),總體AUC為 0.9110(圖3~6)。

表1 納入研究的一般特征

圖2 納入文獻質量評估結果(QUADAS-2)。

亞組分析:依據不同的AI算法將34組數據分成3類,分別為隨機森林(random forest,RF)14組、支持向量機(support vector machine,SVM)7組以及“其他”(Others)13組;依據測試組樣本數量是否≥50例分成2類(是:26組;否:8組)。基于此兩種分類進行Meta回歸,分析顯示AI算法的差異(P=0.0028)或許是產生異質性的原因之一,樣本量的差異(P=0.2761)無法作為異質性來源的依據。重新合并按不同算法分組的各項指標(表3),RF組的Sen合并(0.91)、DOR合并(52.91)和AUC(0.9412)最高,而Others組的Spe合并(0.84)最高。

敏感性分析和發表偏倚:圖7顯示第12、13和28組數據存在較強敏感性,分別剔除這3組數據后的AUC為0.9077、0.9074和0.9138,全部剔除這3組數據后的AUC為0.9063,該結果與總體AUC(0.9110)差別不大,說明此次Meta分析敏感性較低,結果穩定可靠。Deeks偏倚檢驗結果顯示P=0.06>0.05,表明漏斗圖基于回歸線對稱,無發表偏倚。

討 論

隨著AI在醫學領域應用的不斷深化和細分,在肺腺癌診斷方面,基于影像組學和AI的良惡性鑒別、惡性程度分級等研究已廣泛開展[24]。然而,由于組學模型泛化不易,紋理特征的魯棒性不同,DL又需要比組學模型更多的樣本用于訓練,導致不同研究間的AI診斷性能差異顯著[25-26]。GGN作為初期肺腺癌的首要影像表現,AI對其浸潤性的預測同樣受上述因素制約,所以本文對基于不同AI算法的CT影像預測肺腺癌浸潤性的診斷能力進行Meta分析。最終納入12項研究的4325枚肺結節,其中絕大多數(97%,4212/4325)為GGN。此外,無論是按患者數還是按結節數統計,女性均占大多數,分別為67%(2207/3286)和64%(526/823),與文獻報道的近年顯著升高的女性肺腺癌發病率相符[27]。

表2 納入研究的診斷特征

表3 各亞組合并結果

本次分析無閾值效應,但研究間異質性較高,故對各指標使用隨機效應模型合并。DOR合并為主要合并指標,代表診斷試驗結果與疾病的關系水平;當DOR合并>1時,其值越大,該試驗的診斷能力就越高[28]。本文DOR合并=28.31,說明了AI對肺腺癌浸潤性較高的診斷性能。Sen合并、Spe合并分別為86%、82%,說明AI確定IAC和識別非IAC的能力都相對較高。PLR合并顯示AI正確識別IAC的概率是錯誤識別概率的4.55倍,NLR合并顯示錯誤識別非IAC的概率是正確識別概率的0.19倍。總體AUC為0.9110,也證明AI的診斷性能優異。

根據Meta回歸結果,AI算法的差異可推斷為異質性的來源。從表3可知,RF組的Sen合并、DOR合并和AUC均高于另外兩組,說明基于CT影像組學特征構建的AI模型中,RF算法對IAC的診斷性能好于其他機器學習(machine Learning,ML)算法,可能代表了其更好的泛化能力。當然,RF的高診斷性能也不能排除是因為納入分析組數較多、代表性較強導致的結果。需要指出的是,這也不能說明ML要比DL的診斷性能更好;相反,使用基于DL的卷積神經網絡(convolutional neural networks,CNN)進行肺結節分類在多數場合下是優于現有的計算機輔助診斷技術的[29-31],采用CNN對肺腺癌分類的研究也逐年增多,在診斷性能上已達到甚至略超過高年資放射科醫生的水平[32-34]。從本文看,僅有三組四格表數據是基于CNN算法的結果,因而在分組中被歸入了“其他”一組,且樣本量較少,均導致其診斷價值體現不足。此外,在文獻篩選過程中,部分無法提取四格表信息的基于DL的研究也被排除,同樣對其診斷價值的判斷存在影響。但是,本次亞組分析已證實了不同AI算法是引起異質性的原因,而且最終SROC曲線的AUC為0.9110,排除較高敏感性數據后的AUC也都在此值附近輕微波動,顯示了綜合了ML和DL的AI在預測肺腺癌浸潤性的能力上的高效性和穩定性。

圖3 a)AI模型的合并敏感度;b)合并特異度。

圖4 a)AI模型的合并陽性似然比;b)合并陰性似然比。

圖5 AI模型的合并診斷比值比。

圖6 AI模型的SROC曲線。 圖7 敏感性分析結果。

當前AI取得的成就固然可喜,但依然處在初步驗證和應用階段,還有相當的改進空間,需要與臨床醫生密切配合才能發揮其價值。如本文中,AI對肺腺癌浸潤性的診斷仍存在一定的漏診率和誤診率(分別為14%和18%),而對組學特征的進一步挖掘、擴大訓練樣本量或進一步提升有限數據集上算法的性能都是可行的解決方法。這些工作都需要醫生工作的支持,其中放射科醫生在判斷新興AI技術的臨床應用價值上有重要作用,并在整合互補成像技術信息與臨床數據的工作中擔任指導者角色,從而能提供更完善的診斷信息[26]。此外,即便AI已能獨立診斷,但最終仍需要放射科醫生簽發報告并承擔法律風險[35],因此,如果能通過立法明確醫生與提供AI服務的公司間各自的責任范圍,也能促進AI診斷服務的普及。最后,目前醫生對AI的積極態度也為二者的深度協同提供了有利前提[36]。

本文存在以下不足:①收集的是二分類數據(IAC與非IAC),其他二分類方法(如浸潤前病變和浸潤性病變)、多分類方法(如對IAC的病理亞型細分)以及包含了良性結節的分類方式均被排除,可能會對診斷價值的評判產生影響。但如前文所言,以IAC和非IAC進行區分更具有臨床意義,因而基于本文分類所得的診斷價值可能更具實用性。②因部分研究無法提取四格表數據或所含樣本量較少,其代表的算法的診斷價值可能無法被真實反映。③盡管Meta回歸顯示不同的AI算法是異質性產生的原因,但是其他方面,如患者間的差異、CT設備或掃描協議的不一致、提取特征的數量差距或組學特征的不同等,都可能是出現異質性的因素,有待深入研究。④僅納入了以中、英兩種語言發表的文章,其他語種的文獻或被漏掉而造成偏倚。

綜上所述,本Meta分析顯示基于AI的CT影像對肺腺癌浸潤性有較高的預測能力,能為臨床上制定隨訪策略或手術方案提供更詳細的參考依據,具有實際應用的價值。但AI診斷目前仍有一定的漏診率和誤診率,獲取更詳實的患者資料、采用結構化的影像報告、收集多中心的大量樣本、深度挖掘紋理特征和優化神經網絡架構等辦法將有助于進一步提升AI診斷工具的性能。同時,AI與醫生的深度協同能促進工作效率的提高,增加醫療資源利用率,為實現肺癌的早篩早診早治提供一條更科學高效的途徑。

猜你喜歡
分析模型
一半模型
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 精品国产亚洲人成在线| 国内毛片视频| 性色生活片在线观看| 亚洲成a∧人片在线观看无码| 91久久国产综合精品| 亚洲视频四区| 丁香婷婷激情综合激情| av色爱 天堂网| 天堂网国产| 国产老女人精品免费视频| 国产成人麻豆精品| 成年人福利视频| 色网站在线视频| 中文字幕乱妇无码AV在线| 国产亚洲视频中文字幕视频| 伊人久久久久久久久久| 精品超清无码视频在线观看| a级免费视频| 精品欧美日韩国产日漫一区不卡| 一本无码在线观看| 国产精品任我爽爆在线播放6080| 成人在线综合| 欧美日韩第二页| 亚洲色图综合在线| 国产成人一级| 国产成熟女人性满足视频| 人妻出轨无码中文一区二区| 毛片手机在线看| 亚洲中久无码永久在线观看软件| 亚洲永久色| 无码'专区第一页| 免费一级毛片在线观看| 精品国产美女福到在线不卡f| 中文字幕无线码一区| 亚洲高清无在码在线无弹窗| 中文字幕久久精品波多野结| 国产18在线| 无码一区18禁| 人妻少妇乱子伦精品无码专区毛片| 欧美中文字幕在线二区| 亚洲色图欧美| Jizz国产色系免费| 天天色天天综合网| 国产一级α片| 网友自拍视频精品区| 亚洲人成色在线观看| 在线观看国产精美视频| 亚洲一区免费看| 在线免费观看a视频| 国产麻豆永久视频| 激情影院内射美女| 在线观看亚洲国产| 国产成熟女人性满足视频| 制服丝袜一区二区三区在线| 国产精品永久免费嫩草研究院| 国产乱子精品一区二区在线观看| 成人免费一级片| 国产精鲁鲁网在线视频| 国产精品亚欧美一区二区| 久久夜夜视频| 婷婷丁香在线观看| 在线看片免费人成视久网下载| 在线观看无码a∨| 欧美成人精品在线| 97久久人人超碰国产精品| 久久精品人人做人人爽电影蜜月| 亚洲高清国产拍精品26u| 国产69精品久久久久妇女| 亚洲人成亚洲精品| 欧美精品v欧洲精品| 国产毛片久久国产| 国国产a国产片免费麻豆| 国产福利小视频在线播放观看| 久久久精品国产亚洲AV日韩| 97青青青国产在线播放| 久久一本日韩精品中文字幕屁孩| 免费国产无遮挡又黄又爽| 四虎成人在线视频| 亚洲性网站| 国产真实自在自线免费精品| 国产H片无码不卡在线视频 | 欧美不卡视频一区发布|