應偉峰,陳穹,王鋼,路明,翁慧超,張瑩
搜集2020年1-2月來自4中心由人工智能(artificial intelligence,AI)判定新冠肺炎概率>0% 53例CT掃描患者,男35例、女18例,年齡29~82歲,平均年齡(51.94±11.08)歲。53例中48例發熱,45例咳嗽,19例不同程度胸悶。53例中9例有近期疫區旅居史,8例有近期外地旅居史,26例與新冠患者密切接觸史,10例無明確與新冠患者密切接觸史。
聯影(uCT760)128層螺旋CT機,掃描參數:探測器128×0.625 mm,管電壓120 kV,管電流為自動毫安技術,重建層厚1.5 mm,重建層間距1.5 mm,濾波函數B-SOFT-B。
A組:低年資醫師組,由2名從事放射診斷<10年醫師組成;B組:高年資醫師組,由2名從事放射診斷工作≥10年醫師組成; C組:AI軟件為衛寧健康基于深度學習新冠肺炎CT診斷軟件;D組:低年資醫師聯合AI閱片組。各醫師組內意見不一致需協調后判定結果。
醫師診斷信心評分標準:1分,幾乎不可能是新冠肺炎;2分,較小可能是新冠肺炎;3分,可能是新冠肺炎;4分,較大可能是新冠肺炎;5分,極可能是新冠肺炎。AI軟件評分標準:新冠概率<20%為1分,20%~39%為2分,40%~59%為3分,60%~79%為4分,≥80%為5分。A、B、C、D組對CT影像資料進行分析,比較各組對新冠肺炎診斷效能。
采用Medcalc軟件計算各組診斷受試者工作特征曲線(ROC)并行統計學比較(Z檢驗);采用SPSS 23軟件運用X檢驗對各組敏感度、特異度進行比較。
53例中經逆轉錄聚合酶鏈反應(reverse transcription-polymerase chain reaction,RT-PCR)檢測陽性36例(金標準),ROC曲線下面積(area under curve,AUC)比較(圖1)。
A組(0.717)C組(Z=2.113,P<0.05),C組
以AI診斷新冠肺炎最大約登指數相應的截斷值>3分為標準,各組對新冠肺炎CT診斷效能比較(表1)。
敏感性:A組0.05),A組 特異性:A組0.05),A組 AI(C組)在具有典型CT征象新冠肺炎診斷中對低年資醫師(A組)具有輔助診斷作用,且AI對病灶體積精確測量功能對新冠肺炎轉歸判斷具有輔助價值(圖2),高年資醫師(B組)結合病史、實驗室指標、自身臨床經驗等對不典型新冠肺炎診斷、鑒別診斷能力部分優于其他組(圖3)。 表1 各組對新冠肺炎CT診斷效能比較 胸部CT對新冠肺炎漏診率較低[1],可作為新冠肺炎快速診斷標準方法[2],并被推薦為臨床診斷主要依據[3],典型新冠肺炎主要表現為雙側及周邊毛玻璃樣病變(ground-glass opacity,GGO)、伴有或不伴有血管增厚[4],多灶性病變大部分布于中下肺及后肺區[5],可有“瘋狂鋪路石征”、“反暈征”[6]等。而肺水腫、間質性肺炎、過敏性肺炎等也表現為肺部彌漫性磨玻璃密度影(diffuse ground-glass opacity,DGGO)為主[7],H1N1流感、H7N9流感肺炎等病毒性肺炎CT表現也存在毛玻璃密度影、小葉間隔增厚[8,9]等與新冠肺炎相似的征象,甚至臨床表現都有一定類似;不典型新冠肺炎CT表現各異,甚至存在核酸檢測陽性而人工CT診斷“陰性”[10]現象,所以對于新冠肺炎診斷存在著放射科醫師所能運用影像特征較多卻又鑒別困難現象,且在新冠疫情中對大量患者篩查工作難度、繁重度較高。AI技術已研究和廣泛應用于CT[11]、MRI[12]、乳腺X線診斷[13],胸部CT中已應用于肺部小結節篩選[14]、小結節良惡性鑒別[15]等。 圖1 各組ROC曲線下面積(AUC)比較 圖2 男,52歲,發熱、咳嗽就診,無明確新冠肺炎患者接觸史。 a)兩肺胸膜下為主毛玻璃密度影(箭),A組新冠肺炎診斷信心評分2分,B組5分;b)C組評5分,病灶體積占肺7.46%。RT-PCR檢測陽性,新冠肺炎。 D組評3.5分; c) 1周后病灶部分實變;d) AI示病灶體積占肺體積5.71%,提示部分吸收。 圖3 男,82歲,發熱、咳嗽、胸悶,明確疫區人員接觸史,有慢性間質性肺炎既往史,白細胞值正常、淋巴細胞值處于下限、血清淀粉樣蛋白酶↑。a) 兩肺胸膜下為主磨玻璃密度影伴間質增厚(箭);b) C組根據影像特征示新冠診斷評分3分,病灶體積占肺24.95%。A組評3分,B組結合實驗室指標及臨床病史對其評5分。最終RT-PCR陽性,新冠肺炎。 本次研究AI(C組)診斷新冠肺炎AUC達到了中等度的0.753,敏感度、特異度分別達80.56%、64.71%,顯示其有一定診斷應用價值,這3項指標雖高于低年資醫師(A組),但結果不具統計學意義,顯示C、A組診斷效能相差不大。蔡雅倩等[15]研究發現住院醫師聯合AI后降低了對肺毛玻璃結節篩查及定性診斷中誤診率、漏診率,敏感度也從65.20%上升到96.02%。本組聯合低年資醫師與AI的D組對新冠肺炎診斷敏感度、特異度達到94.44%、70.59%,明顯高于A組75%、52.94%(P<0.05),接近蔡雅倩等[15]研究數據,且本次D組AUC為0.853,也明顯高于A組0.717(P<0.05)。充分說明聯合AI后對低年資醫師診斷新冠肺炎具有顯著提升作用。我們分析主要原因包括①AI已“深度學習”了數千例新冠肺炎病例,積累“數據”量遠遠超過了低年資醫師;②劉小玉等[16]發現首次CT新冠肺炎篩查敏感性可以高于核酸檢測,本組53例篩選出具有新冠肺炎概率病例是在數千名常規胸部CT檢查中篩選出來的,AI沒有低年資醫師視覺、腦力疲勞等問題[15];③低年資醫師對新冠肺炎診斷及鑒別診斷經驗積累不足。所以低年資醫師聯合AI診斷可彌補自身所沒有大量數據經驗。 本次研究中由于部分病例肺內病灶分布于非胸膜下為主,與典型新冠肺炎征象不甚相同[4],且部分病患具有一些肺外新冠征象如縱膈氣腫、肝實質密度減低等,這與丁義等[17]研究結果相似,而AI不能發現肺外征象;侯可可等[18]研究發現中性粒細胞/淋巴細胞比值、T淋巴細胞計數等聯合CT影像特征對早期識別新冠肺炎具有重要意義,而本組各年資醫師較AI擁有結合實驗室指標、影像特征綜合診斷優勢;且此次樣本中部分病例伴有基礎性肺部疾病如間質性肺炎、肺水腫等具有磨玻璃病灶的征象[7]掩蓋了新冠肺炎病灶征象;這些都突出了AI診斷機械性缺陷,而其聯合低年資醫師共同閱片可以很好解決這類缺陷。 另外,D組對新冠肺炎診斷AUC低于B組,而敏感性高于B組,特異性兩者相仿,雖然結果均不具有統計學意義,但也顯示低年資醫師聯合AI后診斷新冠肺炎部分效能接近甚至高于高年資醫師,特別適用于大多數醫院急診通常只有1名放射醫師值班時,AI具有“預警”和提醒醫師新冠肺炎可能存在作用。 除此之外,由于新冠肺炎大多呈多發病灶,隨病程進展病灶影像變化較大[4],學者研究發現可以有早期→消散期;早期→進展期→消散期;早期→進展期→重癥期→消散期等類型[19],病灶占整肺體積百分比是預測新冠肺炎轉歸重要指標之一[20],AI可以自動測量占整肺體積百分比,有利于對新冠肺炎轉歸判斷。 AI加入使原本醫-患關系變成醫-AI-患的三角性關系[21],而醫生是承擔醫療及法律責任主體,所以確定醫生為主、AI為輔主次關系非常重要。
討 論
1.新冠肺炎CT診斷


2.AI對新冠肺炎CT輔助診斷應用特點
3.AI應用倫理學