張揚 邱立軍 原小軍 陳強 張海沙



【作者簡介】張揚,男,內蒙古烏蘭察布人,碩士研究生在讀,主要從事影像診斷。
【通訊作者】邱立軍,男,黑龍江哈爾濱人,碩士研究生導師,主任醫師,主要從事影像診斷工作。
[摘要] 目的:探討人工智能(AI)輔助診斷技術與最大密度投影(MIP)在CT肺磨玻璃結節(GGN)篩查中的臨床應用價值。方法: 回顧性分析182 例體檢發現肺部有磨玻璃結節的患者胸部CT,由2名低年資放射科醫師共同對CT 1 mm薄層圖像及8 mm MIP重建圖像進行閱片并記錄GGN,利用AI自動檢測并記錄GGN。利用卡方檢驗比較人工閱片、AI 及MIP對肺磨玻璃結節檢出率差異,利用ROC曲線分別分析三種方法對各種大小GGN及總GGN的診斷效能,統計指標包括特異度、靈敏度、AUC、可信區間、約登指數及P。結果:共檢出GGN 200個,檢出率:AI>MIP>人工閱片,三組之間差異具有統計學意義(P<0.01)。<3 mm的GGN,共檢出19個,檢出率:AI>人工閱片>MIP ,三組之間差異具有統計學意義(P<0.01)。3~5 mm的GGN,共檢出106個,檢出率:AI>MIP>人工閱片,三組之間差異具有統計學意義(P<0.01)。>5 mm的GGN,共檢出75個,檢出率:AI=人工閱片>MIP,三組之間差異無統計學意義(P>0.05)。對于<3mm的GGN,AI的診斷效能最高,對于3~5 mm的GGN,AI的診斷效能亦最高,對于>5 mm的GGN中,MIP的診斷效能最高。結論:對于≤5mm的GGN,MIP的檢出效能明顯低于AI,對于>5mm的GGN,MIP的檢出效能優于AI,AI和MIP的合理應用能有效提高肺GGN的檢出,減輕放射科醫師的工作強度,減少漏診,可在臨床應用中廣泛推廣。
[關鍵詞] 人工閱片;人工智能;最大密度投影;肺磨玻璃結節;篩查
【基金項目】包頭市科技計劃項目(編號:2020Z1008-1)
肺癌是我國發病率和死亡率最高的惡性腫瘤,由于早期臨床表現多并不明顯,大多數患者發現時已處于中晚期,即使通過手術及放化療治療,患者的病死率依然很高。因此,如果能夠對肺癌進行早期篩查、早期發現、早期診斷,就能有效地提高患者的生存率,改善患者的預后及生存質量。一些研究顯示[1-3]:磨玻璃結節(Ground glass nodule, GGN)往往是肺癌的早期表現形式。CT常規篩查GGN的手段主要有人工閱片、人工智能(Artificial Intelligence, AI)閱片及最大密度投影(Maximal intensity projection, MIP),然而這三種方法對于不同大小GGN的診斷效能目前尚不明確。本研究通過對體檢患者篩查出的GGN進行回顧性分析,探討人工閱片、AI和MIP對于GGN的診斷價值。
1. 資料與方法
1.1 研究對象:選擇2020年6月至2020年11月在本院體檢CT發現存在肺磨玻璃結節的患者。病例納入標準:①掃描范圍包括整個胸廓;②年齡30~80歲。病例排除標準:①有呼吸運動偽影、金屬偽影以及明顯心臟搏動偽影;②雙肺有大片實變影或肺不張;③經病理證實有原發惡性腫瘤或肺部腫瘤病史者。
1.2 CT檢查方法:所有患者的胸部CT掃描均在飛利浦Brilliance 256層iCT完成。檢查時受檢者采取仰臥位,雙臂上舉,掃描范圍從肺尖至后肋膈角尖端肺底水平,患者在深吸氣末單次屏氣完成掃描。掃描參數:管電壓120 KV,管電流80 mA,螺距0.938,重建矩陣512×512,圖像重建層厚1 mm,層距1 mm。
1.3 CT圖像分析:(1)人工閱片診斷GGN:由2名低年資(從業時間分別為2年和3年)影像醫師共同對1 mm薄層圖像進行閱片,每組圖像的窗寬1500 Hu,窗位-700 Hu[4-5],GGN的診斷結果根據2人的一致意見獲得(圖1A)。(2)MIP診斷GGN:將1 mm薄掃圖像上傳至飛利浦星云工作站,進行8 mm層厚的MIP重建,并由2名低年資影像醫師按照1 mm薄掃圖像閱片的原則進行MIP重建圖像閱片,所得結果根據2人的一致意見獲得(圖1B)。(3)AI診斷GGN:將所有病例的CT薄層圖像上傳至AI系統(InferRead CT Lung version 4.0.0.21,推想醫療科技公司),并用AI系統對每一例圖像進行識別及標記,將AI系統標記的GGN按大小進行記錄(圖1C)。(4)GGN金標準:由2名從事放射診斷工作15年以上的高年資放射診斷醫師組成診斷小組,兩人共同評估低年資醫師記錄的所有病灶及AI系統檢出的可疑病灶,在兩人意見統一后,將每個被檢測到的病灶歸類為真陽性GGN及假陽性GGN,并記錄每個真陽性GGN的大小。
A, 人工閱片檢出GGN;B,MIP檢出GGN; C,AI檢出GGN
1.4 統計學方法:各研究方法對GGN的檢出率使用公式“檢出率=該方法GGN檢出個數/金標準GGN檢出個數×100%”計算,檢出率以百分數形式表示。采用SPSS 22.0軟件包進行數據的統計學分析,采用卡方檢驗進行各研究方法檢出率的比較,根據各研究方法對GGN的檢出情況,繪制受試者工作特征(Receiver operator characteristic, ROC)曲線,以曲線下面積(Area under ROC curve, AUC)和約登指數評價各檢驗方法的效能。當AUC≤0.7時,認為檢驗效能較低,當0.7 2. 結果 2.1 本研究共納入182例研究對象,平均年齡55歲,男女比例為1: 0.8。 2.2 共檢出GGN 200個,對于人工閱片、AI和MIP三種篩查方法,AI的檢出率最高為95%,其次為MIP檢出率為84%,而人工閱片檢出率較低為74%,三組之間差異具有統計學意義(P<0.001)。對于<3 mm的GGN,共檢出19個,AI的檢出率最高為94%,而人工閱片和MIP的檢出率較低,分別為47%和42%,三組之間差異具有統計學意義(P<0.01)。對于3~5 mm的GGN,共檢出106個,AI對GGN的檢出率最高為94%,其次為MIP,檢出率為85%,而人工閱片檢出率最低,為63%,三組之間差異具有統計學意義(P<0.01)。對于>5 mm的GGN,金標準共檢出75個,AI與人工閱片的檢出率均為96%,MIP的檢出率為93%,三組之間差異無統計學意義(P=0.682,表1)。 2.3 人工閱片、AI和MIP對GGN的診斷效能:(1)對總GGN的診斷效能:通過對人工閱片、AI和MIP檢出GGN的ROC曲線分析(圖2),發現AI對GGN的診斷效能最高(AUC=0.705, 95%CI: 0.646-0.765),其敏感度和特異度分別為95%和46.1%,而人工閱片(AUC=0.459, 95%CI: 0.397-0.520)和MIP(AUC=0.587, 95%CI: 0.524-0.649)的診斷效能均較AI低。(2)對<3 mm GGN的診斷效能:AI的診斷效能最高(AUC=0.759, 95%CI: 0.606-0.912),其敏感度和特異度分別為94.7%和57.1%,而人工閱片(AUC=0.38, 95%CI: 0.203-0.556)和MIP(AUC=0.256, 95%CI: 0.096-0.415)的診斷效能均較AI低。(3)對3~5 mm GGN的診斷效能:AI的診斷效能最高(AUC=0.725, 95%CI: 0.646-0.804),其敏感度和特異度分別為94.3%和50.6%,而人工閱片(AUC=0.387, 95%CI: 0.306-0.469)和MIP(AUC=0.606, 95%CI: 0.522-0.691)的診斷效能均較AI低。(4)對>5 mm GGN的診斷效能:MIP的診斷效能最高(AUC=0.664, 95%CI: 0.556-0.772),其敏感度和特異度分別為93.3%和39.5%,而人工閱片(AUC=0.62, 95%CI: 0.509-0.730)和AI(AUC=0.643, 95%CI: 0.533-0.752)的診斷效能均較MIP低(表2)。 3. 討論 肺癌早期的主要表現形式是肺結節,有研究[6]統計,體檢中GGN的總檢出率為1.19%,在檢出的GGN 中純磨玻璃結節占比為85.95%。而持續存在的GGN與癌前病變或肺腺癌具有高度相關性[1-2],因此對于肺結節尤其是GGN的檢測與診斷具有重要的臨床意義。 CT容積掃描提供了大量的薄層圖像,提高了空間分辨率的同時提高了檢測肺小結節的能力,但是由于圖像層面太多,影像科醫生閱讀大量的圖像會產生視覺疲勞,容易遺漏小結節,尤其是微小結節和磨玻璃密度結節。AI的出現不僅大大降低了肺結節的漏診率,還充分地解放了放射科醫師的工作負擔。但是AI也有許多不足之處,如對微小結節的檢出效能不高以及假陽性率過高。MIP也是肺結節篩查的有效手段,它是通過計算原始圖像中密度最大的像素,然后運用透視法將這些密度最大的像素投影到一個平面上形成重建圖像[7]。MIP的優越性在于能比薄層CT圖像顯示更長的血管段,能更好地顯示小葉中心動脈,確定小葉中心和血管周圍的病變,顯著地提高GGN的顯示能力。有研究表明,8 mm層厚重建的MIP 對于GGN的檢出是最優的,如Kawel等[8]對5 mm、8 mm、10 mm 層厚MIP進行了比較,發現 8 mm層厚MIP重建發現肺結節明顯優于5 mm、10 mm的重建層厚,所以本研究采用8 mm層厚MIP重建圖像。 以往學者利用AI篩查GGN做了大量研究[9-11],也有學者研究MIP對GGN的應用價值 [12],但是在GGN的篩查中兩者之間的對比分析研究卻鮮有報道。所以本研究旨在對AI、MIP與人工閱片對肺磨玻璃密度結節的檢測能力進行對比分析,以明確其應用價值,為臨床合理應用提供參考。 本次研究結果顯示,對于<3 mm及3~5 mm GGN,人工閱片的AUC 均<0.5,表明其診斷效率較低。這可能是由于醫生在進行大量重復閱片過程中不可避免地產生視覺疲勞,從而導致了GGN的檢出率明顯降低;亦可能是由于GGN直徑太小,難以被肉眼發現所致。對于<3 mm的GGN,MIP的AUC<0.5,則極有可能是由于GGN本身的性狀所導致的,因為GGN在CT圖像上表現為局部呈云霧狀影,密度輕度增加,且不掩蓋病灶內部的血管影[13],所以很難引起肉眼的察覺,再加上較長的血管段對于GGN的顯示亦起到了遮蓋的作用,導致MIP在<3 mm GGN中敏感度較低。然而,在3~5 mm 及>5 mm GGN中,MIP對于GGN 的檢出效能明顯提高,這種差異可能與較大直徑GGN易被發現有關,也可能與其重建層厚有關,還需要進一步的探究。在<3 mm GGN中,AI組的敏感度遠高于其它兩組,表明AI 檢出較小直徑GGN的能力極強。在>5 mm GGN中,人工閱片、AI及MIP 三組之間的AUC及敏感度差異極小,這可能與GGN 直徑較大,較易發現有關;也有可能是由于本研究所包含的此類GGN(75個)較少有關。 從結果可以看出,AI對于各種大小GGN 的檢出率均最高,敏感度均達到了94%以上,然而Joseph 等[14]報道,目前的商業AI系統檢出GGN 的敏感性還不夠,這與本研究結果不符,可能與本實驗所采用的標準有關,共識小組只分析了住院醫師及AI 系統檢出的可疑結節,并未進行獨立閱片以發現兩者都未發現的真陽性GGN;也可能由于不同的AI系統所采用的分割算法不同所致。而以人工閱片方式檢出各種大小GGN的診斷效能均偏低,所以單純的人工閱片不僅勞動強度巨大,其診斷效率還很低,MIP模式閱片及AI的出現,則極大地彌補了這一點,這對于影像醫學的發展是大有裨益的。 本實驗存在以下不足:首先由于本次試驗發現的<3 mm GGN(19個)太少,對于此類GGN的檢出效能判斷還有待進一步佐證;其次,不同層厚MIP對于GGN的檢出效果還有待探究;最后,本次研究的樣本量尚小,需擴大樣本量,以進一步對結果進行驗證。 綜上所述,對于≤5 mm GGN,MIP的檢出效能明顯低于AI,但是對于>5 mm GGN,MIP的檢出效能則優于AI; AI在有效提高GGN檢出效能的同時,大大地減輕了影像醫師的工作強度,結合MIP技術及人工閱片,能精準判斷GGN,值得在臨床應用中廣泛推廣,但是AI也存在較大的局限性,需要進一步完善其算法,以進一步提高檢出效率。 [參考文獻] 1.秦福兵, 陸友金. 純磨玻璃結節定量CT鑒別肺浸潤性腺癌與浸潤前病變和微浸潤腺癌[J]. 中國醫學計算機成像雜志, 2016, 22(1):22-26. 2.刁竹帥, 代月杰, 王國華, 等. HRCT肺純磨玻璃結節影像表現與肺腺癌病理新分類的相關性分析[J]. 醫學影像學雜志, 2019, 29(3):407-409, 424. 3.劉曉梅, 孫英杰, 甄鵬飛, 等. 低劑量MSCT對肺部磨玻璃結節的定性診斷[J]. 中國中西醫結合影像學雜志, 2019, 17(2):124-126, 139. 4.MacMahon H, Naidich DP, Goo JM, et al. Guidelines for Management of Incidental Pulmonary Nodules Detected on CT images: From the Fleischner Society 2017[J]. Radiology, 2017, 284(1):228-243. 5.Yoo RE, Goo JM, Hwang EJ, et al. Retrospective assessment of interobserver agreement and accuracy in classifications and measurements in subsolid nodules with solid components less than 8mm: which window setting is better[J].Eur Radiol, 2017, 27(4):1369-1376. 6.馬聰, 張偉華, 郭曉東, 等. 健康體檢人群中肺磨玻璃密度結節檢出率及影像特點[J].中華健康管理學雜志, 2015, 9( 2):124-126. 7.Napel S, Rubin GD, Jeffrey RB Jr. STS-MIP: a new reconstruction technique for the chest[J]. J Comput Assist Tomogr, 1993, 17:832-838. 8.Kawel N, Seifert B, Luetolf M, et al. Effect of slab thickness on the CT detection of pulmonary nodules: use of sliding thin-slab maximumintensity projection and volume rendering[J]. AJR Am J Roentgenol, 2009, 192 (5):1324-1329. 9.金文忠, 陸耀, 汪陽. 基于人工智能的胸部CT智能輔助診斷系統在LDCT數據集上的應用研究[J].中國醫學計算機成像雜志, 2018, 24(5):373-377. 10.蔡雅倩, 張正華, 韓丹, 等. AI對肺磨玻璃結節篩查及定性的臨床應用研究[J].放射學實踐, 2019, 34(9):958-962. 11.孫炎冰, 陶廣昱, 陳群慧, 等. 人工智能CT定量分析肺磨玻璃密度結節初探[J].中國醫學計算機成像雜志, 2018, 24(5):383-387. 12. Li Wang-jia, Chu, Zhi-gang,Zhang, Yan, et al. Effect of Slab Thickness on the Detection of Pulmonary Nodules by Use of CT Maximum and Minimum Intensity Projection[J].AJR: American Journal of Roentgenology:Including Diagnostic Radiology, Radiation Oncology, Nuclear Medicine, Ultrasonography and Related Basic Sciences, 2019, 213(3):562-567. 13.Zhao, Chao, Yang, Yang,Shi, Jingyun, et al. High Discrepancy of Driver Mutations in Patients with NSCLC and Synchronous Multiple Lung Ground-Glass Nodules[J]. Journal of thoracic oncology: official publication of the International Association for the Study of Lung Cancer,2015,10(5):778-783. 14.Benzakoun J, Bommart S, Coste J, et al. Computer-aided diagnosis (CAD) of subsolid nodules: Evaluation of a commercial CAD system[J]. Eur J Radiol, 2016, 85(10):1728-1734. 包頭醫學院 內蒙古包頭 014040 烏蘭察布市第二醫院 內蒙古烏蘭察布 012000 內蒙古科技大學包頭醫學院第一附屬醫院 內蒙古包頭 014010 上海市楊浦區控江醫院 上海 200093