江桂蓮,陳疆紅,胡志海,鐘朝輝,王大為
1.首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院 放射科,北京 100059;2.北京推想科技有限公司 全球臨床科研合作學(xué)院,北京 100025
根據(jù)2015年中國(guó)癌癥中心報(bào)道,肺癌已成為我國(guó)發(fā)病率及致死率最高的癌癥[1],約三分之二的患者初診時(shí)已經(jīng)是中晚期,有明顯的淋巴和血管遠(yuǎn)處轉(zhuǎn)移的傾向。對(duì)于中晚期患者而言,肺癌的預(yù)后效果很差,平均五年生存率低于20%[2],Ⅳ期肺癌患者五年生存率低至5.3%[3]。相比之下,Ⅰ期肺癌患者手術(shù)切除后10年生存率可達(dá)72%[4]。可見(jiàn),早期肺癌篩查對(duì)患者的預(yù)后、生存時(shí)間乃至生存質(zhì)量具有重要意義。胸部低劑量CT(Low Dose CT,LDCT)是肺結(jié)節(jié)篩查的常規(guī)手段,研究表明LDCT篩查可以有效降低肺癌死亡率達(dá)20%[5]。然而,CT檢查量增長(zhǎng)與放射科醫(yī)生數(shù)量之間日趨不均衡,加上每個(gè)患者的胸部CT圖像有400層左右,這些都容易導(dǎo)致閱片醫(yī)生因?yàn)槠诨虿粚W⒌仍虍a(chǎn)生漏診。
近幾年,基于深度學(xué)習(xí)的新一代人工智能(Artificial Intelligence,AI)技術(shù)迅速發(fā)展。在醫(yī)學(xué)影像領(lǐng)域,AI系統(tǒng)已經(jīng)被成功應(yīng)用于放射、病理、皮膚醫(yī)學(xué)等的圖像分析,與醫(yī)學(xué)專家相比,診斷速度更快、診斷準(zhǔn)確率基本持平[7]。因此,AI技術(shù)是提高醫(yī)生診斷效率、減輕臨床工作負(fù)擔(dān)的潛在有效手段之一。
值得指出的是,肺部CT檢查的圖像質(zhì)量受到許多因素的影響,如成像方法、層厚和劑量等。能譜CT利用X線高低能量瞬時(shí)切換技術(shù),獲得多組單能圖像,不同單能圖像組織CT值、對(duì)比度及噪聲不同。目前認(rèn)為低千電子伏特(Kiloelectron Volt,keV)圖像組織對(duì)比度較大,較高能量圖像及混合能量圖像更易于小病灶的檢出及診斷,且低keV圖像的CT值更能反映結(jié)節(jié)的性質(zhì)[6]。因此,本研究應(yīng)用商品化的AI肺結(jié)節(jié)篩查系統(tǒng),將其與能譜CT的單能圖像結(jié)合,在臨床使用中驗(yàn)證其檢測(cè)肺結(jié)節(jié)的有效性的同時(shí),篩選最佳的單能圖像以保證AI系統(tǒng)最優(yōu)的肺結(jié)節(jié)檢出率。同時(shí),根據(jù)肺結(jié)節(jié)位置的不同(分為肺外帶、肺內(nèi)帶、支氣管血管樹(shù)旁、胸膜下四類),評(píng)估人工智能系統(tǒng)對(duì)能譜CT單能圖像中肺結(jié)節(jié)的檢出效能以及對(duì)于不同位置結(jié)節(jié)檢出的準(zhǔn)確性。
回顧性收集2018年11月—2019年3月首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院放射科行胸部能譜CT掃描的住院患者30例,其中男15例,女15例,平均年齡61.8歲。收集標(biāo)準(zhǔn):病例年齡>18歲,因胸部占位性病變?nèi)朐簷z查者。排除標(biāo)準(zhǔn):兩肺在視野內(nèi)不能完全可見(jiàn);有呼吸運(yùn)動(dòng)偽影;影像不符合DICOM標(biāo)準(zhǔn);醫(yī)生難以識(shí)別診斷。
1.2.1 能譜CT數(shù)據(jù)采集
采用GE Revolution CT(GE Healthcare,Wisconsin,USA)掃描機(jī)行能譜胸部CT平掃。患者仰臥,頭先進(jìn),以胸骨柄為定位中心,患者深吸氣并屏氣。掃描范圍從肺尖到橫膈以下。掃描參數(shù)為:螺距0.992:1,球管轉(zhuǎn)速0.5 s/r,掃描層厚5 mm,重建層厚0.625 mm,準(zhǔn)直器寬度80 mm,DFOV 35 cm,管電壓為80 kV和140 kV瞬時(shí)(0.25 ms)切換,自動(dòng)毫安技術(shù),噪聲指數(shù)NI=12。掃描完成后將原始圖像載入寶石能譜成像瀏覽器(GSI viewer)重建40、55、70、85、100 keV共5組單能量圖像。
1.2.2 圖像分析
來(lái)自首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院放射科、具有5年以上肺部讀片經(jīng)驗(yàn)的2名主治及以上醫(yī)生,在基于深度學(xué)習(xí)的AI肺結(jié)節(jié)篩查系統(tǒng)(北京推想科技有限公司,InferRead CT Lung)的輔助下背靠背對(duì)胸部能譜CT中120 kVp-like序列(相當(dāng)于74 keV序列)圖像進(jìn)行肺結(jié)節(jié)標(biāo)注,當(dāng)2名醫(yī)生的標(biāo)注結(jié)果出現(xiàn)分歧時(shí),由第3名具有20年肺部讀片經(jīng)驗(yàn)的主任醫(yī)師進(jìn)行仲裁,由此制定出該數(shù)據(jù)集中肺結(jié)節(jié)的“金標(biāo)準(zhǔn)”。金標(biāo)準(zhǔn)制定過(guò)程中,標(biāo)注醫(yī)生同時(shí)記錄了每個(gè)結(jié)節(jié)所在的位置,按照不同位置分為肺外帶(結(jié)節(jié)距胸膜≤15 mm)結(jié)節(jié)、肺內(nèi)帶(結(jié)節(jié)距胸膜>15 mm)結(jié)節(jié)、支氣管血管樹(shù)旁結(jié)節(jié)和胸膜下結(jié)節(jié)四類。利用人工智能系統(tǒng)分別對(duì)30例胸部能譜CT序列的40、55、70、85、100 keV單能量圖像進(jìn)行讀片篩查,記錄檢出結(jié)節(jié)的總數(shù)及每個(gè)結(jié)節(jié)位置,將AI系統(tǒng)的篩查結(jié)果與“金標(biāo)準(zhǔn)”進(jìn)行比對(duì),計(jì)算其在不同單能圖像中對(duì)不同位置肺結(jié)節(jié)的檢出率。
本研究數(shù)據(jù)分析均使用SPSS 19.0(IBM Corp.,Armonk,NY,USA)完成。通過(guò)與金標(biāo)準(zhǔn)比對(duì),統(tǒng)計(jì)不同單能量圖像中檢出的真陽(yáng)性結(jié)節(jié)數(shù),假陽(yáng)性結(jié)節(jié)數(shù)和假陰性結(jié)節(jié)數(shù),計(jì)算敏感度,假陽(yáng)性率和陽(yáng)性預(yù)測(cè)值,其中,假陽(yáng)性率定義為每個(gè)CT掃描的平均假陽(yáng)性結(jié)節(jié)數(shù)(假陽(yáng)性數(shù)/CT掃描數(shù)),陽(yáng)性預(yù)測(cè)值定義為真陽(yáng)性結(jié)節(jié)與所有檢出結(jié)節(jié)的比值[8]。對(duì)于不同單能量圖像中不同位置肺結(jié)節(jié)的檢測(cè)敏感性和陽(yáng)性預(yù)測(cè)值采用同樣的方式統(tǒng)計(jì)和計(jì)算。最后利用χ2檢驗(yàn)或Fisher精確檢驗(yàn)(當(dāng)頻數(shù)小于5時(shí))比較各組間敏感度和陽(yáng)性預(yù)測(cè)值的差異,通過(guò)單因素方差分析比較各組間假陽(yáng)性率差異,P<0.05代表有統(tǒng)計(jì)學(xué)差異。
在入組的30例能譜CT平掃圖像中,三名放射科專家共計(jì)標(biāo)注了224個(gè)肺結(jié)節(jié),包含86個(gè)肺外帶結(jié)節(jié)、34個(gè)肺內(nèi)帶結(jié)節(jié)、41個(gè)支氣管血管樹(shù)旁結(jié)節(jié)和63個(gè)胸膜下結(jié)節(jié)。
利用AI肺結(jié)節(jié)篩查系統(tǒng)對(duì)臨床中常用的CT序列(120 kVp-like)圖像進(jìn)行肺結(jié)節(jié)檢測(cè),共計(jì)檢測(cè)到349個(gè)結(jié)節(jié),與金標(biāo)準(zhǔn)比對(duì)后發(fā)現(xiàn),AI系統(tǒng)檢測(cè)到真陽(yáng)性結(jié)節(jié)218個(gè),假陽(yáng)性結(jié)節(jié)131個(gè),假陰性結(jié)節(jié)6個(gè),檢測(cè)敏感度為97.3%,陽(yáng)性預(yù)測(cè)值為62%,假陽(yáng)性率為4.37%。可見(jiàn),AI肺結(jié)節(jié)篩查系統(tǒng)在臨床上具有較好的表現(xiàn)。
利用AI肺結(jié)節(jié)篩查系統(tǒng)分別對(duì)40、55、70、85、100 keV的單能圖像進(jìn)行結(jié)節(jié)檢測(cè)(圖1),分別檢出280、314、339、349和360個(gè)結(jié)節(jié),其中真陽(yáng)性結(jié)節(jié)數(shù)分別為167、201、216、215和208個(gè),結(jié)果如表1所示。5組單能量圖像結(jié)節(jié)檢出敏感性存在顯著性差異(P=0.000),40 keV圖像結(jié)節(jié)檢出敏感性顯著低于其余4組,其中70 keV圖像對(duì)結(jié)節(jié)檢出具有最高的敏感性(96.43%)。假陽(yáng)性率隨keV升高呈增加的趨勢(shì),各組間無(wú)顯著差異(P=0.358)。陽(yáng)性預(yù)測(cè)值各組間無(wú)顯著性差異(P=0.402),其中55 keV和70 keV具有較高的陽(yáng)性預(yù)測(cè)值(分別為64%和63.7%)。綜上,能譜CT的70 keV單能圖像更適合AI系統(tǒng)進(jìn)行結(jié)節(jié)篩查。

圖1 右肺中葉內(nèi)段結(jié)節(jié),靠近血管旁

表1 AI肺結(jié)節(jié)篩查系統(tǒng)在單能圖像間的檢測(cè)性能比較
將AI系統(tǒng)在不同單能量圖像中檢測(cè)的肺結(jié)節(jié)進(jìn)行位置分類,分別在肺外帶、肺內(nèi)帶、支氣管血管樹(shù)旁及胸膜下四個(gè)位置統(tǒng)計(jì)肺結(jié)節(jié)總數(shù)和真陽(yáng)性結(jié)節(jié)數(shù),計(jì)算敏感性、陽(yáng)性預(yù)測(cè)值及對(duì)應(yīng)P值,詳見(jiàn)表2~3。不同單能量圖像中,檢出四個(gè)位置肺結(jié)節(jié)的敏感性無(wú)統(tǒng)計(jì)學(xué)差異(P>0.05);在5組單能量圖像間,針對(duì)肺外帶結(jié)節(jié),70 keV及以上組單能圖像的檢測(cè)敏感度顯著高于40、55 keV;針對(duì)肺內(nèi)帶結(jié)節(jié),55 keV及以上組單能圖像的檢測(cè)敏感度顯著高于40 keV。針對(duì)支氣管血管樹(shù)旁結(jié)節(jié),70 keV及以上組單能圖像的檢測(cè)敏感度顯著高于40及55 keV;針對(duì)胸膜下結(jié)節(jié),不同單能量組間檢測(cè)敏感度無(wú)顯著差異(P=0.079)。值得注意的是,在各組單能量圖像中,支氣管血管樹(shù)旁結(jié)節(jié)的陽(yáng)性預(yù)測(cè)值顯著低于肺外帶、肺內(nèi)帶和胸膜下結(jié)節(jié)的陽(yáng)性預(yù)測(cè)值(P=0.00)。在不同單能量圖像間,四個(gè)位置肺結(jié)節(jié)陽(yáng)性預(yù)測(cè)值無(wú)顯著差異。綜上,70 keV及以上單能圖像可以保證對(duì)不同位置的肺結(jié)節(jié)比較穩(wěn)定的檢出敏感性。而40、55 keV圖像在對(duì)對(duì)比度較低的小結(jié)節(jié)進(jìn)行檢測(cè)時(shí),可能有一定的優(yōu)勢(shì)(圖2)。

表2 AI肺結(jié)節(jié)篩查系統(tǒng)在不同單能圖像中檢測(cè)不同位置結(jié)節(jié)的效能情況

表3 AI肺結(jié)節(jié)篩查系統(tǒng)對(duì)不同位置肺結(jié)節(jié)在不同單能圖像中的檢出效能情況

圖2 左肺上葉下舌段實(shí)性結(jié)節(jié)
目前,肺癌已成為國(guó)內(nèi)外發(fā)病率及致死率最高的癌癥。由于臨床大多數(shù)肺癌患者就診時(shí)已處于晚期階段,術(shù)后5年生存率不足10%[9],所以早期診斷對(duì)提高患者生存率至關(guān)重要。胸部CT平掃是進(jìn)行肺癌篩查的最常規(guī)手段。早期肺癌多表現(xiàn)為肺部結(jié)節(jié),它們尺寸小、對(duì)比度低、形狀異質(zhì)化高[10],使結(jié)節(jié)的檢出存在很多挑戰(zhàn)。能譜CT成像能夠獲取40~140 keV不同的X線能量的單能量圖像,低keV單能量圖像上肺結(jié)節(jié)CT值高,不同組織結(jié)構(gòu)之間的對(duì)比增強(qiáng),但噪聲增加;而高keV單能量圖像上肺結(jié)節(jié)CT值降低,不同組織結(jié)構(gòu)之間的對(duì)比降低,同時(shí)噪聲降低;不同單能量圖像的圖像特點(diǎn)可能為不同類型的肺結(jié)節(jié)檢出提供更多的信息。本研究將能譜胸部CT平掃不同單能量圖像應(yīng)用于人工智能系統(tǒng),測(cè)試在圖像的CT值、對(duì)比度及噪聲等圖像細(xì)節(jié)發(fā)生變化時(shí)(即不同keV單能量圖像),對(duì)肺結(jié)節(jié)檢出率的影響。這在之前未見(jiàn)相關(guān)文獻(xiàn)報(bào)道。同時(shí)本研究著重考察結(jié)節(jié)位置對(duì)人工智能系統(tǒng)結(jié)節(jié)檢出的影響。
本研究中,人工智能系統(tǒng)對(duì)40 keV圖像的結(jié)節(jié)檢出率(74.56%)顯著低于其余單能圖像組,其中70 keV圖像檢出的真陽(yáng)性結(jié)節(jié)最多,具有最高的結(jié)節(jié)檢出敏感性(96.43%)。一項(xiàng)針對(duì)胸部雙能CT孤立性肺結(jié)節(jié)成像研究表明[11],70 keV時(shí)圖像信噪比與對(duì)比噪聲比最高,選擇60 keV以上單能譜圖像可提高孤立性肺結(jié)節(jié)的檢出率。以往的許多研究顯示,70 keV圖像信噪比高,有利于實(shí)質(zhì)臟器接近等密度小病灶的發(fā)現(xiàn)和檢出,這在一定程度上解釋了本研究中70 keV單能量圖像相比其他單能量組,檢出的真陽(yáng)性結(jié)節(jié)數(shù)最多。此外,一項(xiàng)針對(duì)肺部圖像數(shù)據(jù)庫(kù)聯(lián)盟的綜述總結(jié)了2017—2018年使用深度學(xué)習(xí)算法對(duì)肺結(jié)節(jié)檢出的22項(xiàng)研究,結(jié)節(jié)檢出的敏感性在83.1%~96.6%[12],本研究中是在臨床環(huán)境中驗(yàn)證商品化AI肺結(jié)節(jié)篩查系統(tǒng)的效能,其結(jié)節(jié)檢出的敏感性依舊有很好的表現(xiàn),在70 keV單能圖像中達(dá)到96.43%。
當(dāng)前,人工智能系統(tǒng)在表現(xiàn)出結(jié)節(jié)檢出高敏感性的同時(shí),也伴隨著較高的假陽(yáng)性率的問(wèn)題。在本研究中,隨著keV增加,檢出結(jié)節(jié)數(shù)增加,檢出假陽(yáng)性結(jié)節(jié)也呈增加的趨勢(shì),導(dǎo)致假陽(yáng)性率的增加(3.77~5.07),最終引起陽(yáng)性預(yù)測(cè)值逐漸降低。這可能是由于隨著keV的增加,雖然圖像的對(duì)比度降低,但是圖像的層次增加,人工智能系統(tǒng)從豐富的圖像層次中可以提取到更細(xì)微的特征,從而導(dǎo)致檢出結(jié)節(jié)的增加,假陽(yáng)性率的增加。對(duì)比以往17項(xiàng)人工智能系統(tǒng)研究,AI系統(tǒng)的假陽(yáng)性率的中位數(shù)是每掃描4.1個(gè)[4],我們使用的AI系統(tǒng)假陽(yáng)性率是每掃描3.77~5.07個(gè),基本與之前的研究持平。
此外,本研究發(fā)現(xiàn)不同單能量圖像對(duì)不同位置的肺結(jié)節(jié)的檢出敏感性沒(méi)有差異,這與Marten等[13]的研究發(fā)現(xiàn)一致,結(jié)節(jié)位置對(duì)CAD系統(tǒng)或放射醫(yī)師對(duì)結(jié)節(jié)的檢出沒(méi)有顯著影響。但也有研究提出相反的結(jié)果。一項(xiàng)檢查肺結(jié)節(jié)位置對(duì)檢出率影像的研究將肺結(jié)節(jié)分為3組:對(duì)孤立性結(jié)節(jié)的檢出敏感性為97.4%,近胸膜結(jié)節(jié)為92.3%,近血管結(jié)節(jié)為94.1%[14]。大多數(shù)未被檢出的結(jié)節(jié)位于近胸膜或近血管,因?yàn)檫@些結(jié)節(jié)與周圍的軟組織結(jié)構(gòu)可能不能輕易的分辨。研究結(jié)果的不一致可能與所采用的AI系統(tǒng)、訓(xùn)練樣本及研究對(duì)象、肺結(jié)節(jié)大小等不同有關(guān)。此外,我們發(fā)現(xiàn)在不同單能圖像組中,支氣管血管樹(shù)旁結(jié)節(jié)陽(yáng)性預(yù)測(cè)值顯著低于肺內(nèi)帶、肺外帶及胸膜下結(jié)節(jié)。這一結(jié)果說(shuō)明肺結(jié)節(jié)檢出的敏感性沒(méi)有受到結(jié)節(jié)位置的影響,而支氣管血管樹(shù)旁較肺內(nèi)外帶及胸膜下檢出了較多的假陽(yáng)性結(jié)節(jié)。一些假陽(yáng)性結(jié)節(jié)和真正的肺結(jié)節(jié)在形態(tài)學(xué)的表現(xiàn)上非常相似,這可能是導(dǎo)致肺結(jié)節(jié)識(shí)別假陽(yáng)性率高的原因之一。而在本研究中,近血管支氣管旁的假陽(yáng)性結(jié)節(jié)數(shù)目最多,這一結(jié)果也被許多研究證實(shí)。Li等[8]研究表明,DL-CAD引起假陽(yáng)性結(jié)節(jié)的最常見(jiàn)的5種原因包括:正常肺血管、胸膜結(jié)節(jié)和增厚、肺門、纖維化和偽影。一項(xiàng)關(guān)于減少假陽(yáng)性結(jié)節(jié)檢出的算法研究指出,對(duì)于量化脊柱異常來(lái)說(shuō)很重要的骨刺,常被認(rèn)為是假陽(yáng)性結(jié)節(jié),其他典型的假陽(yáng)性結(jié)節(jié)包括結(jié)節(jié)樣組織、大血管、縱膈組織和瘢痕等[15]。因此,如何減少近血管旁的假陽(yáng)性結(jié)節(jié)是人工智能系統(tǒng)仍需努力的方向,充滿挑戰(zhàn)。
對(duì)于不同位置的肺部結(jié)節(jié),70 keV及以上單能圖像對(duì)不同位置的肺結(jié)節(jié)表現(xiàn)出比較穩(wěn)定的檢出敏感性。而40及55 keV圖像對(duì)對(duì)比度較低的小結(jié)節(jié)可能有一定的優(yōu)勢(shì)(圖2)。70 keV及以上圖像因?yàn)槠湄S富的圖像層次使AI系統(tǒng)能提取到更多信息,尤其70 keV圖像,因?yàn)槠湫旁氡燃皩?duì)比噪聲比較好,可取得最好的結(jié)節(jié)檢出敏感性,因此是本研究中最優(yōu)單能圖像。
本研究的局限性在于:樣本數(shù)量有限,肺內(nèi)帶結(jié)節(jié)為34個(gè),支氣管血管樹(shù)旁結(jié)節(jié)為41個(gè),今后應(yīng)擴(kuò)大樣本量,對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行進(jìn)一步驗(yàn)證。
能譜CT中70 keV單能圖像能使AI肺結(jié)節(jié)篩查系統(tǒng)獲得較高檢測(cè)敏感性、較低假陽(yáng)性率以及較高陽(yáng)性預(yù)測(cè)值,因此是適合該AI系統(tǒng)的最優(yōu)單能量圖像。而在不同單能量圖像中,結(jié)節(jié)位置對(duì)人工智能系統(tǒng)結(jié)節(jié)檢出沒(méi)有顯著影響。此外,肺血管誤認(rèn)是假陽(yáng)性結(jié)節(jié)產(chǎn)生的最主要原因之一。