姚陽(yáng)陽(yáng) 梁長(zhǎng)華 韓東明 崔俊偉 潘犇 王慧慧 魏正琦 甄思雨 危涵羽
結(jié)核病是僅次于新型冠狀病毒感染的第二大致死性傳染病,位列全球死因第13位,中國(guó)結(jié)核病負(fù)擔(dān)僅低于印度和印度尼西亞,位居第三[1]。非結(jié)核分枝桿菌(nontuberculous mycobacteria,NTM)系指除結(jié)核分枝桿菌復(fù)合群和麻風(fēng)分枝桿菌以外的一大類(lèi)分枝桿菌的總稱[2],NTM感染肺部而引起的肺病稱為(nontuberculous mycobacteria pulmonary disease,NTM-PD)。NTM-PD與肺結(jié)核(pulmonary tuberculosis,PTB)依靠痰涂片難以準(zhǔn)確區(qū)分[3],分枝桿菌培養(yǎng)是診斷NTM-PD的金標(biāo)準(zhǔn),而分枝桿菌培養(yǎng)需要2~6周,NTM-PD患者很容易錯(cuò)過(guò)最佳治療時(shí)機(jī),因此,亟需一種快速、有效的方法鑒別這兩種疾病。空洞是PTB與NTM-PD的常見(jiàn)影像征象,并且這兩種疾病空洞的病理差異已經(jīng)得到證實(shí)[4]。近年來(lái),影像組學(xué)通過(guò)高通量提取挖掘數(shù)據(jù)特征,在肺部疾病的診斷和鑒別診斷中顯示出巨大的潛力[5-6],可能為鑒別NTM-PD與PTB提供一種可行的方法。本研究旨在聯(lián)合臨床特征與影像組學(xué)開(kāi)發(fā)出一種能方便、快速、準(zhǔn)確鑒別NTM-PD與PTB的方法,為NTM-PD與PTB的診療提供幫助。
選擇2019年1月1日至2023年3月31日河南省新鄉(xiāng)醫(yī)學(xué)院第一附屬醫(yī)院收治的經(jīng)分枝桿菌培養(yǎng)確診為NTM-PD和PTB的患者,共133例。根據(jù)分枝桿菌培養(yǎng)結(jié)果分為NTM-PD組(58例)與PTB組(75例)。收集所有患者治療前的臨床數(shù)據(jù)及胸部CT掃描圖像。以空洞性病灶作為研究對(duì)象進(jìn)行提取影像組學(xué)特征并建立影像組學(xué)模型,共200個(gè)病灶被納入研究(NTM-PD:97個(gè),PTB:103個(gè)),然后將所有病灶按照7∶3比例隨機(jī)分為訓(xùn)練集和測(cè)試集。
納入標(biāo)準(zhǔn):(1)經(jīng)痰標(biāo)本或支氣管肺泡灌洗液培養(yǎng)確診為PTB/NTM-PD的患者;(2)年齡≥18歲;(3)CT圖像中存在空洞病灶;(4)臨床資料及影像資料完整。排除標(biāo)準(zhǔn):(1)存在其他肺部疾病的患者;(2)PTB并發(fā)NTM-PD的患者;(3)合并HIV感染或糖尿病的患者;(4)存在其他惡性腫瘤的患者。
1.一般資料:收集患者性別、年齡、體質(zhì)量指數(shù)(body mass index,BMI)、臨床癥狀(發(fā)熱、盜汗、咳嗽、咳痰、乏力、胸痛、咯血、體質(zhì)量減輕)、分枝桿菌培養(yǎng)結(jié)果。
2.實(shí)驗(yàn)室檢查:γ-干擾素釋放試驗(yàn)(interferon-γ release assays,IGRA)采用結(jié)核感染T細(xì)胞酶聯(lián)免疫斑點(diǎn)試驗(yàn)進(jìn)行檢測(cè),使用英國(guó)Oxford Immunotec公司的T-SPOT.TB試劑盒于4 h內(nèi)完成檢測(cè),過(guò)程嚴(yán)格遵照說(shuō)明書(shū)進(jìn)行,后使用 ELISPOT 讀板儀(美國(guó) CTL公司) 經(jīng)酶聯(lián)免疫斑點(diǎn)系統(tǒng)讀取并記錄斑點(diǎn)數(shù)。結(jié)核抗體使用膠體金法進(jìn)行檢測(cè),試劑盒由北京健乃喜生物科技有限公司提供,檢測(cè)步驟嚴(yán)格遵循試劑配套說(shuō)明書(shū)進(jìn)行。
3.胸部CT檢查:采用東芝 Aquilion ONE 320 排 CT 或東芝 Aquilion 64 排 CT 設(shè)備行常規(guī)胸部檢查。掃描范圍:從肺尖掃描至橫膈水平;掃描條件:管電壓為100~120 kV,管電流采用自動(dòng)毫安技術(shù),掃描層厚5~8 mm,重建層厚0.625~1.25 mm,螺距為1,矩陣為512×512。
4.感興趣區(qū)(ROI)勾畫(huà)及影像組學(xué)特征提取:影像組學(xué)流程如圖1所示。首先由兩名不同經(jīng)驗(yàn)(分別具有3年和7年影像診斷經(jīng)驗(yàn))的放射科醫(yī)師使用3D slicer 4.11 軟件在1 mm薄層CT肺窗圖像上沿空洞病灶的邊緣(避開(kāi)大血管和支氣管)進(jìn)行逐層勾畫(huà)ROI,最后自動(dòng)生成感興趣體積(VOI),如圖2所示。使用3D slicer軟件對(duì)所有VOI進(jìn)行1 mm×1 mm×1 mm 重采樣,以減少不同CT掃描設(shè)備之間的差異對(duì)結(jié)果造成的影響。然后使用3D slicer軟件在VOI中提取影像組學(xué)特征,包括一階特征、形態(tài)特征、紋理特征,以及小波變換、拉普拉斯變換,共計(jì)1037個(gè)特征。

圖1 影像組學(xué)流程圖

注 圖a~c:患者,女,34歲,肺結(jié)核。圖b可見(jiàn)左肺下葉空洞,圖b可見(jiàn)空洞病灶感興趣區(qū),圖c可見(jiàn)分割后的空洞病灶體積;圖d~f:患者,男,34歲,非結(jié)核分枝桿菌肺病。圖d可見(jiàn)右肺上葉空洞,圖e可見(jiàn)空洞病灶感興趣區(qū),圖f可見(jiàn)分割后的空洞病灶體積
5.特征篩選及模型構(gòu)建:(1)首先,對(duì)納入患者的一般資料進(jìn)行單因素邏輯回歸分析,然后將兩組間差異有統(tǒng)計(jì)學(xué)意義的臨床特征進(jìn)行多因素邏輯回歸分析,篩選出鑒別NTM-PD與PTB的獨(dú)立預(yù)測(cè)因素,然后使用邏輯回歸分類(lèi)器建立臨床模型;(2)使用R語(yǔ)言軟件(4.3.0版本)對(duì)影像組學(xué)特征數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化,然后隨機(jī)挑選出30例患者進(jìn)行組間一致性(intraclass correlation coefficient,ICC)分析;(3)分兩步對(duì)影像組學(xué)特征進(jìn)行降維。第一步使用最小冗余最大相關(guān)性(minimum redundancy maximum relevance,MRMR)算法,第二步使用最小絕對(duì)收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)通過(guò)10次交叉驗(yàn)證對(duì)上一步降維結(jié)果進(jìn)行進(jìn)一步篩選(圖3,4);然后使用邏輯回歸分類(lèi)器將篩選出的影像組學(xué)特征建立影像組學(xué)模型;(4)將差異有統(tǒng)計(jì)學(xué)意義的臨床特征與影像組學(xué)特征進(jìn)行結(jié)合,使用邏輯回歸分類(lèi)器建立聯(lián)合模型。

圖3 影像組學(xué)特征LASSO回歸系數(shù)

圖4 非零系數(shù)的最佳影像組學(xué)特征圖
6.模型診斷效能評(píng)估:繪制受試者工作特征曲線(ROC)及校準(zhǔn)曲線,分析不同模型的曲線下面積(AUC)、敏感度、特異度、準(zhǔn)確率,評(píng)估臨床模型、影像組學(xué)模型及聯(lián)合模型的診斷性能。

在NTM-PD患者中,胞內(nèi)分枝桿菌感染38例(66.52%),堪薩斯分枝桿菌感染13例(22.41%),鳥(niǎo)分枝桿菌感染4例(6.70%),偶然分枝桿菌感染2例(3.45%),淺黃分枝桿菌感染1例(1.72%)。PTB患者與NTM-PD患者的臨床特征單因素分析結(jié)果見(jiàn)表1。PTB組的年齡明顯小于NTM-PD組(P<0.001),而PTB組的BMI明顯大于NTM-PD組(P=0.015),PTB組IGRA陽(yáng)性率(73.33%)明顯高于NTM-PD組(27.59%),差異均有統(tǒng)計(jì)學(xué)意義(P值均<0.05)。而性別、吸煙史、飲酒史、結(jié)核抗體檢測(cè)結(jié)果、臨床癥狀(發(fā)熱、盜汗、咳嗽、咳痰、咯血、胸痛、乏力、體質(zhì)量減輕)在兩組間差異均無(wú)統(tǒng)計(jì)學(xué)意義。然后將年齡、BMI及IGRA進(jìn)行多因素邏輯回歸分析(表2),結(jié)果表明,年齡和IGRA在兩組間的差異均有統(tǒng)計(jì)學(xué)意義,均是鑒別PTB與NTM-PD的獨(dú)立預(yù)測(cè)因素。

表1 肺結(jié)核與非結(jié)核分枝桿菌肺病患者臨床特征單因素分析

表2 肺結(jié)核與非結(jié)核分枝桿菌肺病患者臨床特征多因素logistic回歸分析
將年齡及IGRA結(jié)果納入臨床模型,模型在訓(xùn)練集中的AUC值、敏感度、特異度及準(zhǔn)確率分別為0.832、89.04%、72.46%、80.99%,在測(cè)試集中的AUC值、敏感度、特異度及準(zhǔn)確率分別為0.800、85.29%、67.86%、77.42%。2名放射科醫(yī)生提取的影像組學(xué)特征具有良好的一致性。1037個(gè)影像組學(xué)特征通過(guò)第一步MRMR篩選后,選取20個(gè)特征,第二步通過(guò)LASSO算法對(duì)MRMR篩選出的20個(gè)特征進(jìn)行進(jìn)一步篩選,最終篩選出10個(gè)影像組學(xué)特征(圖5)用于構(gòu)建影像組學(xué)模型。該模型在訓(xùn)練集中的AUC值、敏感度、特異度及準(zhǔn)確率分別為0.974、91.78%、95.65%、93.66%,在測(cè)試集中AUC值、敏感度、特異度及準(zhǔn)確率分別為0.939、97.06%、82.14%、90.32%。將年齡、IGRA結(jié)果及10個(gè)影像組學(xué)特征結(jié)合構(gòu)建聯(lián)合模型,該模型在訓(xùn)練集中的AUC值、敏感度、特異度及準(zhǔn)確率分別為0.993、100.00%、91.30%、95.77%,在測(cè)試集中AUC值、敏感度、特異度及準(zhǔn)確率分別為0.995、94.12%、100.00%、96.77%。影像組學(xué)模型診斷性能優(yōu)于臨床模型,而聯(lián)合模型優(yōu)于影像組學(xué)模型和臨床模型,獲得了最高的診斷性能。具體見(jiàn)表3。各個(gè)模型在訓(xùn)練集和測(cè)試集中的ROC曲線如圖6、7所示。校準(zhǔn)曲線(圖8,9)顯示,聯(lián)合模型在訓(xùn)練集和測(cè)試集中的預(yù)測(cè)概率與實(shí)際概率相近,對(duì)PTB與NTM-PD具有良好的鑒別診斷能力。

表3 臨床模型、影像組學(xué)模型、聯(lián)合模型診斷性能分析

圖5 影像組學(xué)模型中影像組學(xué)特征重要度

圖6 訓(xùn)練集受試者工作特征曲線

圖7 測(cè)試集受試者工作特征曲線

圖8 訓(xùn)練集校準(zhǔn)曲線比較

圖9 測(cè)試集校準(zhǔn)曲線比較
DeLong檢驗(yàn)結(jié)果顯示,臨床模型與影像組學(xué)模型在訓(xùn)練集中的AUC值差異有統(tǒng)計(jì)學(xué)意義(Z=3.797,P<0.001),臨床模型與聯(lián)合模型在訓(xùn)練集中的AUC值差異有統(tǒng)計(jì)學(xué)意義(Z=-4.832,P<0.001),而影像組學(xué)模型與聯(lián)合模型在訓(xùn)練集的AUC值差異無(wú)統(tǒng)計(jì)學(xué)意義(Z=-1.956,P=0.050)。
PTB與NTM-PD臨床表現(xiàn)相似,包括低熱、咳嗽、體質(zhì)量減輕等癥狀,且二者影像學(xué)表現(xiàn)具有很大重疊,因此很難將二者區(qū)分[7],細(xì)菌培養(yǎng)是鑒別結(jié)核分枝桿菌與NTM感染診斷的金標(biāo)準(zhǔn),但細(xì)菌培養(yǎng)需要2~6周才能得出結(jié)果,而在此期間大多數(shù)NTM-PD患者會(huì)接受經(jīng)驗(yàn)性抗結(jié)核治療,由于二者治療方案不同,使得NTM-PD患者錯(cuò)過(guò)最佳治療時(shí)機(jī),導(dǎo)致疾病進(jìn)一步發(fā)展[8-9]。IGRA通過(guò)檢測(cè)T細(xì)胞對(duì)2種結(jié)核分枝桿菌特異性抗原ESAT-6和CFP-10產(chǎn)生的γ-干擾素發(fā)揮作用,這2種抗原的基因位于結(jié)核分枝桿菌與NTM的基因差異區(qū)域(Rd1),大多數(shù)NTM無(wú)此區(qū)域[10]。盡管有一些NTM存在與結(jié)核分枝桿菌相同的Rd1區(qū)域,如堪薩斯分枝桿菌和蘇爾加分枝桿菌,可能會(huì)導(dǎo)致IGRA陽(yáng)性結(jié)果,但這些菌株并不是NTM感染的優(yōu)勢(shì)菌種[11],因此,這種方法仍然可以區(qū)分大多數(shù)NTM-PD和PTB。并且IGRA可以在1~2 d內(nèi)得到結(jié)果,因此IGRA可以在疾病早期對(duì)NTM-PD和PTB進(jìn)行快速診斷。在本研究中,PTB組IGRA陽(yáng)性率明顯高于NTM-PD組,這與既往研究結(jié)果一致[12]。
此外,NTM-PD組的年齡明顯高于PTB組,這可能是因?yàn)镹TM是一類(lèi)機(jī)會(huì)致病菌,感染NTM的患者發(fā)病往往是由于患者年齡增大,機(jī)體免疫力降低所致。中國(guó)是結(jié)核病高負(fù)擔(dān)國(guó)家,約40%的人口IGRA結(jié)果呈陽(yáng)性[13],不明原因的并發(fā)結(jié)核分枝桿菌潛伏感染會(huì)影響患者的IGRA結(jié)果。在IGRA的自身局限性和中國(guó)人群發(fā)病特征的共同影響下,使得臨床模型在鑒別NTM-PD和PTB中的表現(xiàn)稍弱于影像組學(xué)模型。即便如此,臨床模型在訓(xùn)練集和測(cè)試集中的AUC值仍然達(dá)到了0.832和0.800,表明該模型具有較高的診斷性能,可以在疑似NTM-PD或PTB的人群中進(jìn)行快速的篩查。
影像組學(xué)是近年發(fā)展起來(lái)的無(wú)創(chuàng)、客觀的圖像分析工具,其通過(guò)計(jì)算機(jī)算法挖掘出CT、MRI、PET等圖像中的深層信息,從而反映出病灶間的異質(zhì)性。Yan等[14]對(duì)提取CT圖像中空洞病灶的影像組學(xué)特征,使用6種機(jī)器學(xué)習(xí)分類(lèi)器(K近鄰、支持向量機(jī)、極度梯度提升算法、隨機(jī)森林、邏輯回歸和決策樹(shù))分別建立6個(gè)影像組學(xué)模型,結(jié)果表明,在訓(xùn)練集中,6個(gè)模型的AUC值均>0.98,在驗(yàn)證集中,6個(gè)模型的AUC值均>0.85,在外部驗(yàn)證集中,6個(gè)模型的AUC值均>0.84。其中,邏輯回歸分類(lèi)器建立的影像組學(xué)模型相較于其他影像組學(xué)模型診斷性能最好,在訓(xùn)練集、驗(yàn)證集和外部驗(yàn)證集中AUC值分別為0.99、0.98和0.95。本研究參考Yan等[14]的研究結(jié)果,使用邏輯回歸分類(lèi)器構(gòu)建影像組學(xué)模型,該模型的診斷性能與既往研究結(jié)果基本一致。此外,在本研究中加入臨床因素構(gòu)建了聯(lián)合模型,使得模型診斷性能得到了進(jìn)一步的提升,能夠更加準(zhǔn)確地鑒別NTM-PD和PTB。而既往相關(guān)的研究中均是單純研究影像組學(xué)模型在鑒別NTM-PD 和PTB的表現(xiàn),本研究第一次進(jìn)行了影像組學(xué)特征與臨床特征相結(jié)合的嘗試,試驗(yàn)結(jié)果也證明了聯(lián)合模型優(yōu)秀的診斷性能。盡管NTM-PD和PTB僅依靠胸部CT檢查難以鑒別,但是二者之間的影像學(xué)表現(xiàn)仍存在差異。既往研究表明,NTM-PD組薄壁空洞、支氣管擴(kuò)張及小葉中心性結(jié)節(jié)較PTB組增多,而厚壁空洞、肺實(shí)變、肺不張、肺毀損、肺體積縮小、肺內(nèi)鈣化、肺門(mén)縱隔淋巴結(jié)鈣化、腺泡結(jié)節(jié)、胸膜增厚、胸腔積液均較PTB組少[15],這表明CT征象對(duì)于鑒別具有重要作用。在既往的研究中,大多是對(duì)臨床特征和CT表現(xiàn)單獨(dú)進(jìn)行研究,而將二者結(jié)合進(jìn)行分析卻少有報(bào)道,將臨床特征、CT征象及CT影像組學(xué)特征進(jìn)行結(jié)合構(gòu)建的聯(lián)合模型可能具有更高的診斷性能,具有更好的臨床適用性,這需要在后續(xù)的研究中進(jìn)行驗(yàn)證。
Ying等[16]將T-SPOT.TB與深度學(xué)習(xí)模型結(jié)合后產(chǎn)生了更好的結(jié)果,當(dāng)兩種方法的預(yù)測(cè)一致時(shí),大大提高了鑒別診斷的準(zhǔn)確性。本研究中將臨床特征與影像組學(xué)特征結(jié)合構(gòu)建了聯(lián)合模型,該模型的診斷性能在訓(xùn)練集和驗(yàn)證集中的AUC值均高于臨床模型與影像組學(xué)模型,這與Ying等[16]的研究結(jié)果是一致的,但是,DeLong檢驗(yàn)結(jié)果顯示影像組學(xué)模型與聯(lián)合模型在訓(xùn)練集的AUC值差異無(wú)統(tǒng)計(jì)學(xué)意義,這可能是因?yàn)橛跋窠M學(xué)模型的性能已經(jīng)很好,影像組學(xué)模型的提升空間十分有限,使得加入臨床特征后對(duì)于診斷性能的提升不明顯。與既往研究不同的是,Ying等[16]將T-SPOT.TB與深度學(xué)習(xí)進(jìn)行綜合分析,但并沒(méi)有構(gòu)建聯(lián)合模型,而本研究不僅加入了IGRA結(jié)果,還對(duì)年齡、性別、結(jié)核抗體檢測(cè)結(jié)果及結(jié)核病典型臨床癥狀進(jìn)行分析。聯(lián)合模型的診斷性能優(yōu)于任意一種單獨(dú)模型,這表明臨床特征與影像組學(xué)特征結(jié)合構(gòu)建模型能夠提升診斷性能,對(duì)于鑒別NTM-PD和PTB具有重要意義。
本研究還有一定的局限性:首先,這是一項(xiàng)單中心研究,樣本量較小,未來(lái)還需要在多中心、大樣本的研究中進(jìn)一步驗(yàn)證模型的性能;其次,本研究只針對(duì)空洞病灶進(jìn)行研究,而對(duì)于結(jié)節(jié)、樹(shù)芽征等其他CT征象并未進(jìn)行研究,未來(lái)需要對(duì)各種病灶進(jìn)行全面研究來(lái)驗(yàn)證該模型的臨床適用性;最后,本研究中使用手動(dòng)勾畫(huà)ROI的方法,不可避免地產(chǎn)生一些微小偏差,而自動(dòng)分割的方法可能會(huì)提高勾畫(huà)ROI的準(zhǔn)確性,這需要在未來(lái)的研究中進(jìn)一步探索。
綜上所述,臨床特征與影像組學(xué)特征對(duì)鑒別NTM-PD和PTB方面具有重要作用,結(jié)合臨床特征和影像組學(xué)特征的聯(lián)合模型是一種無(wú)創(chuàng)、方便、快捷的診斷方法,在鑒別NTM-PD與PTB方面展示出了優(yōu)秀的診斷性能,為NTM-PD與PTB的臨床診療提供了幫助。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻(xiàn)姚陽(yáng)陽(yáng):設(shè)計(jì)實(shí)驗(yàn)、實(shí)施研究、采集數(shù)據(jù)、分析/解釋數(shù)據(jù)、文章撰寫(xiě)、統(tǒng)計(jì)分析;梁長(zhǎng)華:設(shè)計(jì)實(shí)驗(yàn)、實(shí)施研究、分析/解釋數(shù)據(jù)、論文審閱修訂、統(tǒng)計(jì)分析、指導(dǎo)、行政/材料/技術(shù)支持;韓東明:設(shè)計(jì)實(shí)驗(yàn)、實(shí)施研究、論文審閱修訂、行政/材料/技術(shù)支持、指導(dǎo);崔俊偉:設(shè)計(jì)實(shí)驗(yàn)、論文審閱修訂、指導(dǎo)、行政/材料/技術(shù)支持;潘犇:設(shè)計(jì)實(shí)驗(yàn)、實(shí)施研究、采集數(shù)據(jù)、分析/解釋數(shù)據(jù)、統(tǒng)計(jì)分析;王慧慧、魏正琦、甄思雨和危涵羽:實(shí)施研究、采集數(shù)據(jù)、分析/解釋數(shù)據(jù)、統(tǒng)計(jì)分析