孟令思,趙帥,郭君武
潰瘍性結腸炎(ulcerative colitis,UC)是一種病因和發(fā)病機制尚未明確的慢性非特異性炎癥,發(fā)病時常累及結腸和直腸,以青壯年時期發(fā)病較多見,其病程以緩解和復發(fā)為特征[1]。隨著病程的延長和病情的加重,UC患者可逐漸出現大出血、穿孔等嚴重并發(fā)癥,甚至可發(fā)生癌變。我國流行病學調查結果顯示,UC患者發(fā)生癌變的概率高達0.8%[2-3]。準確評估患者病情的活動度對臨床制訂合理的治療方案和準確評估療效有重要指導意義,對延緩病情進展、預防并發(fā)癥的發(fā)生至關重要。
根據我國炎癥性腸病診斷與治療的共識意見,采用改良的Mayo臨床評分方法對UC患者的疾病進展情況進行評估,并可根據評分將病變程度分為輕度、中度和重度[4]。這種評分方法中需要結合腸鏡檢查結果,腸鏡可對病灶部位直接成像,同時可取樣進行活檢,但是對于重度UC患者,腸鏡檢查有導致腸道穿孔和病情加重的風險[5-6],而且腸鏡為有創(chuàng)性檢方法,患者接受程度較低。CT腸道成像(computed tomography enterography,CTE)具有較高的組織對比度,成像速度較快且無侵襲性,可同時顯示腸壁和腸腔,且可反復檢查,無腸鏡檢查的各種并發(fā)癥,目前CTE已經廣泛應用于炎性腸病的輔助診斷[7]。已有研究者利用CTE表征構建CTE得分系統(tǒng)來評估患者的Mayo分組,但評估過程相對較繁瑣[8]。
人工智能尤其是醫(yī)學影像人工智能的興起,可進行疾病的初篩工作,從而可減輕影像科醫(yī)師的臨床工作負荷[9]。目前隨機森林方法已經廣泛應用于疾病影像的分類學習,如治療前疾病分期和良惡性病變的鑒別等。隨機森林存在分類較弱等缺點,可利用多個分類器如梯度提升機(gradient boosting machine,GBM)分類器以多個隨機森林作為基分類器,優(yōu)化對疾病評估所需的圖像特征,提高總分類器的分類效能,減少臨床工作量。
因此本研究嘗試基于CTE征象利用GBM分類器構建診斷模型來預測UC患者的病變程度(基于Mayo評分),旨在為臨床提供一種有助于UC患者病情評估和精準化治療的無創(chuàng)性智能評估方法。
本組研究為回顧性分析,納入本院2017年9月-2020年9月臨床首診為UC的患者共計223例。患者入組標準:①結合臨床癥狀和結腸鏡檢查確診為UC;②患者于結腸鏡檢后7日內接受CTE檢查,且由本科室診斷醫(yī)師對CT圖像質量進行評估,圖像質量能滿足診斷要求(圖像上腸腔內容物較少、對比劑充盈或大部分充盈、腸壁顯示清晰);③滿足中華醫(yī)學會消化病學分會炎癥性腸病學組制定的UC診斷標準[4]。篩除標準:①心、肺和腎等重要臟器功能不全;②有碘對比劑過敏史;③有胃腸道手術史;④妊娠或哺乳期患者;⑤CT圖像質量不符合診斷要求;⑥患者不同意入組。本研究中最終納入157例UC患者,剔除66例。
本研究獲得鄭州大學第二附屬醫(yī)院倫理委員會批準,入組患者均簽署知情同意書。
綜合關于UC治療和診斷的歐洲及國內各種共識[4,10,11],采用改良后Mayo評分系統(tǒng),由兩位具有5~10年臨床診斷經驗的消化科醫(yī)師基于單盲原則對UC患者進行獨立評分,最終取兩者的平均值作為患者的Mayo評分,總得分為3~5分為輕度UC,6~10分為中度UC,11~12分為重度UC。
患者均于腸鏡檢查后7日內行CTE檢查,使用Siemens Somatom Definition Flash雙源CT機進行平掃及雙期增強掃描。患者于檢查前1日采用低渣飲食且口服番瀉葉水清潔腸道,檢查當日禁食早餐。CTE掃描前1 h,患者每15 min口服2.5%甘露醇溶液300~400 mL,總量1200~1600 mL。CTE掃描前10 min肌肉注射20 mg山莨菪堿。掃描時患者取仰臥位,掃描范圍自隔頂至恥骨聯合水平。采用智能觸發(fā)掃描,將腹主動脈作為觸發(fā)點,觸發(fā)閾值為100 HU。掃描參數:120 kV,200~250 mAs,掃描層厚5.0 mm,螺距0.6, 0.5 s/r,視野380 mm×380 mm,矩陣512×512,重建層厚1.0 mm。采用雙筒高壓注射器經肘靜脈注射碘海醇(350 mg I/mL),劑量1.0~1.2 mL/kg,注射流率4.0 mL/s。在實際臨床工作中,在檢查前患者可能因腸道功能障礙等原因無法進行有效的導瀉和灌腸清潔,導致物理結腸準備不足(圖1),因此患者CTE檢查后,需由診斷醫(yī)師對圖像質量進行評估,對腸內殘留物、腸道擴張程度和圖像偽影三個方面進行評分,將每項得分≥3的患者納入本研究[11]。

圖1 潰瘍性結腸炎的主要CTE征象。a)男,16歲,輕度UC,增強掃描靜脈期示結腸腸壁增厚、腸壁異常強化(箭);b)男,33歲,輕度UC,增強掃描靜脈期示腸壁增厚、黏膜分層(箭);c)男,37歲,重度UC,靜脈期增強掃描示橫結腸腸腔狹窄(短箭)、結腸袋消失(長箭);d)男,37歲,靜脈期增強掃描示直腸周圍脂肪沉積(長箭)、腸系膜充血(短箭);e)男,37歲,UC,靜脈期增強掃描顯示淋巴結增大(箭頭)、直腸壁內黏膜囊泡(短箭)和靶征(長箭);f)男,43歲,重度UC,冠狀面MIP圖像示梳齒征(箭);g)女,35歲,中度UC,增強動脈期冠狀面重組圖像示結腸袋消失(箭);h)女,35歲,中度UC,增強動脈期矢狀面重組圖像示腸壁增厚、腸壁異常強化及腸黏膜息肉(箭)。
將所有患者的圖像傳輸至PACS。由兩位分別具有5和10年診斷經驗的放射科醫(yī)師在單盲原則下進行閱片,觀察并記錄以下13個CTE征象(結果以陽性和陰性來記錄)。a)病變范圍分為E1(直腸乙狀結腸交界處的直腸炎)、E2(脾曲下方的左側結腸炎)和E3(脾曲上方廣泛性結腸炎)三個級別[12-14];b)腸壁增厚厚度:腸管在擴張良好時厚度>4 mm即為增厚,并測量腸壁增厚的厚度值[15];c)黏膜分層:即腸壁環(huán)形增厚,表現為腸壁低密度環(huán)形影[15];d)腸壁異常強化:在增強掃描圖像上,局部腸壁強化程度明顯高于相鄰的正常腸管[16];e)腸系膜充血:增強后腸系膜 密度增加和腸系膜血管增多;f)直腸周圍脂肪沉積:直腸周圍脂肪沉積導致正常生理狀態(tài)下充盈較好的直腸形態(tài)變扁,直腸左右徑明顯低于前后徑[16];g)淋巴結增大:淋巴結最短直徑>5 mm;h)黏膜囊泡:黏膜下存在含氣囊泡;i)腸腔狹窄:腸管擴張受限,狹窄部位近心端常伴有腸管擴張;j)結腸袋消失:結腸均勻變細,呈鉛管狀改變;k)腸黏膜息肉;l)靶征:腸壁橫斷面呈環(huán)形,可見密度較高的黏膜層和漿膜層,兩者之間為水腫增寬的低密度黏膜下層;m)梳齒征:由與腸壁垂直的增多、增粗的系膜血管形成[14](圖1)。
使用R4.0.3(cran.r-project.org)軟件中的Caret、pROC和Tidyverse工具包進行統(tǒng)計分析。計量資料采用平均值±標準差表示。首先,按照隨機分層的原則將所有患者按照5:5的比例分入訓練集和驗證集,其中訓練組79例、驗證組78例。第二步,基于訓練集中患者的CTE征象參數進行CTE模型構建。為避免最終分類器構建模型的過擬合,先采用Spearman檢驗評估各項CTE征象之間的相關性,并計算每個特征的方差膨脹系數(variance inflation factor,VIF),剔除相關性絕對值高于0.9且VIF>5的特征;繼而采用單因素方差分析(連續(xù)變量資料)或卡方檢驗(分類資料)進行組間比較,僅保留3組間比較P值<0.01的參數,以進一步去除冗余特征。第三步,將篩選后的參數導入GBM分類器中,以隨機森林作為基分類器并組合為多分類器,構建出基于CTE特征的診斷模型。采用受試者工作特征曲線(receiver operating characte-ristic curve,ROC)評估模型對判斷UC病變程度的效能。
157例UC患者基于Mayo評分共分為3組,輕度組40例,中度組52例,重度組65例。三組患者的基本臨床資料、CTE征象及組間比較結果見表1。三組患者的臨床資料中年齡和性別的差異具有統(tǒng)計學意義(P<0.05);三組間CTE征象出現率的差異均具有統(tǒng)計學意義(P<0.05)。

表1 三組UC患者臨床資料和CTE征象的比較
將所有患者隨機分入訓練集和驗證集,兩組之間各項臨床資料和CTE征象的差異均無統(tǒng)計學意義(P>0.05),本次研究中將三種程度的患者采用分層隨機原則分配至訓練組和測試組,當訓練組和測試組相同程度的患者之間的臨床資料和CTE征象無統(tǒng)計學差異,則說明分組結果無偏移性,兩組資料是匹配的。
13個CTE特征的VIF分別為病變范圍2.325、腸壁厚度2.935、黏膜分層2.361、腸壁異常強化5.374、腸系膜充血1.624、直腸周圍脂肪沉積6.370、淋巴結增大5.866、黏膜囊泡1.626、腸腔狹窄=1.567、結腸帶消失3.297、腸黏膜息肉1.313、靶征1.668和梳齒征2.072。采用Spearman檢驗對13個CTE特征之間的相關性進行評估,結果顯示13個特征之間均具有不同程度的相關性(表2、圖2)。其中,腸壁異常強化與腸腔狹窄的相關性|r|=0.932,淋巴結增大與腸腔狹窄的|r|=0.957,直腸周圍脂肪沉積與腸壁異常強化的|r|=0.903,病變范圍與靶征的|r|=0.941,病變范圍與結腸袋消失的|r|=0.978。因此,基于|r|>0.9且VIF>5的原則,將腸壁異常強化、淋巴結增大、直腸周圍脂肪沉積三個CTE特征剔除。

表2 各項CT征象之間的相關性

圖2 13個CTE特征之間的相關性分析圖。編號1~14分別代表腸壁異常強化、病變范圍、腸腔狹窄、直腸周圍脂肪沉積、黏膜分層、靶征、結腸袋消失、腸系膜充血、腸黏膜息肉、黏膜囊泡、梳齒征、淋巴結增大、Mayo評分和腸壁增厚。左下三角形區(qū)域內的各個正方形單元格中,藍色且有從左下指向右上的斜杠表示單元格的橫向和縱向相對應的2個變量之間呈正相關,橘紅色且有從左上指向右下的斜杠表示單元格的橫向與縱向相對應的2個變量之間呈負相關。右上三角形區(qū)域內,各個小圓圈內有自12點鐘方向順時針填充的藍色扇形區(qū)域則為正相關,藍色顏色越深,面積越大,相關性越高;各個小圓圈內有由12點鐘方向逆時針填充的橘紅色區(qū)域為負相關,圈內紅色顏色越淺,面積越小,相關性越高。 圖3 診斷模型預測輕度、中度和重度UC的ROC。a)訓練組;b)驗證組。圖片上注釋框中的0、1和2分別代表輕度、中度和重度,各Res代表對應的二分類變量中的反向變量。
最終篩選出10個CTE特征輸入GBM分類器用于構建分類模型,各征象在評估Mayo分組的診斷模型中的權重系數:腸壁狹窄0.015,腸黏膜息肉0.019,腸系膜充血0.025,靶征0.052,黏膜分層0.054,結腸袋消失0.054,病變范圍0.073,梳齒征0.086,黏膜囊泡 0.301,腸壁厚度1.000。
基于GBM隨機森林分類器構建的診斷模型,鑒別輕度與中度、中度與重度的截斷值分別為0.215和0.291,在訓練集和驗證集中的診斷結果與病理結果的對照見表3~4,診斷輕度、中度和重度UC的效能指標見表5和圖3。

表3 訓練組中診斷模型預測結果與病理結果的對比 /例

表4 在驗證組中診斷模型預測結果與病理結果的對比 /例

表5 診斷模型評估輕度、中度和重度UC的效能
在訓練集中,診斷模型評估不同程度UC的總體診斷符合率為0.921,95%置信區(qū)間為0.8102~0.9553;在驗證集中評估不同程度UC的總體診斷符合率為0.887,95%置信區(qū)間為0.7617~0.9274。
近20余年來,我國UC的發(fā)病率呈快速上升趨勢[2]。本研究中納入157例UC患者,包括輕度40例、中度52例和重度65例;基于CTE圖像,分析每例患者的13個影像特征;將所有患者按照5:5的比例隨機分為訓練組和驗證組,基于訓練組患者的數據資料,經篩選最終保留10個影像特征,輸入以隨機森林為基分類器的GBM分類器中構建基于CTE征象的診斷模型。結果顯示,GBM分類器在訓練組中評估輕度、中度和重度UC的AUC分別為0.99、0.99和1.00,在驗證組中相應的AUC分別為0.99、0.96和0.98。本組結果表明基于CTE特征利用GBM分類器構建的診斷模型對評估UC患者的病變程度(基于Mayo評分)具有較高的診斷效能,敏感度和特異性均較高。
本研究中采用的CTE檢查在臨床上已廣泛應用于UC病情活動度的評估,陳立亞等[17]研究表明,在評估UC患者病情活動度時,CTE評估結果與結腸鏡結果高度相關。然而腸鏡檢查對于潰瘍程度較嚴重的患者,容易造成穿孔、出血等嚴重并發(fā)癥,且無法獲得腸壁信息。CTE具有空間分辨率高、成像速度快、患者耐受較好、能同時評估腸內病變和腸外受累情況等優(yōu)勢[18-19]。
本組研究中基于CTE共提取了13個影像特征,其中10個特征在輕度、中度和重度組之間比較時P值小于0.01,故剔除了其它4個特征,經特征篩選后減少了模型的過擬合。本組研究結果顯示腸壁增厚在輕度、中度和重度組間的差異有統(tǒng)計學意義,且隨著活動度升高,腸壁增厚程度升高,上述結果與Patel等[20]和Jia等[8]的研究結果相符,這一CTE征象有助于指導臨床醫(yī)師準確分析UC患者病變的活動程度,而該信息無法通過腸鏡獲得;而且,本研究結果顯示在GBM分類器構建的模型中腸壁增厚具有較高的權重。腸黏膜息肉,在輕度UC患者中未發(fā)現此征象,在中度和重度UC患者中出現率分別為23%和36%,這一結果與Jia等[8]的研究結果相反。筆者分析原因,本組研究認為腸息肉應在較高程度中的UC存在,因為研究顯示腸息肉的存在與UC的長期反復相關,且息肉的存在可提高潰瘍癌化的風險。腸系膜充血、腸壁異常強化以及淋巴結增大均體現了病灶部位發(fā)生炎性反應,血管增粗、增多,與國內外其它研究結果相符合[8,11],雖然腸系膜充血、腸壁異常強化、淋巴結增大在組間差異顯著,然而由于參數之間相關性較大,由相同病理原因造成,因此在特征篩選時篩除了腸壁異常強化與淋巴結增大。本研究結果顯示隨著病情活動度的增加,腸壁分層、黏膜囊泡、結腸袋消失、直腸周圍脂肪堆積和腸腔狹窄等征象的出現率均升高,表明UC早期主要表現為血管模糊和腸壁異常強化,隨著疾病進展,逐漸出現腸壁分層、黏膜囊泡、結腸袋消失和腸腔狹窄,本研究結果與國內前期的研究結果相符[11]。本研究中發(fā)現隨著UC疾病的進展,CTE圖像上逐漸出現黏膜囊泡,實際為黏膜面下的隱窩膿腫[19]。目前已有研究者嘗試應用磁共振成像技術對UC進行評估[21],MRI與CT相比是否可以提升對于UC程度的診斷效能,有待進一步的研究。
基于篩選后的CTE特征,本研究首次在基于Mayo評分分組的UC患者診斷中引入以隨機森林為基學習器的多學習器GBM,首次采用機器學習模型基于CTE征象來評估Mayo分組,結果顯示無論是在訓練組還是驗證組中,其預測不同嚴重程度UC的AUC值均大于0.95,AUC值大于Jia等[8]的研究結果(AUC=0.95), 雖然AUC值相對升高,然后兩者方法之間的差異是否具有統(tǒng)計學意義,尚需要更大樣本量的研究分析。
同時,我們基于GBM分類器進行輕、中、重度分類時,鑒別輕度與中度的截斷值為0.215,中度與重度的截斷值為0.291,可參考截斷值的范圍來協(xié)助臨床進行不同程度UC的診斷。相比較傳統(tǒng)CTE閱片以及CTE得分評估[8],本研究嘗試優(yōu)化需要納入分類器的特征,將原有需要評估的特征數從13個減少為10個,從而減少了臨床工作量,而且與前期研究[8]比較,極大的提高了分類器對UC的診斷效能,可協(xié)助臨床上無侵襲性評估患者的UC程度。
本研究不足之處:第一,該機器學習分類器模型未得到多中心數據的驗證,且模型中仍需要納入10個CTE特征,在減輕臨床工作量方面的作用還有待提提高,后續(xù)仍需要擴大樣本量,嘗試是否可以進一步簡化模型;第二, 本研究只針對了活動期UC患者提取CTE特征來預測基于Mayo評分的疾病活動度分組,未進一步研究UC患者緩解期與活動期評分的差異;第三,本研究在篩選入組患者時,對患者CT圖像質量有嚴格要求,日常工作中常有腸道準備不足的患者,我們并未對CT圖像質量欠佳的患者進行研究,在后續(xù)的研究中,我們將引入腸道準備情況評分,分析其對研究目的的影響。
綜上所述,本研究基于CTE提取影像特征,采用以隨機森林為基學習器的GBM多學習器來評估基于Mayo評分的UC患者疾病嚴重程度,獲得了較滿意的分類診斷結果,診斷效能較高,對臨床上無侵襲性評估UC不同分級提供了新的輔助診斷方法。