王莎,張艷利,陳圓圓,馬芹芹,雷軍強
胰腺炎是最常見的胰腺外分泌疾病[1],其中急性胰腺炎(acute pancreatitis,AP)最為常見,全球發病率為34/100,000人[1,2]。2017年全球約有160萬新發AP患者,其中約10萬人死亡[3]。慢性胰腺炎(chronic pancreatitis,CP)是由于各種原因導致的胰腺局部或彌漫性的慢性進展性炎癥,對于胰腺內外分泌功能具有不可逆的損傷。AP有轉變為CP的可能,而CP會增加胰腺癌(pancreatic carcinoma,PC)的發生風險。因此,對胰腺炎的早期發現對臨床干預有重要的指導意義。鑒于此類良性疾病更推薦無創檢查,CT及MRI等在胰腺炎的診斷、嚴重程度、并發癥及鑒別診斷等方面發揮了重要作用。然而,傳統影像學主要反映病變的大小、形態及強化方式,對于疾病的異質性反映不佳。影像組學在過去幾年中發展迅速,能夠以一種非侵入性的方式深入捕捉肉眼無法觀察到的大量關于病變異質性的信息,然后將許多患者的成像數據與復雜的生物信息學工具相結合,開發出一種能夠顯著提高診斷和預后預測準確性的模型。即使疾病早期的傳統影像學表現不明顯,不同嚴重程度胰腺炎患者的實質改變也存在差異,這種差異也可能通過影像組學特征反映出來,所以影像組學有望彌補傳統影像學的不足。
影像組學是由Lambin等[4]提出用于醫學圖像分析的方法,能夠從圖像中提取大量的、肉眼無法識別的多種圖像特征?,F已廣泛應用于超聲、CT、MRI及正電子發射計算機斷層顯像(positron emission tomography,PET)等醫學圖像的分析。其一般流程包括:①圖像獲取;②圖像分割:通常通過手動或半自動地在圖像上繪制感興趣區來執行;③特征提取及篩選:影像組學特征包括形態(語義)、一階(直方圖)、紋理和高階特征[5-7]。由于影像組學特征的高維性,使用這些特征建立的模型可能會受到過擬合的影響。此外,影像組學特征之間存在高度相關性,可能會產生多重共線性問題。因此,要建立穩健的決策或預測模型,特征選擇是必不可少的。常用的特征選擇方法包括基于統計方法的逐步特征選擇或最小絕對收縮和選擇算子等自動算法[7-9];④數據分析:即使在特征選擇過程之后,仍會有大量的影像組學特征被選擇,而不同于典型臨床研究中所評估的有限數量的變量。傳統的統計方法可能不適合處理大量的影像組學特征,通常使用機器學習方法或正則化函數回歸分析來構建影像組學分類器或模型[8,9]。在模型構建之后,使用內部或外部測試數據驗證模型進而用于疾病的診斷及預測等。
隨著AP診治指南的完善及臨床救治水平的日趨成熟,AP在治療后基本可以痊愈,但AP轉歸后容易復發,研究報道10%~30%的AP患者首次發作后會復發進而轉變為復發性急性胰腺炎(recurrent acute pancreatitis,RAP)[10],而且AP反復發作會增加進展為CP及PC的風險[11,12]。這不僅會導致臨床治療難度增加,還會給患者帶來身心及經濟負擔,成為臨床治療的困擾,因此對AP復發的預測至關重要。近年來臨床上主要探討了RAP的危險因素[13-15]以期通過危險因素的去除預防RAP的發生,雖然此類措施達到了一定效果,但缺乏特異性,加之高達30%的RAP病例的病因仍然未知[16],難以進行精準預測及預防。傳統影像學對于RAP則主要是復發后的診斷,AP兩次發作間期在傳統影像學上表現通常是正常的。因此,僅從傳統影像學及臨床角度預測RAP存在一定困難。有研究顯示,從AP到RAP的發展存在一個連續變化的過程,從而產生不可逆轉的胰腺結構或功能變化[17]。如果可以在AP發生后檢測到此病理變化的過程,則可以在AP發生后便進行干預以預防RAP的發生,可以提取圖像定量信息及揭示病變異質性的影像組學應用而生。
Chen等[10]從389例首次出現AP患者的CT動脈和靜脈期圖像中提取了412個影像組學特征,最終選擇了10個特征來建立影像組學預測模型,平均臨床隨訪時間為(62.8±6.7)個月,以確定AP是否復發,并建立臨床模型、影像組學結合臨床特征模型(radiomics combined with clinical feature model,COMB)以探討最佳模型。結果顯示臨床特征中高脂血癥是其最主要的危險因素,這與之前的研究結果一致[18-20],然而當作者建立包含臨床特征的臨床模型預測AP復發時,發現高脂血癥在兩個隊列中的預測能力均有限。相比之下影像組學模型的預測效能遠高于臨床模型,COMB模型可以進一步提高影像組學模型的預測能力。此結果表明影像組學是預測RAP的潛在定量工具,相比臨床模型,影像組學更加簡單、精準,特異性更強。
考慮到CT具有輻射性且提供的信息有限,而MRI具有無輻射及軟組織分辨率高等優點,Hu等[21]建立了基于T2WI的影像組學模型預測RAP,并比較了影像組學模型、臨床模型和COMB模型對RAP的預測能力,最后建立評估AP患者復發風險的諾模圖。結果顯示影像組學模型和COMB模型的曲線下面積(areas under curve,AUC)均大于臨床模型(P=0.008、0.007),但影像組學模型與COMB模型之間的AUC差異無統計學意義(P=0.067)。此研究同樣發現高脂血癥是RAP的危險因素,但影響AP復發的臨床因素有很多,僅憑臨床特征很難預測RAP;而且作者在建立諾模圖時發現影像組學特征對AP復發風險的預測比例大于臨床特征,提示影像組學特征在預測AP復發方面優于獨立的臨床特征。因此,基于CT及MRI的影像組學均可以很好地預測AP的復發情況[22]。此外,基于T2WI的影像組學還可以清楚顯示胰腺結構的解剖范圍及其炎癥范圍,并且可以結合其他參數判斷胰腺的出血水腫情況,為臨床精準治療提供很大的幫助[23]。值得注意的是,與CT相比,MRI的檢查時間更長、費用更高,基于MRI的影像組學模型帶來的附加價值應該與其相對較大的資源消耗相平衡,才是有利于臨床有益于患者的理想模型。然而,目前基于MRI所建立的模型似乎并未顯示出明顯的優勢,這可能與其序列選擇之間存在一定關系,所有基于MRI的模型均只納入T2WI圖像,未將其他序列納入進行對比分析,如可以提供定量參數的擴散加權成像(diffusion weighted imaging,DWI)序列,未來的研究可以納入更多序列進行對比探討,以期建立最佳影像組學預測模型。
根據國際共識2012年修訂的亞特蘭大分類和定義(2012-RACD),AP可分為三類,按其臨床嚴重程度分為輕度急性胰腺炎(mild acute pancreatitis,MAP)、中度重度急性胰腺炎(moderate severe acute pancreatitis,MSAP)和重度急性胰腺炎(severe acute pancreatitis,SAP)[24]。文獻報道SAP的死亡率高達36%~50%,持續性器官衰竭并發感染性壞死患者的死亡率非常高[24]。因此,對AP嚴重程度的早期預測至關重要,這不僅有利于MSAP和SAP患者的早期診斷和治療,也有利于MSAP和SAP患者的早期轉診。目前,早期預測AP嚴重程度的方法主要基于臨床特征、實驗室檢查以及傳統影像學檢查結果[25-28]。但由于AP的復雜性和多樣性,其病程仍難以預測[29]。
雖然幾種傳統的評分系統可以預測SAP[30,31],但它們都是復雜且耗時的[32],如臨床最常用的預測評分系統是急性生理學和慢性健康檢查(APACHE II)[33,34],此評分系統需要收集大量臨床數據,在臨床中較難實現。針對這一復雜的評分系統,有學者提出了BISAP評分[35],此評分相對簡單,但存在主觀評價的指標即對精神狀態的評估,容易導致一定的誤差?;贑T的評分系統CTSI、MCTSI均存在類似的缺陷[36],對于炎癥和壞死的評估依賴影像科醫師的肉眼評估。此外,有研究表明MAP在發病的最初幾小時內伴有高血流灌注,而SAP則伴有進行性組織缺血和血流灌注減少[37],即AP早期即存在微循環障礙及其導致的組織損傷,然而傳統影像學胰腺形態改變往往并不明顯,尤其是胰腺的壞死,這可能會低估疾病的嚴重程度[38,39]。影像組學可以挖掘隱藏在常規圖像中的信息,從而揭示潛在的生物學基礎[40],并非依賴其圖像形態改變進行評估,可以彌補傳統影像學滯后性的缺陷。
Lin等[41]在一項259例AP患者的回顧性研究中報道,基于增強MRI的影像組學特征可以預測AP的嚴重程度?;贛RI門靜脈期圖像,Lin等從整個胰腺感興趣區提取了353個影像組學特征,最后選擇了11個特征來建立支持向量機模型。在訓練組中,影像組學模型診斷的敏感度、特異度、陽性預測值(positive prediction value,PPV)、陰性預測值(negative prediction value,NPV)、準確度和AUC分別為77.8%、91.9%、88.7%、83.5%、85.6%和0.917;在驗證組中,相應指標分別為75.0%、86.0%、81.8%、80.4%、81.0%和0.848。影像組學的AUC均明顯高于現有的一些臨床和影像學評分系統(所有P值均<0.05)。該研究表明與現有的一些臨床和影像學評分系統相比,影像組學模型在預測AP的嚴重程度方面可能更準確。影像組學可以挖掘出不同于傳統影像的定量信息,在AP嚴重程度的分類中具有廣闊的應用前景。值得注意的是,目前基于影像組學在預測AP嚴重程度的研究中[42],均未探討AP患者的持續性器官衰竭,而持續性器官衰竭是AP患者死亡的重要因素。因此,在以后的研究中預測AP患者是否會發生持續性器官衰竭是一個值得研究的方向,存在重要的臨床指導意義。此外,此類研究只探討了影像組學模型的預測能力,均未結合臨床因素進行預測,未來的研究中將臨床因素及影像組學特征相結合,或許可以提供一種更加精準的預測模型。
根據國際共識的2012-RACD[24],AP局部并發癥包括4種,分別為急性胰周液體積聚(acute peripancreatic fluid collection,APFC)、胰腺假性囊腫、急性壞死性積聚及包裹性壞死。2012-RACD推薦判斷AP局部并發癥的影像學表現是基于增強CT圖像。有學者認為MRI對AP并發癥的顯示更佳[43],DWI作為MRI檢查的一部分,對組織成分各個方面的變化都很敏感,而且可以提供一個定量指標即表觀擴散系數(apparent diffusion coefficient,ADC)值。先前的研究表明ADC值與AP所致的肝損害之間存在關聯,而且并發肝損害組中不同嚴重程度AP患者的肝臟ADC值差異有統計學意義,隨著AP嚴重程度的增加ADC值降低[44]。Iranmahboob等[45]對41例AP患者整個胰腺的ADC值進行了直方圖分析,結果顯示雖然ADC值差異無統計學意義,但ADC直方圖的一些一階特征與新并發癥的發生之間存在關聯,包括新的小室積液、胰腺壞死、靜脈血栓或動脈假性動脈瘤,因此,ADC直方圖特征可以提供傳統ADC值無法提供的組織異質性信息。其中峰度預測新并發癥的敏感度為75.0%,特異度為91.9%,AUC為0.784,但出現并發癥的患者峰度升高的確切依據尚不清楚。有推測認為峰度的增加是由于信號強度異質性的增加,這反映了潛在的炎癥和黏液實質改變,這些改變可能使患者容易發生并發癥。
在AP早期階段,通常是指在發病后第一周結束,但可能會延續到第二周[24],此階段形態學變化與并發癥嚴重程度不成正比,尤其是前3天內,AP早期的胰腺外壞死(extrapancreatic necrosis,EXPN)和APFC在影像上均表現為液體信號或密度,僅通過傳統影像學很難鑒別。Zhou等[46]建立基于T2WI圖像胰腺外周聚集和胰腺實質MRI增強動脈晚期圖像的影像組學模型,以預測AP早期EXPN,并比較影像組學模型、臨床模型及傳統影像學評分系統的預測效能。結果顯示影像組學模型的預測效能均高于臨床模型及傳統影像學評分系統,基于胰腺外周聚集T2WI的影像組學模型對AP早期EXPN的預測效能最高,訓練組和驗證組的AUC均大于0.950,其次是基于胰腺實質的影像組學模型,AUC也超過0.900。究其原因,影像組學可以提供疾病早期常規圖像中不可見的潛在信息,從復雜的內容物中提取信息進行鑒別,從而在臨床及傳統影像學均未做出診斷時預測AP并發癥的發生。
AP全身性并發癥包括器官功能衰竭、胰性腦病及膿毒癥等[47],其中以器官功能衰竭最為嚴重,如腎衰竭及呼吸衰竭等。文獻報道AP合并急性腎損傷會導致死亡率的增高[48]。因此,AP患者在腎小管功能受損之前的精準診斷極為重要。然而,AP合并急性腎損傷的傳統影像學表現并無特異性,僅表現為腎臟皮髓質分界不清。臨床常用的預測指標血清肌酐在腎小球濾過率減少50%才會出現異常,很容易錯過治療的最佳時間窗。因此,基于臨床及傳統影像學均很難預測AP合并急性腎損傷。紋理分析作為影像組學的技術手段之一,通過分析圖像中像素或體素灰度級的分布和關系,提供對病灶異質性的客觀、定量評估[49]。賈穎等[50]探討了基于增強CT的紋理分析技術對AP合并急性腎損傷的診斷價值,從動脈期及靜脈期分割出的雙側腎臟三維容積感興趣區進行紋理分析,共提取出396個紋理特征,最終納入6個紋理特征,其中以平均像素值的診斷效能最佳,其診斷準確度、特異度及AUC分別為93.3%、100%及0.983。此研究中篩選出的紋理特征與其傳統影像表現相對應,如不合并急性腎損傷的患者局部灰度相關性較大,相關性是反映病灶局部像素灰度差異性大小的紋理特征,相關性越大差異越小,相關性較大在傳統影像學上則表現為圖像清晰,邊界清楚。而并發急性腎損傷時皮髓質強化減低,邊界模糊,紋理分析特征可見其成分不均,局部差異大。因此,紋理分析有望成為診斷AP合并急性腎損傷的影像標記物,可在血清肌酐達到現有臨床診斷標準之前診斷急性腎損傷,以期在治療時間窗內及時治療以防病情惡化。然而,由于目前此類研究數量較少,納入研究的紋理特征只是眾多紋理特征中的一部分,未來的研究有望探討更加多樣的紋理特征進而提供更多信息。
腫塊形成性胰腺炎(mass-forming pancreatitis,MFP)是一種特殊類型的CP,包括自身免疫性胰腺炎(autoimmune pancreatitis,AIP)及腫塊形成性慢性胰腺炎(mass-forming chronic pancreatitis,MFCP)等[51,52]。MFP是一種良性疾病,但其臨床表現及傳統影像學表現與胰腺導管腺癌(pancreatic ductal adenocarcinoma,PDAC)很難鑒別。有研究發現PDAC與MFCP的胰腺擴張程度及腫塊大小并無明顯差異,基于腫塊大小及和胰管擴張鑒別兩者的AUC僅為0.697和0.589~0.622[53,54],鑒別效能不佳。然而兩者的治療方式存在很大的差異,術前誤診常導致患者病情延誤或治療不當。相關研究表明有1%~6%的PDAC患者被誤診為MFP而延誤治療,5%~10%的MFP患者誤診為PDAC而進行了胰十二指腸切除術,這會導致胰腺功能不全[54-57]。雖然穿刺活檢發揮了一定作用,但由于穿刺標本大小有限,即使是超聲引導的活檢也顯示出12%~14%的假陰性[51],而且穿刺活檢為有創檢查。
Ma等[58]探討了增強CT影像組學模型在鑒別MFP與PC中的作用,研究納入了151例PC患者和24例MFP患者(18例AIP患者和6例MFCP),分別建立動脈期影像組學模型、靜脈期影像組學模型、動脈期結合靜脈期影像組學模型、臨床特征模型、COMB模型進行鑒別,結果顯示上述5種模型的AUC值分別為0.905、0.941、0.941、0.822和0.980。COMB模型的AUC明顯高于動脈期影像組學模型(P=0.004)和臨床特征模型(P<0.001),鑒別診斷效果最佳。動脈期結合靜脈期影像組學模型與靜脈期影像組學模型的AUC值一致。COMB模型的敏感度和特異度分別達0.947和0.917。因此,COMB模型可以成為鑒別PC與CP的潛在工具,從而有助于臨床決策。影像組學特征反映的是病變的病理變化及圖像的異質性,PC的病理特征主要是癌細胞、間質星形細胞和間質纖維化,病變間質纖維化阻礙了對比劑的穿透,導致PC增強掃描均表現為低密度。胰腺炎的病理特征主要是炎癥細胞浸潤和纖維組織增生,增強程度與纖維組織相似,動脈期輕度強化,靜脈期和延遲期強化[59]。雖然PC和MFP在動脈期中都呈低密度,但靜脈期和延遲期的表現有助于鑒別這些腫瘤。因此,靜脈期的影像組學特征比動脈期更有診斷價值。在此研究中,靜脈期影像組學模型的AUC高于動脈期組,雖然兩組的AUC差異無統計學意義,但該模型的敏感性和準確性都高于動脈期模型,說明靜脈期圖像提取特征的診斷性能優于動脈期模型。Deng等[60]基于增強MRI建立影像組學模型同樣顯示靜脈期模型的AUC高于動脈期模型,分別為0.997和0.958。然而張晶晶等[61]的研究顯示動脈期模型的AUC(0.801)高于靜脈期(0.769),導致此差異的原因可能是由于該研究探討的是胰頭部的PC與MFCP的鑒別,而且腫瘤之間本身存在異質性及掃描儀器之間也會存在差異所致。未來的研究或許可以分部位進行對比探討,以進一步驗證存在差異的原因,也有助于更加精準地進行鑒別。
RAP是指兩次或兩次以上的AP發作,但疾病發作間期病變完全恢復正常。AP轉歸后患者再次出現腹痛和胰酶升高時,即使影像學表現正常,臨床也可以診斷為RAP。然而,腹痛及胰酶升高并不是RAP的特異性表現,當AP轉變為CP時也可出現腹痛及胰酶升高,加之AP在發作緩解后傳統影像學表現通常是正常的,導致AP轉歸后患者出現腹痛時的診斷存在一定挑戰。雖然RAP與CP可以通過病理變化鑒別,RAP主要是胰腺的出血水腫及壞死,而CP主要病理變化是其纖維化,但考慮到病理活檢的有創性,并不推薦用于良性疾病的診斷。影像組學可以很好地從圖像中挖掘出病理信息,或許是此類患者的福音。Mashayekhi等[62]探討了基于CT影像組學特征鑒別功能性腹痛、RAP與CP,研究納入56例患者(RAP 20例,功能性腹痛19例,CP 17例),建立支持向量機模型進行分類預測。結果顯示模型的預測準確率為82.1%,雖然存在CP誤診為RAP的病例,但不存在CP及RAP誤診為功能性腹痛的病例。因此,對于僅根據腹痛癥狀和實驗室檢查無法確診為RAP的患者,影像組學可能是有用的輔助診斷手段。
影像組學在胰腺炎的診治中顯現出極大的潛力。然而,目前研究相對較少,且大多數研究為單中心回顧性研究,這會導致預測診斷模型的泛化及不穩定性增加,未來的研究有望采用前瞻性多中心研究來提高模型的穩定性,同時對其適用性及普遍性進行評估。此外,基于MRI建立的模型都未進行多序列比較,只納入部分序列進行建模,尤其對于AP的MRI模型中只有一項研究納入了DWI進行建模。對于胰腺炎入院常規更推薦成本低、時間短的CT檢查。使用高成本的MRI進行建模,是否得到了與之相匹配的效益,是模型應用于臨床需要考慮的問題。因此,未來基于MRI的研究可以納入更多參數以挖掘其更高的價值,而非局限于常規序列。
目前,隨著影像技術及人工智能的不斷發展,各種新技術應用于臨床,如能量CT、深度學習等都在疾病診療中顯示出了極大的潛力。人工智能與影像技術的結合也被逐步應用于臨床[63,64],并顯示出良好的效果。在未來的研究中,有效地將各種新技術相結合可能是潛在的方向[5,6,65-69]。