張涵,毛寧,謝海柱,李天平,駱訓容,李祥林*
作者單位:1.濱州醫學院醫學影像學院,煙臺264003;2.煙臺毓璜頂醫院影像科,煙臺264000
前列腺癌(prostate cancer,PCa)已成為男性最常見的惡性腫瘤之一[1]。非臨床顯著性前列腺癌(clinically insignificant prostate cancer,ciPCa)通常進展緩慢,不需要進行干預治療,而臨床顯著性前列腺癌(clinically significant prostate cancer,csPCa)需要根據分期選擇激素治療、放療、化療、手術治療等治療方案[2]。因此對csPCa的早期明確診斷對于對患者進行及時有效地治療具有重要意義。
隨著醫學影像檢查技術的發展,MRI 已成為診斷csPCa 的重要方法之一[3-4]。然而常規影像診斷流程存在較明顯的主觀性,影響診斷結果的準確性。影像組學(radiomics)通過計算機算法從常規醫學檢查圖像中高通量地提取大量可挖掘的數據,結合機器學習算法,輔助臨床診斷、治療等工作[5-7]。目前已經有學者運用影像組學預測csPCa[8-13],然而這些研究的ROI僅局限于病變內部,忽略了病變的微環境內影像組學特征的診斷價值。所以,本研究建立基于病變周圍及病變內部的影像組學特征的影像組學模型預測csPCa。
本研究回顧性分析了煙臺毓璜頂醫院于2017年3 月至2019 年12 月進行前列腺磁共振掃描的病例。納入標準:(1)磁共振檢查圖像至少包括T2 加權成像(T2 weighted imaging,T2WI)、ADC 序列;(2)磁共振檢查前未進行過放療、化療、激素治療等治療;(3)前列腺病變的病變類型在磁共振檢查后4 周內經前列腺穿刺或前列腺切除病理檢查結果證實。排除標準:(1)圖像未發現可疑病灶或可疑病變邊緣模糊無法勾畫病灶邊緣;(2)圖像存在偽影;(3)前列腺被其他惡性腫瘤侵犯。最終有140例患者被納入研究,并隨機按照4∶1的比例分為訓練集112例、測試集28例。
通過查詢電子病歷系統獲取患者的病理結果以及患者的年齡、血清前列腺特異性抗原(prostate specific antigen,PSA)濃度。當系統中同時存在穿刺活檢與前列腺切除的病理結果時,選擇前列腺切除的病理結果。
圖像采集使用美國GE 公司3.0 T 750W 磁共振掃描儀、16 通道腹部線圈。掃描參數:T2WI:回波時間(echo time,TE):95 ms,重 復 時 間(repetition time,TR):3000 ms,層厚:3 mm,掃描矩陣:400×400,掃描視野(field of view,FOV):252 mm×224 mm;DWI:TE 67 ms,TR 4600 ms,層厚4 mm,掃描矩陣128×128;b值為0、1000 mm2/s。
首先由影像科醫師用3D slicer (Version 4.10.2 r28257)[14]中的“Segment Editor”模塊同時在T2WI、ADC 圖像上手動逐層勾畫可疑病灶邊緣,得到病變內部區域(intralesional volume,ILV)。然后通過“Dilate Label Map”模塊ILV進行膨脹處理。本研究將病變周圍5 mm 范圍定義為病變周圍區域(PLV)。根據T2WI、ADC圖像的像素尺寸,膨脹半徑分別為10、2,以像素為單位。最后從膨脹后的ILV中去除未膨脹處理的ILV,剩余的區域即為PLV。ROI勾畫示意圖見圖1。
首先隨意挑選30 例患者,由分別具有5 年、7 年前列腺磁共振工作經驗的醫師1、醫師2 同時進行ROI 分割工作,剩余110 例患者的分割工作由醫師2 完成,1 個月后由醫師2 重復對上述30 例患者的圖像的分割工作。上述分割工作在一位具有15年前列腺磁共振診斷經驗的高年資醫師的監督與審核下完成。
ILV與PLV內影像組學特征的提取通過3D slicer(Version 4.10.2 r28257)[14]中的“Radiomics”模塊實現。被納入的影像組學特征包括一階特征、形狀特征、紋理特征(灰度共生矩陣、灰度游程長度矩陣、灰度尺寸區域矩陣、鄰域灰度差矩陣、灰度相關矩陣)及小波特征。運用醫師1 與醫師2 同時勾畫的30 例患者的ROI內的影像組學特征計算組間相關系數,運用醫師2 的兩次勾畫的30 例患者的ROI 內的影像組學特征計算組內相關系數,通過組內相關系數及組間相關系數[15]間接評估ROI勾畫的穩定性,組內相關系數及組間相關系數大于0.8 則認為ROI 勾畫具有良好的穩定性。
病理結果中Gleason 評分大于6 (3+3)為csPCa的參考標準[16]。首先對所有影像學特征進行單變量分析,篩選患有csPCa 患者與未患有csPCa 患者存在顯著統計學差異的特征。然后用最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)[17]篩選出診斷csPCa 最有價值的特征,運用10 折交叉驗證選擇最優λ 值。運用最優λ 值對應的特征的系數及截距項建立基于LASSO 回歸的預測模型。
運用ROC 曲線分析評價預測模型在訓練集及測試集中的預測效能。為了提高預測模型AUC 的穩健性,運用自舉法(bootstrap)分別在訓練集、測試集隨機生成1000個樣本數據集并分別計算其AUC,取其平均數作為最終的AUC。選擇約登指數作為預測模型的截斷點。運用臨床決策曲線分析評價模型的實用性。臨床決策曲線綜合考慮預測模型假陽性與假陰性,評估預測模型在不同診斷閾值下的凈收益,體現了預測模型的臨床效應,幫助醫生進行臨床決策。
統計分析軟件為R (Version 3.6.2)。運用中位數、四分位間距描述年齡、血清PSA濃度,運用曼-惠特尼U檢驗、卡方檢驗驗證訓練集及測試集患者臨床資料的差異性。運用t 檢驗或曼-惠特尼U 檢驗進行單因素分析。P<0.05為組間有顯著統計學差異。
訓練集與測試集患者中分別有65、17 例患者患有csPCa,分別占58%、61%,無顯著統計學差異(P>0.05)。訓練集患者與測試集患者的血清PSA 濃度、年齡以及病變的體積均無顯著統計學差異。訓練集及測試集患者的詳細臨床特征見表1。
每個患者的每個序列從每個ROI 中提取851 個影像組學特征,最終每個患者一共提取3404 個影像組學特征。影像組學特征的組內相關系數及組間相關系數分別為0.84、0.81,表明ROI 分割具有良好的穩定性。單因素分析后,影像組學特征數據集剩余169 個特征。最終LASSO 回歸預測模型中共包括10個特征,特征的名稱及對應的系數見圖2。
表1 訓練集及測試集患者一般資料Table 1 Characteristics of patients in the train and testing sets
預測模型在訓練集中的AUC、準確率分別為0.93(95%置信區間:0.88~0.98,特異度:0.87,敏感度:0.89)、0.84(95%置信區間:0.76~0.90)。測試集的AUC、準確率分別為0.92(95%置信區間:0.81~1.00,特異度:0.95,敏感度:0.68)、0.89(95%置信區間:0.72~0.98)。預測模型的截斷點為0.60。ROC曲線見圖3。運用自舉法計算得出的預測模型在訓練集的AUC為0.93,測試集的AUC為0.92。在臨床決策曲線分析中,在測試集中診斷閾值位于0.01~0.83或0.87~0.98時,凈收益大于“均為陽性”及“均為陰性”的模型的凈收益。臨床決策曲線見圖4。
該研究分別提取了前列腺MR圖像中可疑病變內部及病變周圍區域的影像組學特征,特征篩選后構建基于LASSO回歸的機器學習模型預測csPCa。在訓練集及測試集中均取得了良好的預測表現,在臨床決策曲線分析中表現出了良好的實用性。
圖1 T2WI、ADC序列中ROI示意圖。A:T2WI序列原始圖像;B:ADC序列原始圖像;C:T2WI中的ROI,綠色區域表示病變內部區域,藍色區域表示病變周圍區域;D:ADC中的ROI,綠色區域表示病變內部區域,藍色區域表示病變周圍區域Fig.1 ROI in T2WI and ADC map.A:T2WI image before segmentation.B:ADC map before segmentation.C:ROI in T2WI:green area represent intralesional vol‐ume,blue area represent perilesional volume.D:ROI in ADC:green area represent intralesional volume,blue area represent perilesional volume.
圖2 模型中的特征及其系數 圖3 A:預測模型在訓練集中的ROC曲線;B:預測模型在測試集中的ROC曲線 圖4 預測模型在測試集中的臨床決策曲線Fig.2 Features and coefficients in model.Fig.3 A:ROC curve of model in train set.B:ROC curve of model in test set.Fig.4 Decision curve of predic‐tion model in test set.
國內外學者已經在相關研究中探究了影像組學機器學習模型在csPCa 預測中的價值。Li 等[8]比較了臨床數據機器學習模型、影像組學機器學習模型、臨床數據聯合影像組學機器學習模型對csPCa 的診斷效能,發現臨床數據聯合影像組學機器學習模型預測表現優于影像組學機器學習模型,兩者的預測表現均優于臨床數據機器學習模型。Zhang 等[11]通過多中心研究探究了基于影像組學特征、ADC 值及臨床風險因子的機器學習模型的列線圖區分csPCa 與ciPCa 的表現,最終列線圖在訓練集、內部驗證集及獨立驗證集中均表現了良好的區分能力。Cuocolo等[10]通過對影像組學形狀特征的統計學分析發現提取自ADC的形狀特征表面積與體積之比在預測csPCa中最有價值。上述研究均體現了影像組學機器學習模型在預測csPCa中的應用價值,然而忽略了病變的微環境中的影像組學特征的診斷價值。本研究中的影像組學機器模型,不僅包括了病變內部的影像組學模型,病變周圍的影像組學特征也參與機器學習模型的建立,進一步探究了MRI 影像組學特征診斷csPCa的價值。
影像組學特征主要包括一階直方圖特征、形狀特征及紋理特征、小波特征等。形狀特征主要包括感興趣區的體積、最大直徑等特征;一階直方圖特征主要描述體素強度的均值、偏度及中位數等分布相關的特征;紋理特征主要描述體素空間分布強度等級,主要包括灰度級長矩陣、灰度共生矩陣以及灰度級帶矩陣等;小波特征,就是將原圖像經過小波變換,然后再重復計算上述特征。通過影像組學的方法,將傳統影像圖像轉換為大量數字化特征,從而揭示肉眼無法發現圖像內部蘊含的的生物學特性[18]。臨床顯著性前列腺癌病變內部及周圍組織的生物學特征與非臨床顯著性前列腺癌病變內部及周圍的生物學特性存在差異,這些差異可以通過影像組學特征的數值的大小體現出來,通過對數字化特征的進一步挖掘,體現出影像組學特征與病理特征的相關性。
病變周圍的影像組學特征的應用價值已經在其他腫瘤性病變中得到了初步探究。Wang 等[19]分別建立了基于肺癌內部、肺癌周圍及肺癌周圍結合肺癌內部CT影像組學特征的機器學習模型預測淋巴結轉移的風險,三者均具有良好的預測性能,基于病變周圍結合病變內部影像組學特征的機器學習模型的預測表現最佳。Fan 等[20]探究了乳腺癌內部及周圍組織內的MRI 影像組學特征在預測乳腺癌分子分型中的價值。D′antonoli 等[21]應用肺癌內部及肺癌周圍組織內的CT 影像組學特征及TNM 分期數據構建機器學習模型預測肺癌術后復發風險,并與單獨使用TNM分期數據的機器學習模型做了比較,結果表明加入影像組學后預測模型預測性能明顯提高。Braman等[22]運用基于治療前乳腺MRI 增強掃描圖像內腫瘤內部及腫瘤周圍的影像組學特征的預測模型預測新輔助化療的治療效果,預測模型表現出了良好的預測效果。
本研究不足之處:首先,本研究納入樣本量相對較少,且為回顧性研究,未來需要大樣本量的前瞻性研究做進一步探究;其次,病變內部區域的勾畫方法為手動勾畫,效率低下且存在一定主觀性,不利于大數據的處理;最后,本研究樣本來自單中心,缺少獨立驗證數據集,未來將會運用多中心研究對該研究的結果做進一步驗證。
總之,基于病變內部及病變周圍的MRI影像組學特征在預測臨床顯著性前列腺癌中具有良好的表現,對輔助臨床決策具有一定的應用價值,為未來MRI診斷csPCa提供了新方向。
作者利益沖突聲明:全體作者均聲明無利益沖突。