王玫,李寧,張祁,石峰,吳交交,馮琪,丁忠祥,4
(1.浙江大學醫(yī)學院附屬杭州市第一人民醫(yī)院放射科,浙江 杭州 310006;2.浙江中醫(yī)藥大學附屬第一醫(yī)院醫(yī)學影像科,浙江 杭州 310006;3.上海聯(lián)影智能醫(yī)療科技有限公司,上海 200232;4.浙江省臨床腫瘤藥理與毒理學研究重點實驗室,浙江 杭州 310006)
膀胱癌的發(fā)病率在我國的生殖泌尿系統(tǒng)腫瘤中居首位,根據(jù)是否存在肌層浸潤,其手術方案不同,非肌層浸潤性膀胱癌(Non-muscle invasive bladder cancer,NMIBC)一般運用經(jīng)尿道腫瘤電切術,而肌層浸潤性膀胱癌(Muscle invasive bladder cancer,MIBC)因其復發(fā)率較高、容易遠處轉移等特性,多使用根治性膀胱切除術[1]。目前臨床上確定膀胱癌肌層浸潤的金標準是膀胱鏡活檢,但這是一項有創(chuàng)檢查,依靠操作醫(yī)師的經(jīng)驗,實施不當可能會導致對膀胱癌分期的低估[2-3],耽誤病情,導致不良的臨床結果[4]。因此,尋找一種無創(chuàng)且客觀的方法判斷膀胱癌術前是否存在肌層浸潤,對治療策略的制定尤為重要。
研究證明MRI 在術前膀胱癌肌層浸潤的評估中具有重要價值[5]。2018 年歐洲泌尿外科學會、日本腹部放射學會以及歐洲泌尿影像學會一起發(fā)表膀胱影像報告和數(shù)據(jù)系統(tǒng)(Vesical imaging-reporting and data system,VI-RADS)[6],使用多參數(shù)MRI 評分系統(tǒng)判斷肌層受侵的概率。但是目前VI-RADS評分中多為定性診斷,幾乎沒有用于預測肌層浸潤的定量指標[7],這使最后的結果偏于主觀。近些年有研究發(fā)現(xiàn),腫瘤與膀胱壁之間的接觸長度(也稱腫瘤-壁界面)提示存在肌層浸潤的風險,可作為腫瘤分期的定量指標[8]。目前人工智能和影像組學正不斷發(fā)展,已廣泛運用在腫瘤領域[9-10],可以從影像圖像中提取大量客觀、定量的組學特征,用于疾病的診斷、療效的評估及預后預測。綜上所述,本研究將基于多參數(shù)MRI 運用影像組學方法構建相關模型,以實現(xiàn)術前對膀胱癌是否存在肌層浸潤進行準確預測。
本研究收集來自杭州市第一人民醫(yī)院2014 年6 月—2021 年7 月符合入組標準的膀胱癌患者。本研究方案通過醫(yī)院的倫理委員會批準。
所有病例均行MR T2WI、DWI 及增強掃描,并在MRI 檢查后1 月內(nèi)取得術后病理結果,排除檢查前做過臨床治療及圖像偽影較重不符合納入標準的病例。本研究共收集膀胱癌患者225例,其中男176例,女49例,年齡32~96歲,平均(69.38±11.74)歲。根據(jù)TNM 分期,以T2a 期(侵犯淺肌層)作肌層浸潤的分界, 1.2.1 MRI 掃描 所有病例掃描采用的均是德國西門子Verio 3.0T MR 掃描儀,掃描之前膀胱需適度充盈。MRI參數(shù)詳見表1。 表1 膀胱MRI 掃描參數(shù) 1.2.2 腫瘤-壁界面 定義為患者仰臥位時膀胱壁與腫瘤之間接觸最大的曲線長度(圖1a),取兩次測量結果的平均值,分別在3 組圖像中進行測量。 1.2.3 圖像分析 本研究使用聯(lián)影智能科研平臺系統(tǒng)(版本V1.4)進行組學分析,將病例的影像和臨床數(shù)據(jù)均導入該平臺的膀胱癌數(shù)據(jù)集中,分析的重要環(huán)節(jié)包含圖像分割、特征篩選及機器建模。 圖像分割:分別由1 位主治醫(yī)師和1 位副主任醫(yī)師進行勾畫,在數(shù)據(jù)集界面中進入影像標注界面,在T2WI 及DWI、增強圖像上分別手動逐層勾畫腫瘤區(qū)域(MR 增強圖像選用動脈期作為勾畫對象,因固有層的低信號線早期連續(xù)性的中斷提示肌層受侵),即感興趣區(qū)(ROI),最后融合為1 個三維的ROI(圖1b~1d)。由于一部分病例的膀胱中有多個瘤體,為了減少由于多個病變中提取的潛在偏倚,本次選擇體積最大的瘤體進行勾畫。兩位醫(yī)師在勾畫前對病理分型并不知情,對兩者勾畫的ROI 結果實施組間的一致性分析。 特征篩選及機器建模:在聯(lián)影智能科研平臺的組學模塊界面上對上述勾畫的ROI 區(qū)域進行組學特征提取。包括一階特征參數(shù)(灰度直方圖的統(tǒng)計學特征)和二階特征參數(shù)(紋理特征)兩大類,共118 個特征,并聯(lián)合25 個圖像濾波器(如拉普拉斯銳化、小波等)提取特征,由不同的維度反映病灶的形狀復雜度,最終從T2WI、DWI 和增強圖像中各提取2 600個特征。同時手動加入8 個其他一般特征(腫瘤-壁界面、臨床特征)。為了避免分組的樣本偏差,按5 倍交叉-驗證方法把膀胱癌病例分成訓練集以及測試集,把樣本隨機均分為5組,每組NMIBC 和MIBC病例比例是一致的,每次挑選其中1 組作為測試集,剩余4 組用于訓練集作為模型訓練,并重復上述步驟5次,由此生成5 個與訓練集和測試集不同的折疊,計算它們結果的平均值作為模型平均且穩(wěn)健的評估。特征預處理應用z 分數(shù)歸一法,特征篩選應用最小絕對收縮與選擇算子(Lasso)的方法。 Nomogram 模型建立和外部驗證:基于Lasso 所選特征的初步分類得到的概率值與有意義的其他一般特征聯(lián)合構建Nomogram 模型,分類器選用Logis-tic 回歸算法。 在外部數(shù)據(jù)集中驗證模型的診斷效能,病例來自浙江中醫(yī)藥大學附屬第一醫(yī)院,共收集病例40例,其中男31例,女9例,年齡37~90歲,平均(73.42±11.77)歲。40 例中,MIBC 18例,NMIBC 22 例。 統(tǒng)計學分析應用SPSS 軟件。多組比較運用非參數(shù)檢驗——Kruskal-Wallis 檢驗。組內(nèi)相關系數(shù)(ICC)分析用于驗證兩位醫(yī)師勾畫結果的一致性,ICC≥0.75 提示具有優(yōu)良的組間一致性。受試者工作特征(Receiver operating characteristic,ROC)曲線用于評價模型的診斷效果,同時得出曲線下面積(Area under curve,AUC)、準確度、特異度。通過校準曲線評價分類的準確性。 通過聯(lián)影智能科研平臺對特征進行篩選,在其他一般特征中(腫瘤-壁界面、臨床特征),發(fā)現(xiàn)腫瘤-壁界面對兩組的鑒別有明顯的診斷價值,而兩組間的臨床特征(包括性別、年齡、遺傳、是否吸煙、有無膀胱刺激癥、肉眼或鏡下血尿以及癌胚抗原(CEA))無明顯鑒別診斷價值。 3 組圖像中腫瘤-壁界面測量值比較無統(tǒng)計學差異(P>0.05),最后選用3 組的平均值。 根據(jù)兩位放射科醫(yī)生的一致性結果進行分析,在3 組參數(shù)圖像的2 600 個組學特征中,T2WI 2 490個(95.8%)、DWI 2 349 個(90.3%)、增強掃描2 501個(96.2%)具備優(yōu)良的組間一致性(ICC≥0.75)。本研究最后選擇副主任醫(yī)師的勾畫結果實施進一步組學分析。 對T2WI、DWI 及增強圖像中的影像學特征進行降維篩選,分別得到8 個、6 個和13 個有意義的特征,后基于多參數(shù)聯(lián)合篩選出6 個有意義的特征(表2),根據(jù)Lasso 所選特征初步分類得到各自的概率值。在各參數(shù)的訓練集及測試集中,兩組間的概率值均存在統(tǒng)計學差異(P<0.05)。 表2 多參數(shù)聯(lián)合篩選的組學特征 基于概率值構建模型,比較3 組單參數(shù)模型和多參數(shù)聯(lián)合模型的診斷性能(圖2),結果顯示除了多參數(shù)模型和T2WI 單參數(shù)模型沒有統(tǒng)計學差異,其余兩兩組間比較均有差異,并且在AUC 數(shù)值上多參數(shù)模型具有最好的診斷結果(表3)。 表3 各模型的AUC值 上述結果顯示Nomogram 模型和單獨的組學模型、其他一般特征模型相比,具有更優(yōu)越的診斷性能(圖3a)。在訓練集和測試集中,Nomogram 模型的AUC 分別為0.892、0.875,靈敏度分別為0.765、0.75,特異度分別為0.844、0.824。構建基于Probability 和腫瘤-壁界面多指標聯(lián)合診斷的Nomogram列線圖,將復雜方程可視化(圖3b)。模型的校準曲線提示肌層浸潤的預測結果(圖3c)。 運用外部數(shù)據(jù)驗證Nomogram 模型的診斷性能。模型的ROC 曲線及可視化混淆矩陣證明模型具有較好的分類預測性能(圖4),其AUC 值為0.846,靈敏度為0.722,特異度為0.818。 本研究中,我們運用ROC 曲線比較單參數(shù)和多參數(shù)模型的診斷性能,發(fā)現(xiàn)后者具有最好的診斷結果,因此,實驗選用多參數(shù)聯(lián)合的概率值,與有意義的其他一般特征(腫瘤-壁界面)聯(lián)合構建Nomogram模型,該模型較單獨的組學模型和其他一般特征模型具有更好的診斷性能,在訓練集、內(nèi)部驗證集和外部驗證集中均表現(xiàn)優(yōu)異。從多參數(shù)聯(lián)合中篩選出6個有意義的組學特征,分屬于4 大類參數(shù),F(xiàn)irstorder參數(shù)中的Skewness 特征表示偏度,描述平均灰度值的不對稱性分布,正負均可,Uniformity 描述圖像矩陣的均勻性;Glszm 參數(shù)表示量化圖像中的灰度區(qū)域,其中的Zone Entropy 特征代表測量區(qū)域大小、灰度級的分布不確定性,值越大意味著紋理的異質(zhì)性越大;Glrlm 參數(shù)表示測量具有一致灰度值的連續(xù)像素長度分布;Gldm 參數(shù)量化圖像中相同灰度值的散布比例[11]。Firstorder 為一階特征參數(shù),后3 類為二階或高階特征參數(shù),描述了腫瘤圖像紋理的粗糙、復雜程度,提取人眼無法獲取的信息,定量描述病變區(qū)域的宏觀特性及微觀異質(zhì)性[12],提示肌層的浸潤情況。 在特征篩選中除了組學特征外,還發(fā)現(xiàn)其他一般特征中的腫瘤-壁界面也是膀胱癌肌層浸潤有用的預測因素。歐洲泌尿外科協(xié)會建議將腫瘤大小3 cm作為NMIBC 危險進展的閾值[13],而腫瘤大小與其形態(tài)相關。但本研究中,并沒有篩選出與形態(tài)學有關的組學特征,我們認為這與腫瘤-壁界面也代表一種形態(tài)學參數(shù)有關,其表現(xiàn)出的信息更能代表腫瘤的真實狀態(tài),而組學中形態(tài)學特征沒有表現(xiàn)出與腫瘤-壁界面相當?shù)脑\斷性能。因此,在共同篩選中被淘汰。同時,腫瘤-壁界面這個定量指標已用于其他腫瘤的分期診斷,如肺癌[14]、前列腺癌[15]等,但膀胱癌和他們的發(fā)生機制有所不同,膀胱癌本就生長在膀胱壁上,而上述癌癥僅在進展后才接觸到胸膜等類似結構。本研究結果支持這種關聯(lián)也適用于膀胱癌,Ahn等[8]的結果也驗證了這一點。 研究結果發(fā)現(xiàn)在AUC 值上多參數(shù)模型具有最優(yōu)的預測性能,這與既往的研究結果一致[16],但在統(tǒng)計學上與T2WI 單參數(shù)模型沒有顯著差異,我們認為這與樣本量不足有關,更多的訓練數(shù)據(jù)會使模型精度大大提高[17]。根據(jù)上述結果,我們選用多參數(shù)聯(lián)合的概率值與腫瘤-壁界面聯(lián)合構建Nomogram 模型,發(fā)現(xiàn)較單獨的組學模型和其他特征模型具有更好的診斷性能。Zheng等[16]研究結果顯示影像組學與有診斷意義的臨床特征結合可以改善膀胱癌肌層浸潤預測模型的準確性,進一步支持了我們的研究結果。 本研究仍存在不足之處:①本研究是回顧性的實驗,數(shù)據(jù)集相對較小,并且存在選擇的偏倚,后續(xù)可以進行前瞻性研究,進一步收集病例來驗證結論;②腫瘤-壁界面的測量可能會受腫瘤的位置及重力的影響,后續(xù)可以通過多體位掃描獲得更多圖像,進行進一步分析;③在未來的研究中希望通過不同廠家的MR 設備或者不同磁場強度的MR 掃描,可以進一步驗證模型結果。 綜上所述,影像組學是預測膀胱癌肌層浸潤的有用工具,基于多參數(shù)MRI 和腫瘤-壁界面構建的Nomogram 模型具有較好的診斷性能及可重復性,可以協(xié)助臨床醫(yī)生做出有效評估。1.2 方法

1.3 統(tǒng)計學方法
2 結果
2.1 一般資料
2.2 腫瘤-壁界面
2.3 一致性分析
2.4 組學特征篩選及模型建立


2.5 外部數(shù)據(jù)集驗證
3 討論