劉潤紅,劉可,黃強,徐孝明,許惠
1. 內江市第二人民醫院 放療科,四川 內江 641000;2. 自貢市第一人民醫院 腫瘤科,四川 自貢 643000;3. 內江市第六人民醫院 放射科,四川 內江 641000
直腸癌是我國常見的惡性腫瘤之一[1],近年來其發病率呈上升趨勢。容積旋轉調強放射治療(Volumetric Modulated Arc Therapy,VMAT)可使腫瘤靶區和鄰近重要組織分別接受不同的劑量照射,目前已越來越廣泛地應用于臨床[2]。在直腸癌放射治療過程中,放療物理師需要花很長的時間來優化計劃系統上的放療劑量,反復嘗試,直到滿足臨床需求為止。這個過程費時費力,且非常依賴物理師的工作經驗[3]。因此,放療劑量的準確預測對放療質量控制來說至關重要。近年來,深度學習被廣泛應用于放療工作的研究中,如靶區及器官勾畫[4]、自動計劃[5]、圖像配準[6]、放療劑量預測[7]。國內外關于劑量預測的模型已有諸多報道[8-10],鄭平等[8]預測了宮頸癌共面調強放射治療膀胱、直腸受量,發現其準確度較高;Osman 等[9]提出了一種基于先驗知識(Knowledge-Based Planning,KBP)的模型,該模型使用注意門控機制和3D-UNet來預測頭頸部腫瘤的3D 劑量分布,模型的總體預測性能優于傳統的UNet;Chen 等[10]利用深度學習提出了一種基于DVHnet 的網絡預測劑量體積直方圖(Dose-Volume Histogram,DVH),并將其與商用的軟件進行對比,發現使用DVHnet 預測的所有危及器官(Organs at Risk,OARs)劑量的平均差異為(0.30±0.95)Gy,但該基于KBP 的方法無法預測真實的三維空間體素級的劑量大小。因此,本研究以直腸癌為例,提出了一種基于3DRes-UNet 的深度學習方法,通過提取CT 圖像的特征及OARs 和靶區標簽,建立三維空間的劑量預測模型,用于指導臨床放療工作。
選取既往在內江市第二人民醫院放療中心治療的168 例直腸癌術后患者為研究對象,年齡為40~78 歲(中位年齡58 歲)。所有患者此前均未接受過放療,無放療禁忌證。其中,處方劑量為50 Gy/25 F。使用熱塑膜及專用碳纖維板和頭枕固定患者,并使其在荷蘭Philips 大孔徑CT 模擬定位機下行增強掃描,CT 掃描層厚為5 mm,掃描范圍為腎臟下緣頂到股骨中段。研究已經本院倫理委員會審批通過(批準文號:2024RP-328-04)。
在Monaco 5.11 放療計劃工作站進行靶區勾畫。參照國際輻射單位與測量委員會(ICRU)83 號報告,由臨床醫生勾畫直腸癌術后盆腔的臨床靶區(Clinical Target Volume,CTV),由CTV 外放8~10 mm 獲得計劃靶區(Planning Target Volume,PTV),勾畫膀胱、小腸、左右股骨頭、骨盆等的OARs。在Monaco 計劃系統和瑞典Elekta Synergy 加速器上對每位患者制定VMAT 計劃。射線能量大小均為6 MV X 射線,射野等中心位置相同,劑量率統一為600 MU/min。所有計劃均為2 個全弧(一個為181°~179°,另一個為179°~181°)。限制條件為:95%靶區體積達到100%處方劑量,靶區劑量最大值高于110%的處方劑量體積不超過1%。
從計劃系統上導出既往已治療批準的放療計劃文件,包括計劃文件、CT 影像文件等醫學數字成像和傳輸協議(Digital Imaging and Communications in Medicine,DICOM)格式的數據。由于不同醫生的命名方式不同,首先批量修改結構名,使結構名稱保持一致。影像經過窗寬窗位調整,去噪處理得到滿意的CT 數據。用本研究團隊開發的程序分析提取PTV 和OARs 的標簽(mask),預處理流程圖如圖1 所示。第三方庫是Python3.8 的dicom2nifti、SimpleITK、Pydicom 等, 將DICOM 格式的數據轉化為“nii”圖像格式。為了方便深度學習網絡訓練,需將圖片統一規格。圖片尺寸統一重采樣為128×128×128 大小,空間體素統一采樣為3 mm×3 mm×3 mm。將OARs 膀胱、左股骨頭、右股骨頭、小腸、骨盆的標簽依次賦1、2、3、4、5,賦PTV 的標簽為50。將CT 影像、OARs、PTV 輸入網絡,在模型輸出時與真正的劑量圖(ground truth)通過損失函數、梯度反饋、清零等操作實現OARs 及PTV 在CT影像上接近真實臨床分布的狀態。經過若干訓練后,最終以128×128×128×1 的大小生成一個“Dose.nii.gz”文件,實現VMAT 劑量的輸出。

圖1 數據預處理流程圖
基于傳統的3DUNet,在編碼器Encoder 部分使用ResNet 網絡提取主干特征,采用3×3×3 的卷積核及經過非線性激活函數(ReLU)層和正則化(BN)層增加模型的非線性表達能力,同時保證了感受野的相同,防止訓練過程中出現過擬合或梯度爆炸現象。下采樣過程提取CT 影像、OARs 和PTV 及VMAT 全弧的360°射束信息。
編碼區由Encoder 模塊組成,每個Encoder 模塊均有一個殘差塊,殘差塊包括2 個卷積層,卷積核大小均為3×3×3,每一層的下采樣大小均為3×3×3、步長均為2×2×2、Padding 為1 的Maxpool 卷積操作。解碼器部分與經典UNet 網絡的解碼器一致(圖2)。解碼區負責實現三維特征到劑量分布的回歸擬合。上采樣過程是4 層轉置卷積過程,其中每個模塊包含一個3×3×3 的卷積層,卷積核大小分別為3×3×3、步長為2×2×2,所有轉置卷積層均進行激活函數操作。將168 例患者隨機劃分為訓練集120 例、驗證集16 例和測試集32 例。將訓練集的CT 影像和OARs 及靶區的掩碼2×3×128×128×128(2 為Batch_size 數量,3 為numpy 的concatenate 函數合成的PTV、OAR、CT 三通道數,128×128×128 為每個結構的尺度)輸入網絡進行訓練,輸出維度為1×128×128×128。每隔一個Epoch 驗證一次,保存模型最好的權值文件。損失函數為平均絕對誤差(Mean Absolute Error,MAE),采用Adam 優化算法;學習率下降策略采用余弦退火方式;數據增強的方式有隨機翻轉、旋轉和平移,每個卷積層的卷積核數量依次為16、32、64、128、256,其他參數如表1 所示。在測試集上將預測的劑量與臨床批準的放療劑量進行對比,評價放療劑量的預測精度。選用的深度學習框架為PyTorch 1.9 和Python 3.9。

表1 網絡相關參數

圖2 3DRes-UNet劑量預測網絡
靶區的評價參數為D2、D98、Dmean、均勻性指數(Homogeneity Index,HI)。其中,HI 值越接近0,表明靶區的均勻性越好;適形性指數(Conformity Index,CI)越接近1,說明靶區的適形性越好。OARs 的評價指標為膀胱V40、V50、Dmean,左右股骨頭V30、V40、V50、Dmean,骨盆V15、V25、V35、V45、Dmean,小腸V30、V40、Dmean、D0.1cc。采用相對誤差評價預測值與臨床劑量的差異,劑量差異為臨床劑量與預測劑量的差值。
采用IBM SPSS 22.0 對實際值和預測值進行統計學分析,若符合正態分布用配對t檢驗,結果以±s表示;若不符合正態分布用Wilcoxon 秩和檢驗,計量資料用M[P25,P75]表示。以P<0.05 為差異有統計學意義。
深度學習模型3DRes-UNet 預測的劑量學參數與臨床放療計劃批準的劑量學參數對比結果如表2 所示。靶區PTV 除了CI 外,其他劑量學參數差異均無統計學意義(P>0.05);膀胱V50、Dmean預測劑量小于臨床劑量,差異有統計學意義(P<0.05),V40差異無統計學意義(P>0.05);左股骨頭V40預測劑量小于臨床劑量,差異有統計學意義(P<0.05),V30、V50、Dmean差異無統計學意義(P>0.05);右股骨頭Dmean預測劑量小于臨床劑量,差異有統計學意義(P<0.05),V30、V40、V50差異無統計學意義(P>0.05);骨盆V45和Dmean的預測劑量均小于臨床劑量,差異有統計學意義(P<0.05),其他指標差異均無統計學意義(P>0.05);小腸V30、V40、Dmean、D0.1cc差異無統計學意義(P>0.05)。

表2 臨床劑量和3DRes-UNet模型預測劑量學對比
某例患者的臨床劑量與預測劑量比較圖如圖3 所示。由圖3 可知臨床劑量與預測劑量分布很接近,說明3DRes-UNet 模型可準確預測直腸癌三維空間的劑量。從臨床劑量與預測劑量的差值來看,靶區區域的誤差很小,在OARs 區域的誤差較大。在膀胱的誤差達到了10 Gy,主要是PTV 的位置相對固定,OARs 的位置相對不固定導致的,如膀胱的充盈程度變化很大。其他區域的誤差范圍為-10~10 Gy。DVH 對比圖如圖4 所示,深度學習模型預測的結果基本滿足臨床需求,且預測值與臨床值曲線接近重合。

圖3 測試集臨床劑量與實際劑量及其差異比較

圖4 測試集臨床與預測DVH圖比較
放射治療作為治療直腸癌的一種重要方式,被廣泛應用于臨床。準確預測三維空間體素的劑量在臨床上有重要意義,放療計劃質量直接決定了靶區的受量和正常器官的副反應,因此,計劃質量決定了臨床療效,物理師的經驗和人為因素影響了計劃質量。若能準確預測放療劑量的受量,提取先驗信息提前指導放療新計劃設計,排除因計劃設計經驗導致的靶區劑量不夠或OARs 劑量過高,有助于減少腫瘤的復發及正常組織的放療毒副反應發生率。本文提出3DRes-UNet 深度學習方法,將直腸癌CT 影像及標注的靶區和OARs 的掩碼輸入模型,輸出放療劑量,最終通過測試集測試模型的準確性。
深度學習作為人工智能領域中機器學習的一個子領域,在醫學圖像處理中已得到了廣泛應用。卷積神經網絡是計算機視覺任務中最受歡迎的深度學習框架[11]。卷積神經網絡通過卷積核提取輸入數據的重要信息,并通過激活函數如sigmoid 和tanh 函數進行非線性處理。通常深度學習框架由大量的人工神經元多層網絡組成,這些多層網絡可自動捕捉原始圖像中與分割任務或分類任務有關的圖像特征。相比于傳統的3DUnet 網絡,本研究提出的3DRes-Unet 模型引入了ResNet 特征提取模塊,不僅提升了模型在下采樣過程的全尺度特征提取能力,還通過設計兩階段的訓練策略,加快了模型收斂,也進一步提升了模型的預測能力。
近年來,人工智能被廣泛應用于放療劑量預測,并取得了重要的成果。早期,Ma 等[12]開發了一種通量圖預測方法,該方法可直接生成給定所需劑量分布的通量圖,無需對VMAT 計劃進行優化。Zhu 等[13]以前列腺為例,基于機器學習的方法,根據解剖信息和膀胱、直腸的特征關系,利用主成分分析法提取顯著特征以預測OARs 劑量。何強等[14]提出一種新型的基于多模態特征及多分類器融合的預測模型,并以前列腺癌放療為例,構建了直腸并發癥的預測模型。本研究將深度學習應用于劑量預測,對模型的特征提取編碼部分采用的是先進的殘差網絡[15]。王文成等[16]利用3DRes-UNet 預測了食管癌的調強放射治療(Intensity-Modulated Radiation Therapy,IMRT)計劃,通過依次增加每個編碼層的殘差塊個數,大大增加了模型的參數量,加大了模型的復雜程度,而本研究中的每一層編碼層只有一個殘差塊,網絡計算量減少,且本研究為VMAT,射束配置為0°~360°間隔一個角度出束,細化了束流配置信息。此外,本研究還加入了ReLU層及BN 層,加快了網絡訓練速度和收斂穩定性,防止權重在訓練過程中被破壞的同時,大大提高了模型的綜合特征提取能力。周解平等[17]利用3DRes-UNet預測了直腸癌的IMRT 計劃,每個編碼模塊由不同數量的殘差模塊組成,殘差塊加大了模型的計算量,而本研究簡化了模型,同樣取得了準確的預測結果。早期,Zhong 等[18]利用基礎的3DUNet 預測了直腸癌,每層卷積核的數量依次是32、64、128、256、512,而本研究每個卷積層的卷積核數量是16、32、64、128、256,而且與臨床劑量相比,預測的HI、D2、D98、Dmean差異均無統計學意義(P>0.05),靶區CI 差異有統計學意義(P<0.001),這與Song 等[19]的研究基本一致。此外,本研究發現膀胱、左右股骨頭、骨盆、小腸等多數劑量學指標差異無統計學意義,有個別的指標差異有統計學意義,這與Wu 等[20]的研究基本一致。既往的研究多是基于KBP 并根據以往的患者預測新患者的DVH[21-22],但因為無法得到三維的空間信息,故存在一定的局限性。本研究提出的深度學習模型可準確預測三維體素級的空間劑量,該方法可拓展到其他腫瘤的預測研究中。
綜上所述,本研究以直腸癌術后VMAT 為例,提出了基于3DRes-Unet 的深度學習模型,可準確預測直腸癌的放療劑量,為臨床提供參考。