郭逸瀟,劉志強,李鴻巖,馮維貴,張致遠,李淑萍
1.甘肅省人民醫院放療科,甘肅蘭州730000;2.中國科學院蘭州近代物理研究所輻射醫學室,甘肅蘭州730000;3.中國科學院重離子束輻射生物醫學重點實驗室,甘肅蘭州730000
根據美國Anderson 癌癥中心和Imaging and Radiation Oncology Core(IROC)QA中心2020年一項針對治療計劃質量保證(Qulity Assurance, QA)的調查報道(共1 455份調查,其中91.9%來自美國和加拿大):劑量驗證最常用的工具是2D 二極管陣列(52.8%)、點電離室(39.0%)、電子射野影像裝置(Electronic Portal Imaging Device, EPID, 27.4%)及電離室矩陣(23.9%),許多機構使用多種測量工具,對于二極管和電離室探測器測量,絕大多數在模體中評估結果[1]。此外,相關研究指出劑量驗證結果可能因多種不同商用硬件和軟件系統而有較大差異,不同采樣和插值方法的使用導致差異較大的γ 通過率[2-4]。
脊柱轉移瘤是惡性腫瘤的破壞性并發癥,患者由于疼痛、活動或神經功能障礙而降低了生活質量。放療目前廣泛用于脊柱轉移瘤的治療,可作為外科手術的輔助治療或根治方案以改善癥狀,延長生存期[5-6]。 Radiation Therapy Oncology Group(RTOG)0631 II 期研究得出結論:脊柱立體定向放射外科治療(Stereotactic Radiosurgery, SRS)和立體定向體部放射治療(Stereotactic Body Radiotherapy, SBRT)是安全可行的,與傳統三維適形和調強放療相比,SRS/SBRT在增加局控率和完全緩解方面具有優勢[7-9]。
Varian aSi-500和aSi-1000 EPID由于劑量飽和效應而不適用于高劑量率的非均整(Flattening Filter Free, FFF)計劃驗證,其新型aSi-1200 EPID 配備Digital Magavolt Imager(DMI)可支持FFF 計劃劑量驗證[10-11],而目前應用aSi-1200 EPID 進行高劑量率和單次大劑量放射治療劑量測量的報道很少。本研究采用aSi-1200 EPID 對23 例6 MV FFF 脊柱轉移瘤SRS/SBRT 計劃進行驗證,并與PTW Octavius 1500電離室結果對比,探究兩者在FFF劑量驗證中的不同表現及可能存在的問題。
回顧性選取甘肅省人民醫院放療患者數據庫中2019年2月~2020年9月期間的23例胸椎和腰椎脊柱轉移瘤SRS/SBRT治療計劃。計劃納入標準:(1)靶區范圍≤5個受累椎體,劑量分割方案為30 Gy/5 次;(2)瓦里安EDGE加速器,6 MV FFF射線,劑量率1 200 MU/min;(3)Eclipse 13.6 治療計劃系統(Treatment Planning System,TPS)設計多段部分弧RapidArc治療計劃,射束參數優化使用光子優化法(Photon Optimizer,PO-13.6.23),劑量計算使用各向異性解析算法(Anisotropic Analytic Algorithm,AAA-13.6.23),計算網格1.0 mm。
aSi-1200 EPID有效測量面積43 cm×43 cm,探測器個數1 280×1 280,分辨率0.336 mm[10],在任何源到影像探測板距離(SID)不會出現飽和效應[10-11]。本研究設定SID=100 cm,使用連續圖像采集模式(在Plan Scheduling 中每個輻射野加入積分成像)。理論上EDGE 加速器PD 加入了二維射野劑量修正的應用,能有效地校正探測板支撐臂的背向散射與探測器的離軸響應,使得PD 測量結果更為準確,其射束直接作用于Portal imager,獲取時間積分成像數據,此方法的局限性是無法提供絕對劑量信息,只是間接地比較了通量。
Octavius 1500 矩陣由1 405 個空氣電離室組成,單個電離室幾何尺寸0.44 cm×0.44 cm×0.30 cm,電離室中心間距0.707 cm,可測量劑量率高達48 Gy/min,有效測量范圍27 cm×27 cm,基于不同機架角度的測量劑量和源皮距(Source-to-Surface Distance, SSD)85 cm 處不同射野大小的百分深度劑量(Percentage Depth Dose, PDD),Verisoft7.1 劑量分析軟件通過對平面測量劑量插值重建得到模體和患者解剖結構的三維劑量。
將23 個計劃分別驗證,利用VeriSoft 軟件對TPS和Octavius 1500 測量的劑量分布在全局歸一方式下以3%/2 mm、2%/3 mm、2%/2 mm 和2%/1 mm 的標準進行橫斷面2D γ 通過率(Gamma Passing Rate,GPR)評估,EPID 測量數據使用PD 系統中Improved Gamma 方法(相當于全局歸一)在相同的標準下評估。設定閾值分別為TH5、TH10 和TH20,表示對超過最大劑量5%、10%和20%的點劑量予以γ 分析,探討不同閾值對通過率的影響。將患者DICOM RT plan、RT structures、RT dose 和CT 數據集導入Verisoft軟件重建劑量,對比基于電離室矩陣測量重建和TPS計算的劑量體積直方圖(Dose Volume Histogram,DVH)差異。
任選5 個計劃,對原計劃進行修改得到以下引入誤差計劃:(1)透射率(TF)由TPS 預設值0.0118%變為0.035 4%(+0.023 6%),劑量葉片間隙(DLG)由TPS 預設值0.91 mm 變為1.21 mm(+0.30 mm)、1.41 mm(+0.50 mm)、1.91 mm(+1.00 mm),引入系統性的MLC模型誤差。(2)在x、y和z 3個方向同時引入治療計劃的等中心位置誤差(+1 mm、+2 mm、+3 mm和+7 mm)。(3)每一條射束弧引入+1%、+3%和+5%的治療跳數(Monitor Unitm,MU)誤差,改變了原始計劃每條弧的相對劑量權重,引入的劑量誤差導致Octavius模體內產生不同量級的計算劑量系統性偏移。
共創建55 個誤差計劃,重新計算劑量后與無誤差計劃的測量劑量行模體內GPR 評估,與無誤差GPR 比較以考察Octavius 1500使用GPR 方法檢出誤差計劃的能力。
對于無誤差計算和不同的誤差計算,GPR 預計將表現出較大的差異。本研究納入無誤差和誤差計算GPR 的標準偏差,認為滿足以下情況則檢測到誤差計劃中的錯誤:

其中,代表γ 通過率的平均值,s 為標準偏差。方程左邊和右邊的量值分別表示引入誤差和無誤差計算的最小通過率(下限),計劃之間必然存在復雜度的差異,故從平均通過率減去其標準誤。這兩個量之間的界限越清晰,則分離出誤差的置信度越高。
采用Origin 9.1 繪制圖表,SPSS 19.5 軟件對數據進行分析,對兩種探測器的GPR 結果行Shapiro-Wilk顯著性假設檢驗(W檢驗),在α=0.05 的檢驗水準下若樣本數據服從正態分布,采用t檢驗推斷不同通過率標準下兩種驗證方式的均值是否有顯著性差異;若樣本數據呈現明顯的偏態分布則采用非參數檢驗(曼-惠特尼U檢驗),因樣本量大于20,漸進顯著性的P值接近真實P值,故以真實P值為準。P<0.05 為差異有統計學意義。
因樣本量小,不同標準和閾值的GPR 經檢驗均不符合正態分布(顯著性P<0.05),因此采用非參數檢驗。由圖1 可看出兩種方式得到的GPR 均值和離散度在不同標準和閾值下迥然不同,與Octavius 1500相比EPID 通過率均值更高,對比同一標準不同閾值GPR 發現EPID 結果均勻性更好,且兩種方式在相同通過率標準下都隨閾值的增加均值減小而標準差變大。對3%/2 mm 和2%/3 mm 的標準,兩種方式的均值皆>96%且各組數據離散度較小(≤3.23%),而對2%/2 mm 和2%/1 mm 的標準,兩種方式相同標準和閾值下均值差異(≤9.48%)和數據離散度均增大。對所有通過率標準,當低劑量閾值從5%增加到20%時,EPID 的平均GPR 變化<1.83%,而Octavius 1500的平均GPR 變化<9.83%,似乎Octavius 1500 GPR 更依賴于低劑量閾值。

圖1 23個計劃在不同標準和閾值的γ 通過率(箱型圖及正態分布的點和線)Fig.1 Gamma passing rates at different criteria with different thresholds for 23 plans(box charts and the points and lines of normal distribution)
8 個計劃重建時出現錯誤,只有15 例重建成功,靶區和危及器官(OARs)的劑量偏差見圖2,定義±5%的劑量偏差具有臨床意義。可見CTV 和PTV 的Dmin、Dmax和Dmean偏差整體較大,其中CTV 最大DD%值分別為50%、11.31%和-8.71%,PTV 最大DD%值為-25.86%、9.31% 和-8.22%。CTV 的Dmin、Dmax和Dmean偏差超過±5%的計劃數分別為10(66.67%)、2(13.3%)和2(13.3%),PTV 為9(60.0%)、2(13.3%)和5(33.3%),心臟為5(55.6%)、2(22.2%)和1(11.1%),健側肺為1(14.3%)、2(28.6%)和1(14.3%)。Verisoft軟件只能重建出電離室有效測量范圍內(27 cm×27 cm)靶區和OARs 的劑量,因而心臟和健側肺分別有6 例和8 例超出測量范圍而未重建到劑量;重建到2 個計劃 的食管劑 量,其Dmin、Dmax和Dmean的DD%均小于±5%;重建到2 個計劃的脊髓劑量,其Dmin、Dmax和Dmean的DD%值分別為100%、0%、3.57%和0%、-5.62%、0%。大部分靶區和OARs 的DD%在±5%以內,巨大的偏差主要存在于Dmin。

圖2 靶區和危及器官Dmin、Dmax和Dmean的DD%Fig.2 DD%of the Dmin,Dmax and Dmean to target areas and organs-at-risk
TH10 情況下,誤差計劃與無誤差計劃的GPR 見表1。表1 顯示,對每種類型的偏差,大部分GPR 隨偏差幅度的增加而下降,少部分值顯示稍微有所提升。根據式(1)的誤差檢測標準,治療等中心誤差幾乎都被檢測到,+3%和+5%的MU 誤差都被檢測到,所有標準均未檢測到TF 誤差,只有2%/3 mm 的標準檢測到+0.3 mm 的DLG 誤差,+0.5 mm 和+1 mm 的DLG誤差都被檢測到。

表1 誤差計劃與無誤差計劃的γ通過率(xˉ± s,%)Tab.1 Gamma passing rates for plans with and without errors(Mean±SD,%)
TF 增大0.023 6%和DLG 增加0.3 mm 的誤差計劃分別與無誤差計劃對比,通過對靶區和OARs DD%的評價探究這兩個誤差對6 MV FFF 能量劑量計算的影響,如圖3 所示,評價指標包括:靶區Dmean、Dmax、V95%、V100%;脊髓Dmean、D0.1cc;健側肺Dmean、V5、V20和心臟Dmean,可看出這兩個誤差均導致了靶區和OARs的劑量增加,其中OARs劑量增加更明顯,尤其健側肺的V20分別增加了9.80%和8.85%,脊髓D0.1cc均增加5.35%。

圖3 MLC透射率和劑量葉片間隙誤差對靶區和危及器官劑量的影響Fig.3 Effects of errors from MLC transmission factor and dosimetric leaf gap on doses to target areas and organs-at-risk
1 例測量重建和計劃系統計算DVH 對比圖,可看出靶區和危及器官重建劑量整體偏低(圖4)。

圖4 TPS計算和Verisoft重建的DVH對比Fig.4 DVH comparison between TPS calculation and Verisoft reconstruction
IROC 模體對許多放療機構的測試揭示出實施劑量與計劃劑量之間存在較大偏差[12-13]:2001年至2011年間頭頸部計劃的通過率僅為81.6%(7%/4 mm標準),若使用5%/4 mm 標準失敗率將進一步增加,其錯誤最常表現為系統劑量偏差(>58%),其中由于劑量不足導致的失敗率最高,即劑量分布具有正確的形狀和位置,但存在系統性的量級錯誤。射束建模缺陷是導致GPR 低的另一個普遍原因,68%的失敗模體驗證受到TPS 計算誤差的影響[14],模體是按照患者流程執行照射的,這些有問題的射束模型在患者計劃中劑量計算的錯誤遠超過模體中錯誤計算的程度。影響劑量計算準確性的因素主要來源于3個方面:(1)基本劑量學參數建模中的錯誤如PDD、離軸因子和散射因子等[15],以及非劑量學參數的變化如DLG[16];(2)測量CT 值及相對電子密度關系數據轉換出現誤差,降低了校正非均勻組織照射劑量的準確性;(3)劑量計算算法的局限性,射線與人體各組織相互作用過程非常復雜,在處理計算模型的過程中往往需要做某些假設。IROC 另有研究表明大多數臨床QA 設備在檢測不可接受的計劃時靈敏度較差,表明常規QA 只是簡單地通過了所有計劃,而不管質量如何[17]。近些年通過深度學習來改善和預測QA 的新方法正在測試中,但基于常規測量的方法仍然是普遍方法[18-19]。本研究使用EPID 探測板和PTW 電離室矩陣對椎體轉移瘤SRS/SBRT 計劃進行驗證的評估,發現3%/2 mm 和2%/3 mm 標準下EPID GPR 均值在99%以上,而Octavius 1500 矩陣的GPR整體偏低,1 個計劃Octavius 1500 通過率分別為88.7%、86.6% 和79.2%,而EPID通過率分別為99.5%、99.5%和99.4%,推斷Octavius 1500 檢測不可接受的計劃時靈敏度應該更好,為此任選5 個計劃,使用GPR 方法識別引入不同類型和量值的誤差計劃。結果表明對每種類型的誤差,大部分GPR 隨誤差幅度的增加而下降,少部分值出現誤差量級增加但GPR 反而稍微有所提升的現象,分析原因:(1)復雜治療技術中射束建模和劑量計算方法的局限性會引入誤差。(2)Verisoft軟件使用插值算法重建模體內劑量(估計沒有探測器的區域劑量),重建過程會引入不同程度的誤差。TF 是射線穿透MLC 的能力,由射線質決定,其值域區間為0~1。劑量葉片間隙用來補償葉片的弧形端面對劑量的影響,一般使用電離室測量多個不同MLC間隙的射野得到一組間隙和劑量的對應數據進而擬合得到,其值依賴于電離室測量結果的準確性。實驗結果可見所有標準均未檢測到TF 誤差,+0.3 mm 的DLG 誤差只有一個標準檢測到,將這兩個誤差計劃重新計算劑量后與無誤差計劃對比,發現靶區和OARs的劑量均存在不同程度的增加,其中OARs劑量增加更明顯。表明僅通過GPR無法可靠地識別引入誤差的MLC 模型,需要更有效的質量保證方法來提高檢測TPS劑量誤差的靈敏度。
一些基本的特征常常隱藏在商用γ 指數計算軟件中,導致相同的輸入和評估標準卻產生不同的結果[2-4]。物理師很難確切地知道γ 指數值是如何在這些軟件中計算出來的,確定這些差異的原因需要制造商披露軟件實施細節,例如描述測量值和TPS劑量是只對其中一個還是兩個都進行了插值及插值到什么水平,使用了什么類型的插值算法。GPR 的一個缺點是不能提供不通過點的細節,另一個缺點是γ 本身是一個絕對度量,不能提供失敗點是由于正(負)劑量波動或距離波動引起的,如在OARs 中,測量值低于計算劑量的點可能大于劑量差標準,在這種情況下,失敗點在臨床上是可以接受的,因為OARs 接受的劑量低于預期劑量,放射治療的目的是保持OARs的劑量盡可能低。相反,在PTV 區域也可能有一個失敗點,在那里測量的劑量較高,這也是可以接受的。此外,同一軟件的不同版本之間,γ 指數計算的細微變化可能會導致結果的差異,當任何新的軟件升級發布時,理論上用戶應該執行γ 指數的基準測試。
物理師們常用的2D 探測器如MapCHECK、EPID、MatriXX 和Octavius 729/1500, 3D 模 體 如Octavius 4D、ArcCHECK 和Delta4,這些劑量測量系統都不能實現高分辨率的3D 劑量測量,而是借助于一種算法將測量到的平面劑量重建到3D模體和患者解剖結構上,因此可被稱為準3D 劑量驗證系統[20]。為了能夠在三維空間估計傳輸劑量,使用者既依賴于測量不確定度,又依賴于劑量分析軟件重建算法的準確性。測量和重建受測量點的限制,其劑量分布的比較直接取決于探測器的間距,例如,OARs 可能超出探測器區域,測量與計算劑量之間的差異將導致OARs 內未被發現的過劑量(超出耐受量)。本研究使用Octavius 驗證系統重建的三維劑量表明部分Dmin存在巨大的劑量偏差,部分Dmax和Dmean劑量偏差超過±10%,據報道COMPASS 系統在TPS 和重建劑量某些DVH 指標上也存在-67.88%~15.26% 的DD%差異[21],只有2 個計劃Dmin、Dmean和Dmax的DD%在±5%的范圍內。Octavius 系統基于解剖結構重建劑量只取決于電離室矩陣的測量劑量,獨立于TPS計算劑量和γ通過率,因此臨床關心的基于解剖結構計算和測量劑量的差異很大程度上取決于測量的平面劑量和軟件所使用重建算法的精度,8 個計劃重建DVH 出現錯誤:Marching Way索引超出了數組界限,“System Out of Memory Exception”的異常導致重建失敗,可能系軟件Bug所致。此軟件在三維劑量重建中需要對二維陣列和三維模體的數據點進行線性插值以增加數據量,DVH 重建基于一種更復雜的插值,這些算法在臨床使用過程中需要仔細測試驗證,以評估算法的不確定度受治療部位和計劃復雜程度的影響。
近幾年國內使用EPID 進行劑量驗證研究的文獻,大都是基于Varian 公司所配備的EPID 及其開發的Portal Dosimetry 軟件進行的,但PD 算法未使用模體計算劑量,不能驗證傳遞到患者體內的劑量。相關研究表明治療前的EPID劑量測量方法僅能檢測到所有放射治療臨床報告6%的差錯,Varian EPID 和MatriXX 設備都錯誤地表明:不可接受的計劃與可接受的計劃一樣好甚至更好,相反,在體EPID劑量測定技術能夠檢測到大多數(74%)與放射治療有關的差錯事件[22],通過重建患者解剖影像與所受劑量的融合數據,能夠在整體上評估患者受照部位各個器官劑量與所受劑量的體積,作為在線或者離線的劑量評估以指導后續的治療,有望提高腫瘤控制率降低由劑量誤差導致的并發癥概率[23-25]。值得注意的是EPID 響應是加速器特定的,取決于許多射束參數如能量、散射貢獻、射野大小、響應線性和劑量率等。因此,物理師們在臨床使用前應測試他們自己加速器不同能量的EPID響應。
本工作的局限性之一是僅使用一種TPS,另一種TPS 可能根據加速器模型的不同而計算出不同的劑量分布,例如,不同的低劑量模型,不同的TF 和DLG。局限性之二是只在一個加速器上進行測量,未對MLC葉片寬度如何影響引入的誤差和結果進行研究,應該對比在不同的TPS 和MLC 尺寸下這些結果是否存在差異。
綜上所述,僅通過γ 分析方法無法可靠地識別引入MLC 模型誤差的計劃,應將其與誤差引起的臨床劑量學指標變化相結合,也提示鑒別TPS問題的根源需要更有效和精準的質量保證方法;TPS投入臨床使用前應進行相應測試來確定最佳TF 和DLG 值從而確保患者計劃劑量的準確計算;進行劑量驗證系統軟件算法的獨立驗證研究以確定算法的誤差范圍。
致謝:感謝中山大學腫瘤防治中心鄧小武教授對本研究所提供的思路支持。