陳思佳,石麗婉,林勤
廈門大學附屬第一醫院腫瘤放療科,福建廈門361000
隨著放射治療技術的發展和對放射治療精準度要求的不斷提高,放療工作者們對放療計劃的評判標準也提出了更高的要求。由于個體組織結構、評價標準和經驗認知上的差異,物理師和醫師對靶區和危及器官(Organ-at-Risk,OAR)的優化條件處理和最終計劃的評判標準上有著不同的側重點。而放療計劃在設計和評價環節中人的主觀因素將會直接影響到最終放療計劃的質量。在對數家醫院獲取的各部位調強放療計劃的劑量學分析中不難發現,即便是符合臨床治療標準的計劃,仍有63%的患者靶區接收到不足90%的給定劑量,而46%的患者接收到的劑量超過給定劑量的110%,也就是臨床提到的“冷熱點”。而冷熱點的差異程度也隨著靶區和危及器官的復雜程度逐漸增加[1]。目前針對如何提高放療計劃質量,傳統的改進方法包括優化模型目標函數的改進和放療參數優化等手段。近年來通過人工智能技術進行放療優化的方式逐漸為人們所關注[2]?;谥R的放射治療技術(Knowledge-Based Radiation Therapy,KBRT)為放療計劃設計的同質化提供了解決方案,在一定程度上彌補了因物理師和醫師的主觀因素造成的計劃質量差異,為放療計劃設計自動優化條件提供了參照。同時KBRT 還縮短了放療計劃優化時長,為新計劃提供可能的范圍作為優化參考,提高了整體優化效率。諸多的優點使得對KBRT的研究在近年來逐步增加,不少研究者表示KBRT 或將成為下一代自動計劃系統的重要突破口,而廣泛地開展前瞻性方面的研究將會讓這項技術得到更廣闊的應用空間[3-4]。
在解決應用領域中較為復雜的問題時,除利用基本原理和常識之外通常還需要借助領域內專家的經驗知識來支持人們做出正確的決策和行動。而在放療計劃設計的過程中也面臨著類似的狀況。當下通過人工設置條件進行反復迭代優化依舊是大部分計劃系統采用的主要優化方式。該方法在優化期間會消耗物理師大量的時間與計劃系統(Treatment Planning System,TPS)進行交互迭代,且物理師的經驗和判斷將顯著地影響計劃的結果和質量,經驗豐富的物理師往往可以用更短的時間做出更符合臨床需求的計劃。如何將豐富的臨床經驗和實踐運用到保障放療計劃質量,同時兼顧優化效率成為了研究者關注的重點問題。KBRT 選取了具有相同或相近特征(如病種、放療技術、體位固定等)的一類臨床放療計劃,由資深物理師進行審核或再優化后加入數據庫中,通過生成特定規則以匹配數據庫中的計劃或訓練生成的模型預測組織劑量范圍,最終獲得相應的約束條件以進行自動或者半自動計劃設計。利用該項技術,一方面可以對尚未優化的放療計劃進行預測分析,估計危及器官和靶區可能的劑量-體積直方圖(Dose-Volume Histogram,DVH)分布范圍,為臨床計劃提供參考;另一方面可以結合計劃系統的優化算法,在無人為干預的情況下根據模型提供的優化參數對計劃進行初步的優化,提供滿足臨床要求的早期結果,提升計劃優化過程的工作效率。
盡管KBRT 的理論在20 世紀80年代就已提出[5],但受限于當時的技術水平無法真正地實現對原計劃的改進。而通過算法實現KBRT 出現在機器學習等人工智能相關概念興起之后。利用先驗知識和數據,通過一系列規則和算法賦予計算機學習模擬人類解決復雜問題能力的方法稱為機器學習,它是人工智能研究的重要分支[6]。目前機器學習已在多模態圖像融合、靶區勾畫、放療計劃和質量控制等多個放療領域取得了突出的進展[7-9]。研究者通過分析和提取病人的幾何結構和劑量分布等相關信息,運用算法和規則建立特征與模型的聯系進行比較分析并生成對應的統計模型。在有新的查詢病例作為輸入時,上述規則或模型可以挑選出合適的案例或形成可能的分布區間來預測新病人的劑量-體積直方圖,并通過不斷增加數據和訓練的方式來完善這類模型。目前能夠實現KBRT 技術的兩類主要方法是特征檢索法和機器學習。
1.2.1 KBRT 中的特征檢索法在收集足夠多高質量的臨床放療計劃后,如何用這些數據有效地指導和進行新計劃的優化,達到甚至超越經驗豐富的物理師水平成為了KBRT最為核心的問題。
在研究中,高質量的計劃通過預處理將特征形成索引目錄。當輸入新的查詢計劃時,通過一系列特征提取和相關性計算后與庫中的信息進行檢索或匹配,找出最適配的計劃作為參考計劃對原計劃進行改進。由于解剖結構近似的計劃在劑量分布上也常常比較接近,因而通過檢索相似解剖結構的計劃并對其射野進行形變調整的想法在早期的KBRT 被廣泛使用[10-11]。這種形變為建立在計劃中射束視野(Beam's Eye View,BEV)下的二維形變配準,這些二維光束的視線圖像首先與方差配準對齊,然后使用互信息(Mutual Information, MI)度量計算相似度。找到最接近的匹配點后,將計算出的約束條件和變形后的通量圖輸入到治療計劃系統中,并使用匹配計劃的約束條件生成新的治療計劃。這一過程也可以通過對PTV 的三維形變配準后進行,最終得到的劑量分布與二維形變結果相比較沒有太大的差別[11]。
同樣的,以重疊體積直方圖(Overlap Volume Histogram, OVH)作為檢索算子對數據庫中的計劃進行檢索,尋找最優解的方式也被用于KBRT早期的研究之中。OVH被定義為PTV對應外擴的虛擬體積與OAR 的重疊體積在OAR 中的占比。在PTV 擴展距離增加時,PTV 與OAR 重疊接近100%。利用OVH 算子可以大致判斷出PTV 與OAR 的簡易三維形態關系,進而通過該關系對庫中進行過OVH 預處理的計劃進行檢索,找出與目標相匹配的計劃用于DVH預測或者計劃的半自動優化[12-13]。
對于這類基于檢索法為基礎的KBRT,都是簡單地利用了解剖結構、射野幾何結構或者幾何結構算子來快速查詢到庫中相配對的計劃,進而將配對計劃的優化條件等臨床經驗運用于查詢的新計劃之中。但在實際操作中,由于各個OAR與靶區之間的相對關系較為復雜,單一檢索算子的分析篩選只能滿足少部分簡易的靶區結構,而在劑量方面只是在線束射野的二維平面下的通量改變。這在一定程度上對于KBRT在三維劑量分布的準確性上產生了影響。
1.2.2 KBRT 中的機器學習伴隨著放療技術的發展和對空間劑量分布的重視,人們更希望計劃在滿足DVH 的前提下提高空間劑量分布的準確性。但如果將患者體內的三維劑量分布與放射治療中相關的幾何結構等因素相關聯進行預測分析,將會形成高維的數據集合,在提高系統精準度的同時帶來巨大的計算量。而這些幾何結構的因素往往又因為每個特定患者具有復雜的靶區結構,導致無法在不丟失重要數據的情況下有效地壓縮信息量或減少數據的維度。然而,通過主成分分析法(Principal Component Analysis,PCA)提取最顯著特征來表征,可以大大減少數據維度,使得數據集可以在結合三維劑量分布提升預測準確度的同時減少大量的計算量[14]。
研究者為每個OAR 創建了一個劑量-靶區直方圖(Dose-to-Target Histogram, DTH),以便在PCA 計算過程中與PTV 和OAR 的DVH 共同使用。其中DTH 與OVH 的概念相同,即PTV 對應外擴的虛擬體積與OAR的重疊體積在OAR中的占比。
對庫中m個計劃中每個OAR 的DVH 和DTH 進行采樣,生成特征點的m維分量向量。移動特征空間的原點使其表示平均特征值,并對這些特征點進行規范化處理。在這一坐標系中建立m×m協方差矩陣,并進行奇異值分解(Singular Value Decomposition, SVD)得到m個特征向量和特征值。由于DVH 和DTH 變化較大的成分將產生更重要的幾何數據,因此被識別的主成分被用來進行模型訓練。在m維數據中,這種特定挑選的特征可以顯著減少計算消耗。
在回歸型支持向量機(Support Vector Regression,SVR)建立的映射下,通過輸入幾何體中提取主成分,并將逆旋轉和平移應用于該空間,進而還原到構建相關矩陣的原始特征空間,最終預測患者正常組織可能的DVH范圍[15]。
Varian 公司研發的Rapidplan 功能運用機器學習的方法,并在上述基礎上提出了GEDVH 的概念,詳細規范了幾何參數并進行主成分分析,通過幾何參數的回歸模型預測DVH。同時結合了其臨床的TPS進行使用,通過模型訓練的方式逐步提高放療計劃預測的準確率,現已成為可進行高質量放療計劃設計和質控的TPS工具。
隨著KBRT 概念的提出和相關軟件在放療計劃系統中的應用,人們開始逐漸關注到這一領域并對其進行了各種嘗試和探索,并在研究的過程中重點關注KBRT 在臨床方面的實踐、KBRT 計劃與常規放療計劃的對照研究、KBRT 與其他放療技術的結合等幾個方面。這些研究對于KBRT 在臨床實踐中的流程化和規范化使用給予了極大的幫助。
在已知的KBRT早期研究中,基于知識的放療計劃優化(Knowledge-Based Planning, KBP)的探索涵蓋了絕大部分可以進行放射治療的病種,如頭頸部腫瘤[10,16]、乳腺腫瘤[17]、直腸腫瘤[18]和前列腺腫瘤[3,10,14]等。在這些研究中可以了解到,通過訓練的KBP 模型所生成的計劃可以初步滿足臨床的要求,在優化效率上也顯著優于常規計劃方式。因此,如何在滿足臨床要求的基礎上提高劑量學的評判標準成為了研究的重點。
為了減小不同醫療機構間調強放療計劃的差異,減小冷熱點的發生,Good等[18]采集了大型癌癥放療中心132 例無冷熱點的前列腺癌病人調強放療計劃生成了KBRT模型,并利用該模型對其他醫療機構的前列腺癌調強放療計劃實施了射野形變配準和再計劃。研究對比可以發現對于95%的案例而言,KBP 在均勻性和同質性方面并不遜于原計劃。KBRT 能夠成為具備豐富臨床經驗的醫療機構推廣專業放療技術的媒介。
較傳統放療計劃而言,KBP 所生成的計劃的優越性主要體現在面對多靶點和多OAR摻雜時所表現出的計劃的一致性和適應度等特性。而針對這一點,Tol等[19]在對頭頸部這類具有復雜靶區和OAR結構的計劃進行劑量學比較和評估后也得到了相似的結論。目前而言,KBRT 基于DVH 的方法的關鍵限制是缺乏空間信息,物理師可能需要額外的工作來改善模型或者人工干預來處理OAR和靶區可能會出現的劑量分布不均和高劑量點等意外狀況。
像Rapidplan 這類需要進行建模的KBRT 應用為使用者提供了建模過程會遇到的統計學參數,不同參數對應著不同的劑量和幾何關系。在建模過程中,使用者需要進行多次的數據檢查和篩選工作,以保證最終驗證模型能夠順利地進行DVH預測。同時模型在每次訓練后也會反饋回歸參數和圖表,供使用者對強影響點和離群值進行分析和處理。可以說一個模型的成功與否很大程度上取決于這些模型異常值的取舍上。
Sheng 等[20]在研究盆腔部KBRT 離群值對于模型整體影響時發現,針對幾何和劑量離群值的細致分析可以提高模型的質量。由于離群值會對模型庫初始數值的普通最小二乘回歸線產生影響以滿足回歸線覆蓋模型庫中的所有數值,尤其是劑量離群值較幾何離群值而言具有更明顯的擾動效應,但在優先級上應優先處理幾何離群值。Delaney 等[21]在對頭頸部腫瘤模型離群值的進一步研究中提出了不同的觀點,他認為對一個由大量連續數據組成的合適模型而言,花費時間進行反復的離群值剔除處理是不必要的。數據顯示,去掉幾何和劑量離群值對KBP 模型而言并不能從總體上提高計劃的質量,因為回歸曲線并未因離群值的大量去除而發生變化。而對于一個一致性較好的模型而言,模型預測的范圍隨著參雜的離群值數量的增加而變寬,并且顯示出預測范圍向著高劑量區偏移的特點,這可以有效地減少過擬合現象的出現。而越來越多的證據顯示,模型通過大量的數據訓練后可以減少異常點對于模型的影響,從而擴大今后模型的適用范圍以應對可能會遇到的更多更復雜的靶區幾何分布。
KBRT 技術的另一項優點是其出色的兼容性。在與傳統和新興放療技術的結合中產生了諸多的創新。這其中不乏有出色的研究,它們在改變傳統放療計劃流程的同時也提高了放療的質量安全。
立體定向體部放療(Stereotactic Body Radiation Therapy, SBRT)技術可為無法耐受手術治療的早期肺癌患者提供相近的療效,因而越來越受到人們的關注。但由于SBRT 技術相對于常規分割的放射治療而言單次劑量更高,因而對于胸壁、肋骨和臂叢神經等正常組織產生的損傷會更嚴重。對于這類SBRT 計劃而言,控制正常組織的受量可以減少一定的放療并發癥的發生。盡管尚未有直接證據證明SBRT 毒性和OAR 劑量分布存在直接聯系,但利用KBP 鑒別人工優化的高風險肺部腫瘤SBRT 計劃卻可以有效地降低正常組織的劑量[22]。在對過往的計劃進行回顧研究發現,與未產生毒性反應和嚴重并發癥的計劃相比,產生3 級毒性反應的臨床計劃在KBRT 模型優化后存在50%的改進潛力。KBRT 可以系統性地提高SBRT方案的質量和安全。
目前,運用KBRT 和多重標準優化(Multi-Criteria Optimization, MCO)算法相結合以提升計劃設計和審核效率的方法受到研究者們的廣泛關注[23-24]。MCO 算法利用KBRT 的優勢生成滿足帕累托最優(Pareto Optimal)平面的計劃集合,這一集合中每個計劃的靶區與正常組織之間形成了一個潛在的平衡關系。在這樣的平衡關系中,任一優化目標都無法在其余優化條件當前最優狀態不被損害的前提下獲得進一步的提升。這就需要有足夠多的計劃才能將優化時的帕累托最優平面集合表示出來。而生成這樣一個大量計劃的數據集不僅需要算法,還需要類似圖形處理單元(GPU)這樣的硬件提供支持。當進行一次多目標優化后,物理師和醫生之間可以通過權衡各組織間利弊的方式共同篩選出集合中最合適的一個計劃作為最終的臨床方案,而不是像傳統的放療計劃方式在反復的溝通和優化中尋找最優解,從而大大提高整體放療計劃流程的效率。
除此之外,利用KBRT 中的VMAT 模型對IMRT計劃進行優化,可以提高效率并減少正常組織的受量,在靶區覆蓋率和均勻性相同的情況下改善OAR保護[25]。而KBRT 模型用于改善肺癌調強放療的射束分布角度上,所生成的計劃與常規計劃質量相當,或有助于減少規劃時間,促進自動化優化的實現[26]。
在取得諸多研究成果的同時,研究者們也發現了KBRT存在的一些問題和挑戰。首先是缺少足夠大的數據集,無法發揮出算法本身的優勢。由于KBRT獲取到的數據大多來源于臨床,對于采集到的臨床數據還需要額外的分組(如訓練組和測試組),而用于訓練的數據還需進行異常值的剔除。這一系列的研究環節都限制和影響了采集到的樣本量,與通過深度學習進行圖像分割的海量數據形成了鮮明的對比。而樣本量不足將極大地影響模型和算法的預測準確性,其中最容易出現的就是過擬合[22]。此外,在收集數據的過程中如果忽視了數據管理,數據有效性和潛在的異常點將對預測出的結果產生偏差。
其次,目前KBRT 的功能實現都是以DVH 和OVH 為特征提取目標,對算子和算法的研究沒有深化,而以DVH 作為特征提取就會導致在劑量空間分布的限制,需要人為操作來處理OAR 和靶區的異常值。因此除了基于DVH 的方法外,也出現了針對體素為特征的KBRT 預測模型的研究[27]。另外,KBRT研究切入點上較為單一,與新技術的開發和結合較少。KBRT 與MCO、GPU 加速等技術相結合后對于傳統放療技術的影響和變革也說明,發展KBRT還需要更多算法和硬件技術的融合來拓展和挖掘其本身的優勢。
KBRT 通過人工智能方法來解決放射治療技術中的臨床問題,在解決問題的同時還需要與臨床計劃系統有更多的結合和銜接,真正的將研究成果轉換為可以解決臨床需要的產品。通過上述的問題和挑戰,如何合理的去面對和解決這些難題能幫助我們對KBRT今后的研究方向做出合理的判斷。
KBRT 的設立初衷就是希望通過此項技術減少物理師之間因為經驗和主觀因素等諸多因素造成的計劃質量差異,提高放療計劃的整體質量和安全,讓患者能夠真正地從該項技術中獲益。而要達到這個目的,至上而下的多中心合作和交流就顯得尤為重要。如何開展多中心研究合作項目來豐富和優化KBRT 模型中的數據集和模型,制定出相關的標準,并通過云計算等方式將成果或產品在基層單位進行推廣是KBRT后期工作開展的重要方向。目前,針對基于知識的自動調強質子治療(IMPT)計劃系統的國際多中心研究證實了多中心合作的可行性[28]。該解決方案可以幫助質子中心做出相一致且有效的放療計劃并為其臨床和試驗環境中的IMPT 計劃提供質量保證。而隨著人工智能算法復雜度不斷提高,可以預見類似的多中心合作將隨著技術的發展越來越被人們重視。
自適應放療(Adaptive Radiotherapy, ART)是以圖像引導放療(Image-Guided Radiotherapy, IGRT)為基礎,通過流程化處理,運用圖像反饋的偏差信息對原治療計劃進行系統化調整以滿足實際放療要求的一項放療技術。其中在線ART 更是要求優化流程、縮短時間以達到在當前分次下的計劃修改和執行要求。目前的ART 研究中,通過形變配準后進行的正常組織自動勾畫,靶區輪廓推衍以及圖形處理單元運用于劑量計算等方面都取得了長足的發展[29-30],有效地提高了ART 流程的效率。這些進步都在支持和推動KBRT 成為安全有效的再計劃與質控系統以滿足在線ART 的要求。通過已建立的同類KBRT 模型,將ART 流程中產生的新圖像和靶區結構導入系統,可以快速得到滿足ART 要求的KBRT 計劃。KBRT 亦可針對成熟的ART 產品所生成的計劃進行計劃評估和DVH 預警,保證ART 的安全。而Tseng等[31]更是進一步提出了將多模態圖像(如CT/PET/MRI)和生物標記(基因組學、轉錄組學、蛋白質組學)等有益信息加入ART 的知識框架之中,擺脫依靠單一圖像信息的固有模式,最終實現針對單個患者的分子特征進行個性化治療。
近年來,人工智能理論和技術的革新不斷深入到各行各業并取得了卓越的發展。KBRT 中涉及的機器學習等內容作為人工智能研究的重要分支,也同樣為放療自動計劃的改進作出了重要的貢獻。目前神經網絡用于預測空間內劑量分布的研究已經可以在減少大量訓練數據的情況下達到KBRT 傳統建模的水平[32]。尤其是深層卷積神經網絡(deep Conventional Neural Network, dCNN)這類在醫學影像中廣泛應用的技術為自動計劃指明了新的方向[33]。面對常規MR 定位圖像無法直接進行治療計劃優化的問題,通過dCNN 將定位MR 圖像和定位CT 關聯后生成的模型可將定位MR 轉化為可以直接進行放療計劃的人造CT圖像(Synthetic CT),并且生成的劑量與原計劃基本無異[34]。人工智能算法正在逐漸融入傳統放射治療的圖像分割、計劃優化和計劃執行等各個階段之中[35-36]。隨著生成對抗網絡算法(GANs)、深度學習等新技術的不斷涌現,結合了大數據和云計算的自動優化也將在智能決策、優化算法改進和質控安全等方面獲得更多的關注。