馬敏,黃鵬,戴建榮
國家癌癥中心/國家腫瘤臨床醫學研究中心/中國醫學科學院北京協和醫學院腫瘤醫院,北京 100021
現代放療的模擬定位、計劃設計和治療實施是一個多學科、多階段的復雜完整過程,各個階段如串聯電路一樣連接,任何一個差錯都會導致患者治療的效果不佳甚至導致患者嚴重損傷[1-2]。差錯如果沒有被及時發現和糾正,就會危及到患者的治療效果和生命安全,甚至引發放療事故[3-4]。世界衛生組織(WHO)、國際原子能機構(IAEA)和國際輻射防護委員會(ICRP)都發表過由于差錯而造成嚴重傷害和死亡的報告。因此,為了減少發生差錯的可能性,不少研究建議對放療記錄進行審查[5-9]。放療記錄審查是指高年資工作人員審查每個患者放療過程各個階段的記錄,是放療質量保證工作的重要內容之一。圖1描述了放療過程各個階段的審查。
差錯是操作失誤,具體表現可能是某個操作步驟沒做到位,或者遺忘導致漏掉了某個操作步驟,或者操作步驟的順序出錯。減少差錯的關鍵是建立屏障,阻止差錯往下傳遞,避免釀成重大事件。大多數重大事件是一系列事件的綜合結果,通常每個獨立事件不會產生嚴重傷害,只有當一系列事件都發生時重大事件才會發生[10]。審查放療記錄能及時發現潛在差錯,避免差錯和事故,避免給患者造成傷害。
文獻[5-9]探索分析事故或差錯的原因。Gopan等[6]研究在3年嚴重未遂事件中,只有38%在計劃審查環節被發現。IAEA SRS No.17分析92例放療事故中,26 例(28%)與計劃設計有關[11]。WHO 于2008年調查3 125 例放射性事故,55%與計劃設計有關;4 616 例未造成確認傷害的事件中,9%與計劃有關,38%與信息傳輸有關[12]。Ezzell 等[13]對2018年放射腫瘤事件學習系統(Radiation Oncology Incident Learning System,RO-ILS)數據進行研究發現25%的問題計劃和37%的錯誤指令通過了所有的常規審查,44%的差錯出現在治療階段。Novak等[14]研究表明未遂事件多發于治療計劃過程,占比33%,治療實施過程發現事故占比30%。美國放射腫瘤學會在RO-ILS 2016年第4 季度報告顯示在2 681 例放療事故中治療計劃階段是最容易出錯的環節,占比28%,治療實施階段出錯率占26%[15]。Huang 等[16]分析在加拿大瑪格麗特公主醫院治療的患者記錄,發現在28 136 例接受治療的患者中,錯誤率為1.97%。Bissonnette 等[17]回顧該醫院的1 063 份治療事件報告,發現每100 個放療療程的平均治療事件概率為1.7%。為了及時發現這些差錯,需要針對放療過程每個階段的記錄進行審查。
放療記錄審查內容主要針對放療過程中3 個主要階段(模擬定位、計劃設計和治療實施)記錄進行審查。AAPM TG-275 報告建議光子/電子模擬定位階段、計劃設計階段和治療實施階段需要審查的差錯項目[9]。初步統計,模擬定位階段審查有11 項;計劃設計階段審查有77 項,分為11 類,包括輪廓6 項、處方11 項、科室規程13 項、劑量分布11 項、劑量驗證3 項、等中心3 項、圖像引導設置10 項、工作安排表1項、重新計劃或自適應計劃7 項、偏差1 項和TPS 至OIS 的數據傳輸11 項;治療實施階段審查有36 項,分為4 類,包括文檔和通信12 項、計劃參數10 項、治療進展10項和圖像引導4項。
針對這些審查內容,研究者提出了不同的審查方法,主要分為手工審查和自動審查,如圖2所示。
手工審查方法依靠工作人員仔細審閱相關記錄,根據相關規范/規程和自己的知識、經驗作出判斷,發現潛在的差錯項。手工審查方法可以有效降低放療差錯的發生,但是由于審查項目多,受人的工作狀態影響,審查效率有待提高。比如,以計劃審查為例,要查50多項,鼠標點擊100次,耗時長(15 min/例,每天30例)。
放療過程中設置手工審查,可以有效降低放療差錯的發生,但是由于審查項目多、耗時長和個人經驗不同,導致手工審查在臨床實際應用有限[18]。有學者開展了放療過程審查自動化的探索[7-8,19-25]。其中關于患者放療記錄的自動審查方法大致分為:自動邏輯判斷、聚類分析、貝葉斯網絡、結構相似指數分析和人工智能。
3.2.1 自動邏輯判斷自動邏輯判斷方法依據核對表的形式,計算機軟件通過簡單的邏輯判斷,自動審查適合做邏輯判斷的審查項。AAPM TG-275報告推薦并詳細列舉出放療過程的核對項目,哪些項目推薦使用手工審查,哪些項目推薦使用自動審查[9]。不少醫院根據本單位放療過程特點,開發自動審查軟件進行審查。自動邏輯判斷方法已經在臨床上得到實際應用[20],并且在不斷完善中,協助物理師發現放療計劃中的差錯,減少醫療事故的發生[6,26-28]。
3.2.2 聚類分析聚類分析是根據“物以類聚”的道理,對數據按特征進行合理的分類,沒有任何模式可供參考,即是在沒有先驗知識的情況下進行的[29]。從系統數據庫中提取特定腫瘤患者的治療計劃,所有計劃均通過手工獨立核對,未發現異常。提取所有治療計劃的參數(如單次處方劑量、射野角度等),將這些參數作為聚類分析的特征;采用Matlab/python 等編寫程序算法,執行聚類分析;采用基于距離的方法實現孤立點檢測,突出顯示異常計劃提醒計劃核對人員;對于有孤立點的計劃,回顧性分析,尋找原因,從而改進計劃。該方法輔助手工審查,減少可能產生的差錯,已經在前列腺癌計劃、鼻咽癌計劃和乳腺癌計劃中得到研究和應用[21,25]。
3.2.3 貝葉斯網絡貝葉斯網絡是一種概率圖模型,由聯合概率分布組成,聯合概率分布定義了在給定其他已知信息集的情況下一個事件的概率[30]。在給定一組初始臨床信息的情況下,使用網絡發現獲得某些放療參數的概率。傳播網絡中的低概率對應標記為要調查的潛在錯誤。為了建立我們的網絡,需要采訪醫學物理學家和其他領域的專家,以確定相關問題的概念及變量之間邏輯關系,并構建網絡拓撲,這些變量就是網絡結構中的節點。接下來,填充網絡的條件概率表,使用軟件(如Hugin Expert)從基于放射腫瘤學的臨床信息數據庫系統的未識別數據子集中學習參數分布,計算每個節點變量的條件概率。最后采用相關參數(如接收者操作特征曲線下面積)評估其效果。該網絡結構已經應用于肺癌、腦瘤和乳腺癌等放療計劃的差錯檢查中,證明該模型作為決策支持系統一部分的可行性和有效性,可識別放療計劃中的潛在差錯,減少誤報的可能性,減少識別差錯根源的時間[7,24]。
3.2.4 結構相似性指數結構相似性指數基于圖像亮度、對比度和結構相似性評估兩個圖像的質量,用均值度量亮度,標準差度量對比度,協方差度量結構相似程度[31]。現有研究已將該指數和伽馬分析一起使用,以識別兩個劑量分布圖像中的差錯或差異[22-23]。設計了3 種測試誤差模式(絕對劑量誤差,劑量梯度誤差和劑量結構誤差)來表征結構相似性指數及其子指數的響應,并建立指數與不同劑量誤差類型之間的相關性;建立相關性后,通過計算每個指數來測試放療計劃(如頭頸計劃、腦部SRT 計劃);與伽馬分析結果進行比較以確定它們的相似性和差異[22-23]。結構相似性指數對于定量評估放療中劑量分布差錯具有潛力價值。
3.2.5 人工智能人工智能是指使用計算機來模擬人的某些思維過程和智能行為[32],包含機器學習和人工神經網絡。有學者提出可使用距離靶區直方圖(Distance-to-Target Histogram,DTH)及劑量體積直方圖(Dose and Volume Histogram,DVH)數據,通過主成分分析和回歸等方法建立DVH 預測模型,實現放療計劃質量保證,并應用于新病例計劃設計[33-35]。有研究提供了一種計算機輔助的自動方法,基于乳腺癌同步加量容積調強放射治療(Volumetric Modulated Arc Therapy,VMAT)計劃,提取其幾何特征并使用人工神經網絡,建立個體化三維劑量預測模型。并使用該模型建立計劃質量控制方法,個體化地評估計劃質量[36]。有學者研究人為引入差錯(如解剖變化、定位差錯、計劃差錯和執行差錯)建立人工神經網絡模型,評估不同類型差錯分類的效果[19]。研究表明人工神經網絡是一種有前途的審查工具,可用于識別放療中差錯項和嚴重程度,是邁向快速自動化識別差錯模型的第一步[8,19-20]。
但是,這些自動審查方法存在以下問題尚未解決,導致審查方法在臨床應用上受限:(1)目前所使用的自動審查方法靈敏度低,許多差錯無法找出。初始計劃審查的靈敏度約為62%,治療記錄審查的靈敏度約為43%[5]。(2)上述自動審查方法應用范圍有限,復雜差錯需要資深的專業人員手工查找,效率低。聚類分析、貝葉斯網絡和結構相似性指數設計中加入多種差錯,結構會變復雜,檢查差錯的效率會降低,需要的較多的人力資源,臨床實踐效果不佳,依然需要手工審查[7,21]。除自動邏輯判斷方法在臨床上實際使用以外,其他方法都是探索性質。但是自動邏輯判斷方法僅能發現簡單差錯。
國內開展放療審查主要應用于計劃設計階段。國內在2010年才開始建立行業標準,規定了計劃審查要求,并且各省市醫保政策不同,大多數省市都沒有單獨的收費項目,開展審查的情況不如歐美發達國家[9,37-38]。審查主要集中在計劃參數和TPS 系統中的一致性。黃鵬[26]根據其所在單位放療中心的特點開發了自動審查工具AutoReview,審查計劃內容包括一致性、命名規范、計劃參數、處方劑量、危及器官、擺位參數、射野排程、參考影像、優化參數和劑量計算,審查界面如圖3所示。
AAPM TG-275號報告詳細調研國外開展審查工作的情況[9]。AAPM TG-275號報告統計1 526名成員填寫的調查表。這些成員85.8%來自美國,4%來自加拿大,10.2%來自其他35個國家。調查問卷包括103個選擇題,其中55個描述參與者臨床實踐特征,48個側重外照射計劃和治療記錄的審查。99.3%執行初始計劃審
查,0.7%沒有執行;47.9%手工執行計劃審查,4.7%自動執行計劃審查,47.4%手工和自動相結合執行計劃審查;92.4%執行治療記錄審查,7.6%沒有執行治療記錄審查;44%手工執行治療記錄審查,11.8%自動執行治療記錄審查,44.2%手工和自動相結合執行治療記錄審查。關于做好審查工作,AAPM TG-275報告建議改進審查的實施、改進審查的內容和提高審查的效能;臨床實踐中應盡可能早地將“審查”納入工作過程,如模擬定位自查、計劃設計自查等,而不是僅僅依賴于治療計劃和治療記錄的審查。
放療記錄審查是放療質量保證工作的重要內容之一,是發現放療差錯的重要質控措施。中國開展審查工作的單位還不多,審查內容沒有覆蓋放療全過程,急需推廣普及,規范開展。審查應由高年資工作人員完成,并且需要研發智能化、自動化的審查方法和工具,以提高審查工作的效果和效率。未來,放療記錄審查工作將越來越受重視,將成為放療日常工作的一部分。審查方法將越來越自動化、智能化,靈敏度將越來越高。