張宇晶 劉 露 許 偉*
X射線計算機體層攝影(X-ray computed tomography,CT)設備屬醫療器械分類目錄[1]中的醫用成像器械,為第三類醫療器械,分類編碼為06-02-01,主要由掃描架、X射線發生器、患者支架、控制臺和計算機圖像處理系統組成,用于常規臨床CT檢查.目前,國產CT的研發方向主要為大功率高壓發生器、大容量球管及寬體探測器等核心部件的國產化、以及大錐角重建算法、迭代重建(iterative reconstruction,IR)算法及能譜CT基物質分解算法等影像鏈核心算法的開發.
2018年國家藥品監督管理局發布了CT設備注冊技術審查指導原則[2].該指導原則明確規定CT設備應進行臨床試驗的情形,同時規定CT設備中與采集和重建相關的全新算法,要求用于診斷的高級后處理與掃描直接相關的高級功能,需額外提供臨床評價資料,但臨床評價具體要求尚未明確.針對上述問題,闡述目前CT設備研發的熱點算法-IR算法實例,以及非臨床數據和臨床數據的具體要求,對CT設備的臨床評價要求進行綜述,指導生產企業解決上市前臨床評價中的難點問題,節約獲準上市的時間和經濟成本,同時促進審評人員提高審評效率.
CT設備臨床應用復雜、多樣,其主要高級功能包括迭代降噪、劑量調制、能譜掃描、去金屬偽影、迭代重建、錐束偽影去除及灌注掃描等.目前,多數生產企業通過開展臨床試驗方式進行臨床評價,將采集、重建和后處理放在一起進行評價,但臨床試驗中未體現以上模塊的應用情況,未評估以上算法和功能的安全有效性.而臨床試驗質量管理規范(good clinical practice,GCP)[3]要求,所有的功能特性應在臨床試驗中體現,因此審評機構常要求生產企業重新進行臨床數據分析,補充高級功能對應的臨床試驗部位及例數的分布數據,確定病例分布與申報的預期用途有一致性,并提供有效的臨床數據.
CT設備在技術原理和系統結構方面存在復雜性,臨床評價時可根據產品特點分為多個獨立的功能模塊,分別采用不同的臨床路徑進行評價.CT設備功能模塊的劃分應綜合考慮申報產品與對比產品在預期用途、性能指標和技術結構等方面的異同,各功能模塊應相對獨立,所有功能模塊應全面覆蓋CT設備的功能特性.CT設備的功能模塊可按照采集模式、重建方法和后處理功能劃分為3個獨立模塊,在臨床評價時應至少對這3方面進行評價.采集模塊與掃描直接相關,如確實需要臨床數據,應與設備試驗同時進行,且在臨床試驗方案中明確評價的具體要求,并以亞組的形式進行數據分析,確保高級功能對應的臨床試驗部位與申報功能的預期用途一致且病例分布均衡,去金屬偽影功能應明確植入物類型及例數分布.不與掃描直接相關的重建模塊和(或)后處理模塊則不需要到醫院實際裝機掃描,可與醫院簽署協議,使用匿名掃描收集的原始數據進行評估,以避免受試者接受不必要的輻射,若申報設備包含的功能等同于已單獨注冊的獨立軟件或隨其他CT設備注冊的功能,則該功能也可通過同品種比對方式進行臨床評價.
CT設備屬大型影像設備,開展臨床試驗面臨諸多困難,如需要醫院有安裝場地,安裝場地需要有輻射防護能力,裝機拆機耗時費力,即使可以在工廠收集數據,但若需要使用造影劑時也存在造影劑過敏的安全風險、倫理批準問題以及輻射安全等問題.對較為成熟的算法和功能,審評機構對此類產品的風險狀況已充分了解,生產企業可與當前上市的器械采用同品種比對方式進行評價,則無需開展臨床試驗.成熟且風險已知的CT主要指單源、傳統探測器和覆蓋寬度40 mm以下,采集、重建及后處理功能在臨床中已普遍應用.此類CT產品可與已獲準境內注冊的上述產品進行對比,表明兩者具有等同性即可,通常無需進行臨床試驗.
CT設備是較為成熟的影像設備,通常申報產品是在已有同品種產品基礎上進行技術改進.依據《醫療器械臨床評價技術指導原則》,臨床評價的路徑通常為與同品種比較有差異,但差異不會引起新的安全有效性問題,提交針對差異的支持性資料[4].支持性資料通常包括非臨床研究資料、和(或)臨床文獻數據、和(或)臨床經驗數據和(或)針對差異性在中國境內開展的臨床試驗資料.以下重點闡述支持性資料的非臨床研究資料及針對差異性在中國境內開展的臨床試驗資料.
1.3.1 非臨床研究資料
非臨床研究資料應覆蓋設備的所有功能特性,尤其是不適宜納入產品技術要求的功能[5].①應有測試摘要、測試計劃和測試報告,測試計劃應根據軟件功能預期用途和軟件功能原理,闡述驗證目的、驗證數據要求(包括數據例數要求)和對應的依據、驗證通過的條件(標準)以及驗證人員的資質要求;②數據需要考慮部位和協議,要具有典型性,能代表臨床應用場景;③若軟件功能影響設備的性能指標(空間分辨率、低對比度可檢測性和噪聲),需提供非臨床對比數據,比如降噪功能;④對宣稱定量的功能,可采用實驗室模體數據進行驗證,比如驗證降低劑量的幅度.
1.3.2 差異性臨床試驗資料
針對差異性的臨床數據可因設備的特性、使用條件和使用經驗的程度等因素而異.產品技術改進存在兩種可能,一是申報設備與同品種設備是同種功能的差異,二是申報設備新增的功能.①同種功能差異,若該功能對臨床決策影響較低,如優化流程,不影響圖像質量,可不提供針對差異的臨床試驗資料,臨床確認報告也可不提供樣本臨床圖像,若該功能對臨床決策影響中等,影響圖像質量,可提供企業內部臨床確認報告,樣本臨床圖像可由公司內部專家進行評審,若該功能對臨床決策影響較大,如用于幫助嚴重但非危及疾病的診斷,可提供外部臨床確認報告,樣本臨床圖像可由外部專家進行獨立評審[6-9];②新增功能,若該功能采用全新技術,對臨床決策影響較大,如用于癌癥臨床輔助診斷,需提供針對差異在中國境內開展的臨床試驗資料,不與掃描直接相關的軟件功能評價可采用與臨床金標準或已上市同類產品進行對照的回顧式設計,其他情形可參照同種功能差異要求,根據對臨床決策的影響提供相應的臨床確認報告;③臨床確認報告中樣本臨床圖像的數量取決于產品的風險等級和技術成熟程度,臨床數據量不需要與評價原始器械時同樣多[10];④若非臨床研究資料,臨床確認報告可證明產品的安全有效性,則不需要臨床試驗證據;⑤進口產品可使用境外臨床數據,但應參考《接受醫療器械境外臨床試驗數據技術指導原則》[11]分析境外人群數據對中國人群的適宜性,同時還可充分利用上市后臨床經驗數據;⑥可以借助真實世界數據進行臨床評價.
采用樣本臨床圖像數據,生產企業應提供研究計劃及研究報告.應明確研究目的、研究設計、評價指標、評價標準、適用部位、樣本圖像數量、評價方法、數據分析計劃、圖像來源、研究人員、研究地點、研究設備及研究時間等.對圖像來源和圖像的質量評價等應有良好的規范和質量控制,圖像質量評價的具體要求可參考CT設備臨床試驗的相應要求,應提供醫學數字成像和通信(digital imaging and communications in medicine,DICOM)格式的匿名臨床圖像留檔備查.CT設備臨床圖像評估不要求提供兒科臨床圖像.
IR算法是CT領域近期的技術進展之一.自2008年第一個IR算法問世,多項臨床研究已證明此算法能提高圖像質量,并在降低輻射劑量的同時保持診斷的可接受性[12].以下將以增加IR算法為例,闡述如何開展IR算法的臨床評價.
IR算法根據數據空間和構建模型的不同,分為基礎圖像IR算法和多模型雙空間IR算法.
基礎圖像IR算法在CT數據的投影空間構造噪聲模型,基于噪聲模型生成圖像的噪聲模板,同時基于濾波反投影(filtered back projection,FBP)圖像構造解剖模型,進而利用圖像噪聲模板和解剖模型在圖像空間對FBP圖像迭代降噪并保護解剖信息.基礎圖像IR算法本質上是基于FBP的圖像空間迭代降噪技術.
多模型雙空間IR算法在CT數據的投影空間和圖像空間分別構造噪聲模型和解剖模型,在利用噪聲模型刻畫和處理噪聲的同時,采用解剖模型描述人體組織結構特征,并基于上述模型在投影和圖像雙空間直接進行迭代重建;除噪聲模型和解剖模型,該方法建立了實際CT掃描的系統模型,通過系統模型將重建圖像以迭代的方式與原始數據進行比較更新,以保證圖像的真實呈現,進而在降低輻射劑量的同時保持圖像分辨率和圖像質感.
評價IR算法功能,首先應明確IR算法的工作原理、預期用途、臨床應用場景、算法實現流程以及流程的輸入輸出,并明確該功能是否與掃描直接相關及理由;應詳細描述軟件功能性能(聲稱的定量劑量減少量、宣稱的圖像質量),適用的部位和算法等級范圍,如低(IR1),中(IR2)以及高(IR3)等.
2.2.1 非臨床研究資料
對于IR算法,提交的非臨床研究資料主要包括圖像質量模體評估、定量劑量減少性能和低對比度探測能力(low-contrast detectability,LCD)評估及劑量評估.
2.2.2 圖像質量模體評估
圖像質量模體評估可利用體模和傳統的CT圖像分析方法對CT圖像質量進行檢測,參考《X射線計算機體層攝影設備通用技術條件》(YY/T0310-2015)[13]、《64層螺旋X射線計算機體層攝影設備技術條件》(YY/T1417-2016)[14]、《醫學成像部門的評估和常規測試-第3~5部分:驗收和穩定性測試-計算機斷層x射線設備的成像性能》[IEC61223-3-5:ED2(2017)][15]和《醫用成像部門的評價及例行試驗第3~5部分:X射線計算機體層攝影設備成像性能驗收試驗》(GB/T19042.5-2006)[16]標準進行.檢測指標包括不限于CT值的準確性、CT值的均勻性、空間分辨率、低對比度分辨率和噪聲標準偏差.
2.2.3 定量劑量減少性能和LCD評估
應評估LCD改善和潛在的劑量減少性能.使用醫學成像技術聯盟(Medical Imaging and Technology Alliance,MITA)成像質量(image quality,IQ)的LCD體模進行模型觀察者研究.方法詳見2017年美國電氣制造商協會(National Electrical Manufacturers Association,NEMA)MITA文件《X射線計算機體層攝像設備圖像質量(CTIQ):使用劑量降低技術的低對比度探測能力(LCD)的評估》(NEMA/MITA WP 1-2017)[17].應對來自MITA體模的低對比度物體進行多次成像,利用模型觀察者分析工具,生成接收者工作特性(receiver operating characteristic,ROC)曲線和ROC曲線下面積(area under curve,AUC)值.利用AUC值和信噪比值,比較不同重建算法對不同直徑的低對比度插件的探測能力.應在不同輻射劑量等級與迭代優化等級以及全身掃描條件下評價IR產生的圖像質量.研究應采用臨床實際劑量水平進行.
2.2.4 劑量評估
按照國家標準《醫用電氣設備第2部分X射線計算機體層攝影設備安全專用要求》(GB9706.18-2006)[18]進行劑量評估.該標準規定了CT劑量指數100(CT dose index,CTDI100)應當在100 mm范圍內進行測量,然而,對于準直寬度(射束寬度)較大的CT系統(模式),100 mm范圍內的劑量累計無法充分體現完整的劑量分布,會隨著準直寬度的增加產生較大的低估.因此當準直寬度>40 mm時,應按照醫用電氣設備第2-44部分:X射線計算機體層攝影設備基本安全和基本性能專用要求[IEC60601-2-44 E.d.3.2(2016)][19]版本中的方法,進行寬準直模式以及參考準直模式下CT劑量指數(CT dose index,CTDI)自由空氣的測量,結合參考準直模式下CTDI100的數值,給出寬準直模式下的CTDI100,并根據相應規定,給出不同運行條件下的CTDI測試結果與聲明.
根據《醫療器械臨床評價技術指導原則》,臨床數據包括臨床文獻數據、臨床經驗數據和臨床試驗數據.
進口產品可充分利用原產國臨床評價數據及上市后數據開展臨床評價,如2013年Philips公司的全模型IR算法(iterative model reconstruction,IMR)獲得美國食品藥品監督管理局(Food and Drug Administration,FDA)批準時,其臨床圖像證據采用110個臨床圖像原始數據分別由濾波反投影法(filtered back projection,FBP)算法和IMR重建進行影像質量比較,并由8名放射科醫生進行了閱片[20].以上臨床圖像數據,結合臨床文獻數據、上市后臨床經驗數據可以在中國注冊時使用.
通常國產產品注冊上市時,缺少臨床文獻數據及臨床經驗數據,結合境外監管要求,認為國產企業在境內申報注冊時,也可以用同樣方法進行臨床評價.IR算法不直接參與圖像掃描,不需要再對健康受試者進行不符合倫理的掃描,臨床圖像評估可采用臨床圖像原始數據,分別由FBP算法和申報算法重建進行影像質量比較[21-25].由我國有資質的放射科醫師或心臟科醫生對擬申報上市設備獲取的代表性圖像進行審閱,代表性圖像應包括頭部、胸部、腹部、骨盆、四肢和心臟檢查等部位(如適用).圖像質量評價可參考CT臨床試驗要求,采用李克特5分量表法.
樣本臨床圖像評價和非臨床研究資料影響CT設備的臨床評價.對于樣本臨床圖像評價,雖然審評機構接受臨床樣本圖像評價方式,但實際操作中,因沒有法規層面的支持,圖像來源和圖像質量難以控制和監管,多數醫療機構并不會出具臨床樣本圖像的評價意見;只有工廠和醫院機構臨床基地結合,法規層面確認大型設備特定的臨床試驗可以在非臨床機構開展,并建立樣本臨床圖像來源、圖像質量和圖像評價的良好質量管理規范,方能有效改變目前大型設備醫療器械臨床評價現狀.對于非臨床研究資料,目前國內生產企業相比進口企業更少使用性能測試數據,主要原因是對國際標準不熟悉,沒有適當的模體及測試方法,因此不能提供有效的非臨床研究資料,更多依賴臨床數據.只有工廠和檢測機構、標準制定機構及審評機構合作,共同建立全新技術的評價方法,方能有效減少臨床試驗要求.相信隨著審評機構指導原則的制修訂加快,可更好地指導企業為大型設備臨床評價提供科學有效的數據及證據,消除或減少與監管活動相關的不必要負擔,使患者可以更早且持續獲得有益產品[26].