
摘要:人工智能技術在生物技術、醫學影像識別、藥物研發、輔助診斷等領域發揮了重要作用。介紹了國際上關于醫療人工智能技術的評估與監管框架,包括英國的《數字衛生技術的證據標準框架》、美國的醫療器械獨立軟件預認證試點項目、歐盟的lt;可信賴人工智能道德準則》等,指出有效性與安全性是醫療人工智能技術評估與監管的前提,需制訂符合我國國情的醫療人工智能設備分類標準,注重醫療人工智能產品的持續監管與風險控制。
關鍵詞:醫療人工智能;醫療設備監管;國際經驗;啟示;質量與信息化
中圖分類號:TP181;R197.1 文獻標識碼:A
人工智能( Artificial Intelligence,AD被認為是21世紀三大尖端技術之一。人工智能技術先驅Patrick Henry Winston教授對其定義是:研究人類智能行為規律(如學習、計算、推理、思考、規劃等),構造具有一定智慧能力的人工系統,以完成以往需要人的智慧才能勝任的工作。隨著AI技術的不斷發展,越來越多的AI產品被應用于醫療領域,在生物技術、醫學影像識別、藥物研發、輔助診斷等領域發揮了重要作用。比如,使用達芬奇手術機器人進行外科手術,比人工外科手術有更小的切口、更短的恢復時間、更少的并發癥,其優秀表現已經被越來越多的患者、外科醫生和醫院所接受。美國精準醫學協會Martin Ciupa教授認為,醫療AI技術可在4個方面有效改善醫療服務:(1)通過減少醫療成本和資源浪費,以及提高工作效率來提高生產力;(2)通過提高診斷的準確性和縮短患者就醫等待時間等,來提高服務質量;(3)通過AI技術制定個性化醫療方案,使醫療方式更加準確;(4)AI技術參與新藥的開發,使藥物治療更加有效。可見,醫療AI技術具有較強的發展潛力,將在疾病預防、診斷、治療、康復等健康全流程管理中發揮更大的作用。
然而,醫療AI技術應用的背后,也存在一定問題。首先,是技術安全性問題。尤其是當醫療AI設備應用于診斷、手術等場景時,其診斷準確性與治療安全性能否得到保障。其次,是信息安全性問題。多數醫療AI設備會搜集患者信息并上傳到云端,一旦數據保存不當或出現安全漏洞易造成數據泄露,患者的隱私權也將受到侵害。第三,算法的不透明性是AI技術的重要缺陷。對于醫生而言,算法在本質上無異于“黑箱”,算法的不透明性會導致AI技術可能被用于非保障人類生命健康利益的其他目的,造成醫療行為目的的異化和畸變。第四,醫護人員能否正確使用醫療AI設備也很關鍵。如果數據采集出現偏差,算法給出的模型和結果則可能出現偏誤,將會對患者權益造成損害。因此,要想有效發揮醫療AI技術的積極作用,就必須對之實行嚴格的評估與風險控制。
1我國醫療Al技術管理現狀
2017年,國家藥品監督管理局成立AI工作組,開展了AI醫療器械監管研究,主要包括AI醫療器械測評數據庫建立、算法評估、數據安全等,并重視產學研醫檢相結合和跨學科合作。2019年6月,國家藥品監督管理局醫療器械技術審評中心發布《深度學習輔助決策醫療器械軟件審批要點》,為相應醫療器械軟件注冊申報提供了指導。該文件包含深度學習輔助決策醫療器械軟件適用范圍、審批關注要點、軟件更新、相關技術考量、注冊申報資料說明等內容,明確了對于深度學習輔助決策類AI產品安全有效性評價的基本考量,用于指導相關產品研發和注冊申報。2019年,國家藥品監督管理局聯合國家相關部委、科研機構、醫療機構等,共同成立人工智能醫療器械創新合作平臺,設立了技術法規、數據治理、網絡安全等10個工作組,通過合作平臺推動各工作組開展多層面、多角度科學研究。2020年,國家標準化管理委員會、中央網信辦、國家發展改革委、科技部、工信部聯合發布《國家新一代人工智能標準體系建設指南》(國標委聯[2020]35號),計劃在2023年率先在醫療領域建立智能AI標準體系,圍繞醫療數據、醫療診斷、醫療服務,醫療監管等,重點規范醫療AI技術在數據獲取、數據隱身管理等方面的應用,并制定了包括醫療數據特征表示、AI醫療質量評估等標準。
同時,為應對醫療AI技術的商業化發展,國家醫療保障局也嘗試設定醫療AI技術的支付標準。2021年,國家醫保局、國家衛生健康委、國家發展改革委等八部委聯合發布《深化醫療服務價格改革試點方案》(醫保發[2021]41號),提出要優化新增價格項目管理,簡化新增價格項目申報流程,重點關注新增價格項目的創新性及經濟性,加快受理審核進度,促進醫療技術創新發展和臨床應用。2022年3月,國家醫療保障局發布《關于完善骨科“手術機器人”“3D打印”等輔助操作價格及相關政策的指南(征求意見稿)》,要求參照此前無機器人參與的傳統手術的價格,以一定比例加成收取,并根據手術機器人的功能差異劃分出4種不同標準。
盡管如此,相較于國外,我國對于醫療AI技術的評審與監管仍處于起步階段,尚未形成明確的、成熟的、標準化的評審流程及相關過程質量管理指南等,需借鑒國外相關管理經驗并形成適應我國特點的管理模式,以期為我國醫療AI技術評估與監管制度建設提供借鑒。
2英國醫療AI技術管理概況
在英國,直接用于醫療目的的人工智能系統被納入醫療器械、體外診斷設備或可移動植入設備的管理范疇,一般不對含有AI技術的醫療設備進行單獨管理。2022年6月,英國藥品和健康產品管理局(UK Medicines and Healthcare products Regulatory Agency,MHRA)針對英國脫歐后醫療器械和體外診斷醫療器械未來監管法規的立法協商發布政府回復,不建議單獨為作為醫療設備的AI技術(Artificial Intelligence as a Medical Device,AIaMD)進行定義,也不會為AIaMD設定額外的法規要求,只將之視為一般的醫療設備軟件(Software as a MedicalDevice,SaMD)進行管理。
SaMD主要管理方式分為上市前與上市后兩部分。上市前,英國政府要求SaMD接受充分的審查,以確保其安全、質量和性能,提出的重點關注內容包括:(1)保障網絡安全。英國的政策立場是將網絡安全作為管理法案的基本要求,強調數據的保護、保密與隱私處理,并將與英國數字、文化、媒體和體育部(Department for Culture,Media,andSport,DCMS),信息專員辦公室、國家數據監護處和衛生研究機構密切合作,以確保患者數據信息得到保護;(2)要求SaMD所使用的數據符合數據協調委員會(Data Coordination Board,DCB)的數據標準,以便統一管理;(3)AIaMD需依據歐盟醫療器械法規中的通用安全和性能要求(General Safety and Performance Requirements,GSPR)進行管理,并參照國際醫療器械監管者論壇(International Medical Revice Regulators Forum,IMDRF)發布的指導文件《軟件作為醫療設備(SaMD):臨床評估》進行臨床表現評估。上市后,英國政府強調要持續關注軟件的不良事件監控以及網絡安全問題,要求設備制造商在相關網站能給出該設備發生不良事件的鏈接,同時管理機構要構建強大的市場監測和MHRA市場監測系統,以快速捕捉SaMD不良事件。另外,要確保上市后應用過程的網絡安全,管理機構需制定統一的網絡安全事件和漏洞報告要求,以協助支持供應商完成報告撰寫。利用上市后的真實世界證據,進一步保證SaMD能達到預期功能,并繼續提供安全保證。對于軟件的更新或更改,英國政府鼓勵進行可靠性修改,從而增強醫療設備性能,更好的為患者服務。
除以上管理規范外,英國國家健康與臨床卓越研究所(National Institute for Health and Clinical Excellence,NICE)與英國國家醫療服務體系(National Health Service,NHS)等合作開發的《數字衛生技術的證據標準框架》也值得借鑒。但需注意的是,該框架僅適用于使用固定算法的AI醫療設備,不適用于自適應算法(持續自動變化的算法)的AI醫療設備。該框架提出,對數字衛生技術的評估應集中在5個核心領域,即臨床安全性、數據保護、技術保證、互操作性、可用性和透明度。另外,該框架建議對于AI醫療設備的風險評估可以從用戶風險和經濟風險兩個方面展開:用戶風險評估包括該項技術在使用過程中沒有發揮對應功能時對用戶健康和幸福的影響,以及當該項技術提供的醫療質量不佳時對用戶健康和幸福的影響;經濟風險評估包括試運行期間該項技術初始成本較高而現有預算較少時的經濟風險,以及當該項技術需要重新設計時在人員配備、培訓或相關設施方面的經濟風險。
英國自脫歐以來已逐步形成獨有的醫療設備管理體系,但總體管理與立法思路依然參考歐盟標準,即將數據安全與風險控制作為基本要求,在此前提下再確保設備的有效性。
3美國醫療AI技術管理概況
美國是最早立法對醫療器械進行管理的國家,其基于風險的產品分類管理原則和市場準入理念已被世界上許多國家和地區所接受。隨著越來越多的智能軟件被開發成健康產品,美國食品藥品監督管理局(Food and Drug Administration,FDA)認為傳統的評審方法已經不適用于醫療軟件監管。FDA于2017年7月啟動醫療器械獨立軟件預認證試點項目(Pre-Cert for Soft-ware Pilot Program),并分別于2018年4月、2018年6月、2019年1月發布3個更新版本,旨在通過考查此類產品的特征、臨床前景、獨特的用戶界面以及行業內引進此類產品的商業周期等,建立專門針對電子健康產品的監管方法。該軟件預認證試點項目重點審查軟件技術開發企業,尤其是對企業的軟件設計和測試能力進行評估。想要通過預認證的企業必須能證明其在質量和組織文化方面的卓越性,如在軟件設計、開發和驗證等方面的表現。FDA希望該預認證項目可以簡化產品資料的提交流程,加快軟件產品審批進度,進而加快軟件技術革新應用于患者的步伐。
目前,FDA使用的是2019年發布的V1.0版本,該版本的醫療器械獨立軟件預認證試點項目分為4個步驟:卓越性評估(Excellence Appraisal)、審核路徑確定(Review Determination)、精簡審核流程(Streamlined Review)、現實性能評價(Real World Preformance),具體如圖1所示。首先,對企業的卓越性進行評估。FDA將選定的企業從產品質量、用戶安全保障、產品臨床可靠性、網絡安全責任和前瞻性文化5個方面進行考量與定級。其次,根據卓越性評估結果,結合國際醫療器械監管機構論壇(International Medical Device Regulators Forum,IMDRF)醫療器械軟件風險分類框架,對不同風險類別的軟件實行不同的審核路徑,風險等級低且企業卓越性高的產品可跳過審核步驟直接上市,其他中高風險或企業卓越性低的產品則需要完成精簡審核流程,該流程簡化了常規審核所需的眾多文件材料,企業只需向FDA和公眾證明其產品具有杰出的有效性與安全性即可。上市后,FDA還需對產品上市后的表現進行應用效果評估,進一步對有關軟件的安全性、有效性和產品性能進行分析,主要包括真實世界健康分析、用戶體驗分析與產品效能分析3部分,最后根據評估結果重新評測該產品的有效性及安全性以及企業的卓越性資格,進而形成全生命周期管理模式。
美國的醫療器械獨立軟件預認證試點項目以評估企業能力為核心進行上市前評審,旨在簡化審核流程,提高優質產品上市投入使用效率,同時在上市后進行全面再評估,以形成全生命周期閉環管理模式。
4其他地區醫療AI技術管理概況
4.1歐盟管理概況
歐盟白皮書提出將AI技術分為高風險和非高風險兩類進行監管。對于高風險的AI技術,需要先進行客觀的合格性評估,以驗證并確保AI技術能夠達到高風險應用程序的特定要求。白皮書要求,所有符合規定的經營者,都必須進行合格性評估。
2019年4月,歐盟委員會發布《可信賴人工智能道德準則》的正式生效文本(“Ethics Guidelines for Trustworthy AI”),提出AI系統要達到可信賴要求必須滿足7個關鍵要素,分別是人的能動性和監督,技術的穩健性和安全性,隱私和數據管理,透明性,多樣性、非歧視性和公平性,社會和環境福祉,問責。可信賴AI技術應用是一個持續過程,覆蓋AI系統的全生命周期。
4.2日本管理概況
日本尚未出臺針對AI技術的具體規章制度,針對AI醫療程序及AI醫療器械也無具體規定,相關管理要求基本參照日本藥品和醫療器械法。日本藥品和醫療器械局(Pharmaceuticals and Medical Devices Agency,PMDA)下設的人工智能及其在醫療領域的應用小組委員會于2016年成立,針對AI輔助醫療影像診斷和AI手術機器人提出了具體規范建議。首先,針對醫療AI技術的可塑性,PMDA提出了相關要求以確保新的更改不會損害設備的安全性和有效性;其次,針對深度學習算法帶來的黑匣子問題,需要確保數據集的有效性與可靠性,詳細描述網絡結構、算法設計和功能,并通過一系列的輸入來評估其輸出性能,同時也應提前制定應對意外行為的相關規定;最后,是數據質量問題,包括上市前及上市后測試所需要的數據集。特別需要注意以下方面:(1)應采取高質量數據;(2)說明用于訓練/測試的數據集是合適的;(3)針對上市后的學習更新,提前制定監管策略。
5啟示與思考
5.1保證有效性與安全性是醫療AI技術應用的前提
英國政府要求按照IMDRF的臨床評估指南對SaMD進行上市前評估,以確保其安全有效性,并把網絡數據安全作為上市的基本要求;NICE的數字衛生技術評估標準集中的核心領域即為臨床安全性。美國醫療器械軟件預認證項目精簡審核流程,雖簡化了審批步驟,但保留的核心內容能夠確保產品的安全性及有效性。各國對于應用醫療AI技術的共同點或基本要求就是兩個關鍵詞:安全、有效。安全包括技術安全、數據安全與網絡安全等,以保證患者的人體健康安全、隱私信息安全,將風險控制在可接受的水平;有效是指要達到預期的目的,即防病、治病的效果等。雖然醫療AI設備具有一定特殊性,但安全性與有效性依然是開展一切醫療AI技術評估與監管工作的前提。
5.2建立基于風險等級的分類管理機制
醫療AI設備根據其主要功能及使用人群等,可分為不同類型,對不同類型的醫療設備設立特定的評審機制有利于提高效率。英國依據醫療AI技術的功能分類及用途,將醫療AI設備分為3大類,即系統服務的數字衛生技術,提供信息、健康日記功能或通信平臺的數字衛生技術,作為干預措施的數字衛生技術。美國則依據IMDRF提出的風險等級分類標準,將醫療AI設備分為4個等級的風險類型,并結合設備制造商的卓越性評價等級為各類設備設置特定的評審方式。可見,建立基于風險等級的分類管理與評估機制是開展醫療AI技術評估與監管工作的重要手段。我國可依據醫療AI設備產品功能、使用形式、作用人群、技術透明度、數據安全性、算法特異性等,制訂符合我國自身特點的醫療AI設備風險分類標準,并為不同AI設備分類設置特定的評估與監管機制。
5.3注重上市后的持續監管與風險控制
英美兩國均注重醫療AI產品的上市后監測。英國不僅關注上市后對設備不良事件的監測以及網絡安全性的持續保障,同時也要評估其在真實世界應用后是否能達到預期效果。美國FDA將產品上市后性能作為評估企業卓越性的重要指標,認為企業卓越性不僅在于開發SaMD軟件時要注重品質,還在于產品發布后基于終端用戶使用的反饋數據可以不斷進步提升。因此,上市后監測是非常重要且必不可少的環節。我國可以綜合參考各國醫療AI設備上市后的評估側重點,對設備上市后在真實世界的有效性、不良事件監測、網絡安全性、數據安全性、技術的可持續發展性等進行全方位的監控管理。
5.4加強全生命周期的持續監管
考慮到醫療AI技術的特殊性,可采用深度學習等方法不斷更新算法,從而達到更佳的使用效果。在算法的更新過程中,對醫療AI設備的初始評估結論可能不再適用,因此對醫療AI技術的評估應貫穿于產品的全生命周期。我國可參考美國的醫療器械軟件預認證項目的產品全生命周期監管方法,著重對其上市后的真實世界應用情況進行再評估,并依據評估結果對相應醫療設備做出合理性調整。