林毅,渠田田,錢碧云,3,呂文文,俞章盛,4,馮鐵男
區域性臨床研究整合平臺的建設探討
林毅1,渠田田2,錢碧云2,3,呂文文2,俞章盛2,4,馮鐵男2
1.上海港訊電子科技有限公司,上海 200023;2.上海交通大學醫學院臨床研究中心,上海 200025;3.臨床研究促進發展中心 上海申康醫院發展中心,上海 200041;4.上海交通大學數學科學學院,上海 201100
探討國內建立區域性臨床研究整合平臺的可行方案,為研究者發起的臨床研究(investigator initiated trial,IIT)提供數據支持。總結國內外各類臨床研究平臺建設現狀,以此為改進依據介紹上海交通大學醫學院人工智能臨床研究平臺建設情況。人工智能臨床研究平臺涵蓋醫學院附屬醫院的業務庫文字及影像專病數據,支持回顧性與前瞻性臨床研究,但在數據使用的倫理考量與共享機制等管理方面仍需要實踐探索。合規的區域性臨床研究整合平臺可支持科研人員發現臨床問題、探索或驗證臨床假設,為開展多中心、大規模的IIT打下良好的數據基礎。
研究者發起的臨床研究;臨床研究平臺;專病數據庫;管理機制
研究者發起的臨床研究(investigator initiated trial,IIT)來自于一線臨床工作,研究成果能夠更好地服務臨床,沒有一定數據支撐的研究設想很難進一步形成高證據等級的研究設計。國家衛生健康委員會印發了《關于印發國家健康醫療大數據標準、安全和服務管理辦法(試行)的通知》,號召醫療數據安全與共享,同時《醫療衛生機構開展研究者發起的臨床研究管理辦法(試行)》也鼓勵醫療機構積極開展規范化的IIT,為臨床科研數據庫的建設發展提出了更高的要求。
國內專病醫療水平較高的三甲醫院嘗試建立供院內臨床科研使用的專病數據庫,涵蓋呼吸、消化、內分泌、腫瘤、精神疾病等眾多疾病領域[1-9]。此類專病庫力求將院內醫院信息系統(hospital informationsystem,HIS)、實驗室信息系統(laboratory information system,LIS)、影像存儲與傳輸系統(picture archiving and communication system,PACS)等多個臨床業務系統數據集成整合,提取業務數據表,普遍能使用脫敏算法剔除受試者隱私數據,可進行復雜條件、遞進式的多病種科研病例查詢篩選,部分數據庫還可以對病例報告表(case report form,CRF)進行個性化定制與模板化管理,并將研究數據導出為常用統計分析軟件兼容的格式,為臨床輔助決策與科研提供數據支撐。也有嘗試促進多中心臨床研究開展的專病庫,如上海交通大學醫學院附屬第九人民醫院集團血管外科專病數據庫通過云端訪問技術可在醫聯體中共同使用,山東第一醫科大學附屬省立醫院阿爾茨海默病臨床數據庫在聯盟醫院內可數據共享等[5,7]。
但目前記錄診療信息的業務系統普遍存在遺失病種關鍵信息的風險,導致專病庫的信息提取不完整,為回顧性研究質量帶來隱患。前瞻性研究的開展可以指導完善診療信息的記錄,防止科研信息缺失,為開展回顧性研究打好基礎。
與基于三甲醫院業務庫建立的專病庫不同,國內外公共科研數據庫共享程度更高,為全世界研究人員提供了良好的數據支持,例如中國人群基因組多態數據庫、美國腫瘤基因組圖譜計劃等基因組學數據庫,重癥監護醫學信息集市(Medical Information Mart for Intensive Care,MIMIC)重癥系列、中國以及其他國家的健康與營養調查、美國監測、流行病學和結果(Surveillance,Epidemiology,and End Results,SEER)數據庫等基于診療或調查的免費醫療數據庫,還有地方政府、期刊平臺等建立的公共科研數據庫,為流行病學研究、罕見病臨床科研試驗等提供數據支持等[10-17]。
此類科研使用公共數據庫并不局限于單病種,數據采集類型更多、范圍更廣,且共享程度高,但多數需要科研工作者使用一定的編程語言輔助才能整理、分析數據,有的數據庫下載使用數據包需要提供研究方案、倫理批件、提交眾多申請表格等,申請周期較長。
由于國內外醫療、科研機構正在使用的科研數據庫存在以上諸多問題,且國內臨床研究平臺的建設范圍通常局限在三甲醫院或其他醫療機構內部,缺乏將數據按一定標準脫敏并結構化后進行共享的區域性臨床研究整合平臺的建設,因此上海交通大學醫學院在校內原有的電子數據采集系統(electronic data capture system,EDC)基礎上進一步擴展,建設成了一個溝通多家附屬醫院、可全面支撐前瞻性與回顧性臨床科研的數據平臺——人工智能臨床研究平臺,旨在為臨床醫生收集整理病例數據、總結過往診療規律、進行數據深度挖掘、發表高質量臨床研究文章提供助力。
隨著臨床研究工作者對提升科研效率、挖掘診療信息的需求增加,上海交通大學醫學院立足大學與附屬醫院兩層級臨床研究架構,在附屬醫院區域內探索建立臨床研究整合平臺,參照相關法規政策,在原有EDC基礎上自主設計并建設了人工智能臨床研究平臺。該平臺包含了分布式語義檢索系統、項目全流程管理平臺、數據質量管理系統、臨床數據采集系統、物聯網數據采集系統、醫學影像數據平臺、臨床研究單病種系統七大模塊(圖1),以期更好地服務IIT。
2.1.1 分布式語義檢索系統 該系統通過自然語言處理、知識圖譜、機器學習等人工智能引擎,對來自于醫院的HIS/RIS/PACS/LIS等可對接的業務系統中半結構化描述語句進行處理、識別,為回顧性研究提供臨床電子病歷的精準、高效檢索能力,實現數據的結構化、標準化和歸一化。

圖1 人工智能臨床研究平臺七大模塊關系圖
2.1.2 項目全流程管理平臺 該平臺將為前瞻性IIT的設計與開展提供全局化、規范化的流程管理,包括但不限于研究設計與執行等方面的標準化管理與操作流程,從而達到高質量IIT所要求的精細化管理水平。
2.1.3 數據質量管理系統 該系統是針對臨床數據采集系統進行數據質控的一套質控系統,例如:可監控關鍵指標的缺失率、隨訪的超窗率以及不良事件的發生率,當接近不可接受的頻率時及時預警,從而達到研究全過程的智能化數據質控。還可進行源文件上傳,支持臨床監查員遠程溯源質控。
2.1.4 EDC 該系統將為前瞻性多中心設計的臨床研究提供數據采集服務,可滿足IIT個性化模塊的構建需求,實現數據自動核查、質疑管理、稽查軌跡、數據導出等多項功能。
2.1.5 物聯網數據采集系統 該系統將提供面向醫療智能穿戴設備的信息采集與管理能力,可前瞻性采集患者的實時健康狀態信息,或回顧性采集已有物聯網相關數據進行分析。
2.1.6 醫學影像數據平臺 該平臺整合醫院相關業務系統的影像數據資料并進行分類、治理、標注,從而為影像數據的便捷、高效利用奠定基礎,可前瞻性或回顧性采集分析影像數據。
2.1.7 臨床研究單病種系統 基于以上六大模塊進一步整合形成多項單病種專病數據庫,以患者為中心構建形成標準統一的臨床研究單病種系統,為面向單病種的深層次研究與應用奠定基礎。
平衡數據共享聯盟單位內部的各項政策與利益需要由非盈利性質的權威機構牽頭協調,數據庫需要專業的人力維護并耗費高額的維護費用,因此聯通多家中心的規范化、安全穩定的臨床研究整合平臺需要由政府或高校等機構承擔;該人工智能臨床研究平臺篩選、整合上海交通大學醫學院附屬13家醫院中的專病數據,針對立項的專病類型,在聯盟醫院內部推廣由牽頭主要研究者(principal investigator,PI)組織該疾病領域專家整理的專病關鍵指標集合,逐步規范醫院HIS等業務庫中的常規診療記錄要點,力爭控制回顧性研究關鍵信息的缺失率;該平臺數據檢索、整合、分析等基本操作無需代碼輔助,只需關鍵詞檢索與拖拽等操作即可完成,大幅提升電子病歷、實驗室檢查、影像等數據的分析利用能力。
人工智能臨床研究平臺匯集多個專病數據庫,是一個大型的資源交換與整合數據集合。該平臺技術上足夠保障患者個人信息不泄露,但患者醫療數據被用于各項科研探索,如何從倫理層面保護受試者需要嚴格的倫理論證;每個病種需要根據研究者貢獻程度探討訪問權限,發表文章或進行其他科研轉化后,與提供數據的各方如何分配成果尚需實踐,只有解決了數據申請與共享機制、平衡數據貢獻各方利益,才能完全實現跨中心數據綜合利用。
醫學院人工智能臨床研究平臺涵蓋多項數據采集與處理模塊,可為前瞻性與回顧性的研究提供全方位的數據支撐,且平臺數據由醫學院臨床研究中心專業數據管理團隊運維,力求改善傳統專病數據庫重建設輕維護的弊端,避免一般課題組在課題結束后不再二次使用的資源浪費[18]。
未來IIT研究的數量與質量還會繼續保持增長趨勢,數據采集與處理信息平臺將為臨床科研提供有力的數據支撐。醫學院人工智能臨床研究平臺將在數據安全與數據共享機制方面繼續加強建設,借助長期與附屬醫院研究者合作的業務優勢,在項目實踐中不斷完善功能,持續優化界面,為其他嘗試建設數據安全、信息深度共享的區域性臨床科研整合平臺提供一定參考。
[1] 袁駿毅, 潘常青, 李榕, 等. 基于臨床數據中心的冠心病專病數據庫的構建與實現[J]. 中國衛生信息管理雜志, 2022, 19(5): 707–712.
[2] 陳可, 王俊. 中晚期非小細胞肺癌專病數據庫的構建及應用探討[J]. 中國數字醫學, 2022, 17(6): 109–113.
[3] 屈媛圓, 高琳娜, 宋歡. 結直腸癌專病數據庫的發展與展望[J]. 中國普外基礎與臨床雜志, 2021, 28(12): 1543–1545.
[4] 孫穎, 李超峰, 林麗, 等. 鼻咽癌專病科研數據庫建設與應用[J].中國數字醫學, 2021, 16(1): 7–12.
[5] 惠美蓉, 仇鵬, 王世鵬, 等. 研究型下肢動脈硬化閉塞癥專病數據庫的建立及應用[J]. 中國血管外科雜志(電子版), 2020, 12(3): 248–251.
[6] 榮雯雯, 汪剛, 朱其立. 基于人工智能的病歷后結構化專病數據庫在臨床研究中的價值探討[J]. 上海交通大學學報(醫學版), 2020, 40(7): 996–1000, 995.
[7] 李慧杰, 張晴晴, 劉瑞紅, 等. 大數據背景下臨床專病數據庫建設實踐與思考[J]. 中國衛生事業管理, 2020, 37(8): 574–576, 591.
[8] 羅輝, 薛萬國, 喬屾. 大數據環境下醫院科研專病數據庫建設[J]. 解放軍醫學院學報, 2019, 40(8): 713–718.
[9] 王淑, 陳敏, 凌琦鳴, 等. 基于臨床數據中心的專病研究系統建設與實踐[J]. 中國醫院, 2017, 21(8): 16–18.
[10] 陳煒, 張戈, 張思仲. 人類基因組多態數據庫Go!Poly及其應用[J]. 中華醫學遺傳學雜志, 2001, 18(6): 71–74.
[11] 陰常欣, 馬文麗, 鄭文嶺. GEO-基因表達綜合數據庫的應用與數據挖掘[J]. 醫學分子生物學雜志, 2009, 6(2): 161–166.
[12] Medical information mart for intensive care [EB/OL]. [2022-10-25]. https://mimic.mit.edu/.
[13] 涂吉, 何慧婧, 胡耀達, 等. 美國國家健康與營養調查中的信息化系統應用及啟示[J]. 中華流行病學雜志, 2022, 43(7): 1127–1133.
[14] 王超, 張曉宇, 張磊, 等. 中國成人居民正常體溫:基于2015年中國健康與營養調查[J]. 中華內分泌代謝雜志, 2022, 38(3): 201–207.
[15] SEER incidence data, 1975-2019 [EB/OL]. [2022-10-26]. https://seer.cancer.gov/data/.
[16] 鮑萍萍, 鄭瑩, 王春芳, 等. 上海市腫瘤病人數據庫的管理和應用[J]. 中國腫瘤, 2005, 14(8): 514–516.
[17] 徐敏, 朱俊民, 密一愷, 等. 罕見病數據庫建設的探索與實踐[J]. 中國數字醫學, 2017, 12(5): 77–80.
[18] 顧穎. ??撇±龜祿旖ㄔO現狀與對策[J]. 中華醫學圖書情報雜志, 2011, 20(11): 20–22.
Exploring the construction of regional clinical research integration platform
LIN Yi, QU Tiantian, QIAN Biyun, LYU Wenwen, YU Zhangsheng, FENG Tienan
1.Shanghai Gaintion Electronic Technology Co., Shanghai 200023, China; 2.Clinical Research Institute, Shanghai Jiao Tong University School of Medicine, Shanghai 200025, China; 3.Shanghai Clinical Research Promotion and Development Center, Shanghai Shenkang Hospital Development Center, Shanghai 200041, China; 4.School of Mathematical Sciences, Shanghai Jiao Tong University, Shanghai 201100, China
To explore a feasible solution for establishing a regional clinical research integration platform in China to provide data support for investigator initiated trials (IIT).To summarize the current situation of the construction of various clinical research platforms at home and abroad, and introduce the construction of the Artificial Intelligence Clinical Research Platform of Shanghai Jiao Tong University School of Medicine based on this improvement.The artificial intelligence clinical research platform covers business repository text and imaging-specific data of the medical school hospitals and supports retrospective and prospective clinical research, but still needs practical exploration in the management of ethical considerations and sharing mechanism of data use.A compliant regional clinical research integration platform can support researchers in identifying clinical questions, exploring or validating clinical hypotheses, and laying a good data foundation for conducting multi-center and large-scale IIT.
Investigator initiated trial; Clinical research platform; Specialized disease database; Management Mechanism
R12
A
10.3969/j.issn.1673-9701.2023.29.023
馮鐵男,電子信箱:tienan@sjtu.edu.cn
(2022–11–29)
(2023–09–13)