摘要:高質量的臨床數據是臨床研究的基礎。復旦大學附屬腫瘤醫院將臨床科研平臺的建設作為重點發展項目,確定了結構化、關聯化、平臺化、項目化的建設目標,建立了優勢學科單病種數據庫,并構建了臨床科研平臺。未來還將進一步完善頂層制度設計,以保障臨床科研平臺持續、高效運轉。
關鍵詞:單病種;數據庫;臨床科研平臺
中圖分類號:R73;R197.5 文獻標識碼:B
醫院在日常診療過程中產生大量臨床數據,但這些數據絕大部分不能被臨床研究直接應用。據美國臨床腫瘤學會估計,目前腫瘤臨床指南所依據的證據來源于不到5%的病例。大多數醫療決策缺乏臨床證據支持,往往依據臨床指南與實際經驗。
2021年5月,國務院辦公廳頒布《關于推動公立醫院高質量發展的意見》(國辦發[2021]18號),明確提出“加強臨床專科建設”和“推進醫學技術創新”等是公立醫院高質量發展的方向。2021年9月,國家衛生健康委和國家中醫藥管理局發布《關于印發公立醫院高質量發展促進行動(2021-2025年)的通知》(國衛醫發[2021]27號),提出要建設臨床重點??迫骸9⑨t院高質量發展核心內涵是學科建設,而科研是學科建設的重要內容。隨著臨床研究的發展,科研需要高質量的臨床數據作為基礎。復旦大學附屬腫瘤醫院是集醫、教、研、防為一體的三級甲等腫瘤??漆t院。近10年來,醫院將臨床科研平臺建設作為重點發展項目,以建立優勢學科單病種數據庫為重心,圍繞臨床科研需求,規劃構建科研數據中心,涵蓋科研數據管理應用全生命周期,逐步實現了科研數據采集應用的自動化、智能化。
1建設目標
單病種數據庫的構建是基于醫院現有信息系統,選擇醫院重點發展病種,以病例為基礎數據元,建成涵蓋全診療環節和全生命周期的臨床信息數據庫。高質量的臨床數據是臨床研究的基礎。從目前臨床實踐來看,高質量的臨床數據需要滿足至少4方面要求:一是結構化。臨床實踐產生大量文本信息需要按照一定的標準形成結構化數據,以滿足臨床研究需求;二是完整性。需要涵蓋患者全診療環節;三是前瞻性。需要對現有臨床實踐有所超越;四是效率性。臨床數據收集需要控制時間和費用成本。
腫瘤專科醫院獨有的診療特點也對單病種數據庫的構建產生一定影響。其一,患者數量和實際診療量較大,需要優先聚焦重點病種,比如惡性腫瘤;其二,腫瘤治療具有連續性,涵蓋門診和住院,并連接院外隨訪,需要結合多次診療;其三,需關注醫院多學科診療模式和精細化流程,重點提煉多個單病種數據庫的共性與交集,形成建設標準;其四,醫院長期形成的專科特點,比如疾病早中期多在外科,晚期多在內科,或者同一病種患者可能不同時期在不同科室就診等,使得構建單病種數據庫需以病種為核心,突破科室局限,使數據庫覆蓋患者診療及預后全流程。
基于以上考慮,在醫院已有信息系統基礎上,形成了以單病種數據庫為基礎的臨床科研平臺4項基本建設目標:(1)結構化。由各重點病種的多學科團隊牽頭,制訂單病種臨床數據集與數據標準,利用現代信息技術的自然語言處理方法和語義解析能力,進行結構化和后結構化處理,實現單病種數據庫的全結構化,使重要臨床信息的覆蓋度、自動化提取能力達到高水平;(2)關聯化。通過數據采集、治理,采用復雜邏輯結構化技術和數據血緣分析技術,實現數據高效查詢、篩選,以及結構化數據的溯源和多重驗證,滿足臨床研究的多元化需求;(3)平臺化?;趩尾》N數據庫建設,對醫院診療過程產生的多源異構數據進行匯聚治理,構建由數據平臺技術支撐的臨床數據中心和科研數據中心,形成多來源且共享的患者數據庫,使入庫病例有結局、有樣本;(4)項目化。從腫瘤專科臨床研究特點出發,形成一個科研數據中心加各種研究場景的項目化管理模式,實現實時、協同、高效管理,滿足數據采集、統計分析、隨訪、多中心研究、探索性研究等項目需求。
2整體架構
基于建設目標,在充分掌握醫院已有信息系統架構的基礎上,醫院設計了臨床科研平臺架構(圖1)。其基本思路是對醫院現有原始信息系統數據進行采集,通過數據治理體系,對原始數據開展結構化、標準化治理工序,形成可用的科研數據,進一步支撐上層數據服務與應用體系。
(1)數據源層。范圍包含醫院現有信息平臺中與患者有關的數據,比如醫院信息系統、電子病歷系統、檢驗系統、放射系統等,也為生物信息系統、可穿戴設備留出接口,以實現數據綜合應用與共享。
(2)數據中臺層。其目的是將醫院臨床業務系統源數據抽取到科研平臺,采用大數據采集適配器,對結構化、半結構化和非結構化數據進行快速匯聚。其核心是融合治理,根據病種多學科團隊提供的標準數據集,進行數據清洗和結構化、歸一化、標準化處理。數據中臺層為各病種數據庫開發、數據共享奠定了基礎。
(3)數據資源中心層。為臨床科研平臺的核心層,由各單病種數據庫組成,涵蓋醫院重點學科病種,并對有需求的專業和病種開放。通過數據中臺的標準化處理,使得各單病種數據庫中共性數據在字段定義和數據標準上實現統一,并在各數據庫中得以體現。
(4)應用層。以科研應用為導向,基于已有數據庫,建設科研平臺應用模塊。根據醫院臨床研究特點,提供支持跨病種研究、多中心研究的數據服務,支持利用可視化、統計分析等工具進行探索性和回顧性研究,以及基于現有數據的預后預測、輔助決策等,滿足臨床重點科室對專病的深度研究以及多中心研究的橫向擴展需要。
3建設成效
醫院自2012年開始探索構建單病種科研數據庫,先后與多家信息技術公司合作,開展了乳腺癌、甲狀腺癌、結直腸癌、胃癌、肝癌、肺癌、淋巴瘤、惡性黑色素瘤共8個單病種數據庫建設。
一是形成了高質量的單病種數據庫。以目前最為成熟的3個單病種數據庫為例:乳腺癌數據庫共計納入7.5萬名以上患者,結構化變量數為334個,覆蓋超過300萬次的就診記錄;甲狀腺癌數據庫共計納入6.2萬名患者,結構化變量數為347個;結直腸癌數據庫共計納入3.1萬名患者,結構化變量數為679個。通過識別字段類型-抽查填充率-樣例數據分析-修復問題數據-修正結果分析5個步驟對數據進行質控,并進行數據比對、專家審核和定期更新等,以保證診斷、外科治療、藥物治療、放療、隨訪等診療關鍵環節的數據質量。上述3個數據庫在患者數量、臨床信息豐富程度和數據質量方面都處于全國領先水平。
二是提升了數據治理效率。在信息技術支撐下,臨床數據結構化能力得以提高?,F代化腫瘤診療中,病理診斷信息至關重要。以病理數據為例,目前醫院病理部分全量解析提取臨床信息覆蓋率高于96%,重要信息覆蓋率超過99.5%,自動化提取正確率達98%,人工審核綜合評估正確率達99.3%。在高效的數據治理能力支撐下,目前運行的單病種數據庫已經能夠實現患者出院一個月內數據入庫。
三是增強了標準化能力。臨床研究需要基于診療實踐但又高于診療實踐,因此數據庫的數據集內容和數據標準也需要適應這一特點。一方面,臨床診療內容的變化和研究的前瞻性使得數據庫內容需要不斷更新;另一方面,信息技術的發展在數據庫建設過程中起到了促進作用。因此,醫院確定了2 a~3 a更新數據庫內容制度,并不斷向同行推廣數據集內容和數據標準,比如《甲狀腺癌——臨床研究專病結構化數據集》以及上海市衛生健康委標準預研制項目《乳腺癌標準數據集》等。
四是形成了單病種數據庫建設標準流程(圖2)。在單病種數據庫建設過程中,需要多學科團隊、流行病和衛生統計學專業團隊、信息技術團隊的通力合作,在建設各階段各司其職,保證項目順利運行。
五是明確了單病種數據庫建設中臨床醫生/研究者的職責。臨床醫生/研究者既是數據提供者,又是數據獲益者。醫院根據單病種數據庫建設標準流程,制訂了臨床醫生/研究者的職責(表1),以保證臨床專業人員的深度參與,提高數據庫建設成功率。
4討論
以單病種數據庫為基礎的臨床科研平臺建設,是醫院高質量發展的基礎性工作。目前,開展這部分工作的醫院數量較少,即使開展了也處于起步階段。相關研究也多局限于理論探討或部分實踐,需要更多積累以滿足實證研究需求。
本研究探討了臨床科研平臺的建設目標、整體架構及其與單病種數據庫之間的關系。從大部分醫院需求來看,臨床科研平臺框架的核心部分仍需要基于已經建成的單病種數據庫,尤其是醫院優先發展的重點學科、病種和專業。同時,這些來源于真實世界的單病種數據庫,其建設是一個與科研和臨床需求互動的過程,需要進一步完善內容和提升數據質量,并通過推廣宣貫以獲得更多臨床研究使用數據,因此數據庫本身的完整性、可靠性和適用性有待進一步提升。在這個過程中,構建臨床科研平臺,可以促進各單病種數據庫的完善和應用,使數據庫和平臺相輔相成、互相促進,共同服務于臨床研究。
本研究探討內容為臨床科研平臺建設初期面臨的問題。醫院日常臨床實踐中產生了大量信息,要讓這些信息為臨床研究所用,不但需要長期、持續、大量的投入,還需要認識到從建設到臨床實踐再到臨床研究成果產出有較長周期,并且在建設過程中原先的建設目標也需要不斷調整,以適應腫瘤醫學和信息技術的快速發展?;谶@一認知,未來還需要有更為實際的頂層設計,以保障臨床科研平臺持續、高效運轉。這些制度設計主要包括兩點:一是在醫院層面和專業層面建立單病種數據庫/科研數據平臺建設委員會,制訂策略,協調資源,規劃投入,激勵產出,形成涉及研究平臺與數據庫的應用規則和成果分享機制,不僅包括科學研究、高質量文獻、數據標準,而且包括科研平臺和數據庫潛在的高質量成果產出能力、服務能力和數據產品等;二是在項目投入方面的制度設計和創新。無論是以往的經驗還是未來的方向,多方籌集建設資金都是可行的,探索新的資金籌措方式,比如建立單病種數據庫/科研數據平臺發展基金,由國家、地方政府、醫院、數據運營服務企業甚至數據潛在應用方共同投入資金,統籌管理,制訂規劃,分期投入,也可以從科研運營角度出發從使用平臺服務的研究項目中收取費用,以實現基金正向積累。
未來,基于高質量的科研數據、高質量的真實世界研究和臨床試驗,會進一步提升臨床科研平臺的價值,甚至在某種程度上有望形成公立醫院發展新模式,成為醫學發展新動能,從而推動醫療科技創新和發展進步。
致謝:聯仁健康醫療大數據科技股份有限公司、杭州深睿博聯科技有限公司。