王 斌,白如健,謝 琪,陳 迪,曹馨宇,周洪偉,史華新,張妮楠
(1.中國中醫科學院中醫臨床基礎醫學研究所 北京 100700;2.山東中醫藥大學附屬醫院醫務處 濟南 250011;3.中國中醫科學院中醫藥數據中心 北京 100700;4.中國中醫科學院廣安門醫院醫保辦 北京 100053)
以隨機對照臨床試驗(randomized clinical trial,RCT)為代表的傳統臨床研究,為獲得較高的內部真實性,納入人群限制較多,干預條件控制嚴格,使得研究結果的外部真實性卻較差,研究結果的實際應用推廣受限[1]。針對這樣的問題,1993年Kaplan等首次在論文中使用了真實世界研究(real world study,RWS)方法[2]。RWS通過“真實世界樣本”來反映真實世界總體,廣泛應用于藥物臨床不良反應的監測,上市藥物有效性和安全性再評價及臨床干預措施的評價,近年真實世界研究日益成為醫療衛生領域關注的焦點之一。真實世界證據(real world evidence,RWE)也成為醫療衛生決策者、執業者、研究者、醫藥企業共同關注的對象[3]。
中醫臨床科研的特征是以人為中心,以數據為導向,以問題為驅動,醫療實踐與科學計算交替,從臨床中來到臨床中去[4]。由于真實世界研究可以根據患者的實際病情和意愿選擇治療措施開展長期評價,能夠評價綜合效應,適應中醫整體觀念和辨證論治的特點,在中醫領域開展日益廣泛[5]。如何將健康相關的數據轉化為RWE,這需要從數據的可及性、數據的安全性以及倫理學問題等多方位的思考。本文僅從數據可及性相關的角度闡述真實世界研究中的數據采集方法。
隨著信息技術的發展,利用計算機和其他電子工具收集和存儲大量與健康有關的數據一直在增加。構成RWE的數據內容豐富,種類繁多,數據量巨大,這為真實世界研究的可行性提供保障[6]。真實世界數據(real world data,RWD)主要包括來自電子健康記錄(electronic health records,EHR)、社會保障或醫療保險數據庫、疾病登記數據庫、家庭監護設備數據、健康移動設備的監護數據以及生物樣本檢測的各類組學數據等[6]。中醫RWS中的數據主要來源于以電子病歷為核心的醫療衛生服務記錄,以門診病歷或者住院病歷的形式存儲于醫院信息系統的數據庫中,不僅包括一般人口學信息,診斷記錄,處方,醫囑,檢查檢驗報告以及健康移動設備的監護數據等;還包括中醫的四診信息,中醫癥候等。
中醫藥的數據資源具有典型的大數據特征[7]。一是數據量巨大,中國中醫科學院2012年4所醫院全年的門診量達到698萬,僅廣安門醫院1天的門診量就超過1萬人次。然而,由于門診診療服務的時效性要求極高,信息采集也僅是局限于基本是診斷信息、處方,而信息量更豐富,更有價值的診療過程的記錄相對不夠完整與全面。為此,我們優化門診診療流程,充分利用病人候診的大塊時間,開發門診預診系統用于門診病歷的采集[8]。中醫門診預診系統的實施進一步豐富了中醫真實世界數據采集的手段,提升醫院病歷數據化的水平和臨床數據的利用能力。
RWS最本質的特征并不是其研究方法和試驗設計的特殊性,而是構成RWE的數據來源于醫療機構、家庭和社區,而非存在諸多嚴格限制的科研場所。根據RWD采集地點的不同,可以分為醫療機構內部和醫療機構外部的采集。
目前,醫院的信息系統(hospital information system,HIS)已經覆蓋從社區醫療服務站到3甲醫院的各個醫療服務機構,醫療大數據的概念在業內也得到廣泛認可。以電子病歷為核心的醫院信息數據庫已經為真實世界研究提供了很好的技術支撐[9]。
患者基本信息的采集包括一般人口學信息:姓名、性別、出生日期、民族、婚姻狀況、職業、工作單位等。該部分信息一般由HIS的身份登記子系統或者預約掛號子系統在患者初次就診時生成,采集對象為患者本人或家屬。
診療信息的采集包括:主訴、現病史、既往史、過敏史、個人史、家族史等一般信息;中醫四診信息;中醫診斷;西醫診斷;藥物與非藥物治療方案;檢查檢驗結果;中醫特色量表。該部分信息一般由電子病歷系統生成,采集對象為患者本人。
RWD的構成極為廣泛,醫療機構以外的數據采集也是其重要的數據來源,包括區域醫療健康數據庫、個人健康信息采集終端、社會保障或醫療保險數據庫、公共衛生調查與公共健康監測、出生/死亡登記項目、隨訪系統等提供的數據。外部數據可通過電子數據上傳或數據直接對接的方式獲取。
及時、準確、完整、規范、真實是臨床試驗數據“采集記錄”的管理遵循的規范。RWD的采集也同樣適用與該規范,為保證從各類健康相關數據庫中采集的數據更好的轉換為RWE,在開展數據采集時應保證:每一條記錄都應有唯一標識碼,確保主記錄與明細記錄關聯對應;診療數據應有生成時間;實驗室檢查結果應附標準值;中成藥記錄應附生產廠家及批號;隱私數據應依據倫理要求進行匿名化處理。
由于目前各醫療機構間尚未實現數據的互聯互通,為保證各數據采集點數據的關聯性和完整性,需要在制定數據采集方案時,設計患者主索引。患者主索引主要用途是在一個復雜的醫療體系內,通過唯一的患者標識將多個醫療信息系統有效地關聯在一起。以實現各個系統之間的互聯互通,保證對同一個患者,分布在不同系統中的個人信息采集的完整性和準確性[10]。
RWS中,從數據采集到數據分析,數據要在數據采集者、數據管理者、數據利用者等不同的角色中傳遞、交換。每一次的傳遞、交換都可能對數據的質量造成影響,因此數據描述與質量評價說明尤為重要。
數據特征描述:數據來源、數據量。
數據庫描述:數據表的定義規則、變量定義規則、隱私保護需要、共享要求。
數據文件描述:文件格式、存儲方式、備份策略、保存時限、數據庫說明文檔。
數據用戶描述:臨床數據采集者、質量控制人員、數據分析人員。
真實、準確、完整和可靠是保證臨床試驗數據質量的基本原則。數據核查包括以下內容:違背方案核查、時間窗核查、邏輯核查、閾值范圍核查、一致性核查、數據完整性核查等。數據核查后產生的質疑需要反饋給臨床監查員或研究者。研究者對質疑做出回答后,數據管理員根據返回質疑答復對數據進行修改。
面對中醫臨床研究缺少廣泛認可的研究范式這一難題,劉保延等提出了基于真實世界研究的中醫科研范式[4]。中醫臨床數據凝聚了臨床經驗與科技創新活動的成果,是傳播衛生科學技術知識的重要載體,也是國家寶貴的知識財富,中醫真實世界研究是實施循證醫學研究方法,轉化臨床數據為可靠的臨床證據的有效途徑。基于中醫藥的臨床數據,通過可靠地數據分析工具,能夠為疾病發現、診斷治療、藥物開發、醫藥管理等方面提供科學的決策支持,對疾病的預防和衛生資源的合理配置也發揮了積極作用[11]。基于中醫專家知識、中醫臨床信息的海量數據,通過有效的算法,為疾病癥狀學研究、證候要素研究、證候分類及證候分布規律研究、治則治法研究、方藥研究、方藥配伍規律研究、證效關系、量效關系、時效關系、治療方案的篩選與優化研究、診療指南規范與標準的研究、中醫量表的研究等提供信息數據資料和技術支持,促進中醫基礎理論的發展和進步[12]。
證、治、效的有機結合,使得中醫理論和臨床實踐不斷循環進化發展的過程體現了中醫診療的復雜性。這是因為,中醫臨床數據是結構化數據(處方、檢驗結果)、半結構化數據(病歷數據)和非結構化數據(圖像、信號等)混雜的。然而,從數據挖掘和知識發現的角度出發,為了能更好的發現數據庫中隱藏的信息,作為良性的數據利用者更希望發布的數據集中包含有更精確、更具體的數據信息。在真實世界研究中,數據采集方法將直接影像數據的質量,進而影響臨床研究結果的可靠性。可見,規范的數據采集能保證海量的臨床數據為基于臨床需求的數據分析、挖掘的可行性,也使得真實世界研究方法為真實世界數據轉換為可靠的臨床證據成為可能。
1 李敏,時景璞,于慧會.真實世界研究與隨機對照試驗、單病例隨機對照試驗在臨床治療性研究中的關系比較.中華流行病學雜志,2012,33(3):342-345.
2 Kaplan N M,Sproul L E,Mulcahy W S.Large prospective study of ramipril in patients with hypertension.CARE Investigators..Clin Ther,1993,15(5):810.
3 孫鑫,譚婧,唐立,等.重新認識真實世界研究.中國循證醫學雜志,2017(2):126-130..
4 劉保延.真實世界的中醫臨床科研范式.中醫雜志,2013,54(6):451-455.
5 謝琪,江麗杰,劉保延,等.開展真實世界中醫藥效果比較研究的關鍵問題及對策的探討.世界中醫藥,2014,2014(1):28-31.
6 Sherman R E,Anderson S A,Dal Pan G J,et al.Real-World Evidence-What Is It and What Can It Tell Us?.New Engl J Med,2016,375(23):2293.
7 蘇暄.大數據,帶來中醫個體化診療新視域?——訪中國中醫科學院常務副院長劉保延.中國醫藥科學,2015(1):1-3.
8 劉婕,劉保延,謝琪,等.服務于研究型醫院的門診病歷采集方法研究.中國數字醫學,2016,11(6):21-23.
9 王斌,謝琪,史華新,等.真實世界臨床科研中電子病歷數據的存儲.中醫雜志,2013,54(20):1736-1739.
10崔泳,金鐸.患者主索引(EMPI)是醫療信息系統的連接點.中國信息界:e醫療,2010(12):53-54.
11丁維,蔣永光,宋姚屏,等.數據挖掘及其在中醫領域的應用研究.數理醫藥學雜志,2007,20(3):403-404.
12謝琪,劉保延,李鯤,等.論中醫藥臨床數據的科學價值.國際中醫中藥雜志,2010,32(5):455-456.