胡 浩
(重慶醫科大學附屬第二醫院 重慶 400010)
我們正處在一場信息化普遍覆蓋,知識不斷更新變化的革命,對現實世界的臨床狀況分析是對我國當代和現實世界醫學領域發展的研究,結合綜合分析,通過大量的數據和結論,得出結論:應用RCT過程,為未來包括臨床醫學、循證醫學及藥物和醫療設備在人群中的信任,提供更可靠的理論和技術支持。同時,RWS也將在醫學界得到全面、廣泛的認可。
真實世界研究(Real world study, RWS)是指從真實的醫學事件所反映出的情況中專注于鉆研數據,映射真實的診斷和醫治進程以及患者在真實條件下的健康狀況。
真實世界的研究數據來源非常廣泛,包括由患者在門急診、住院期間的檢查、手術、操作以及在藥房甚至可穿戴設備、社交媒體等渠道中產生的大量數據。同時,數據也可以來源于各種研究數據,如調研、基于一定以研究或者了解病情為目的的患者注冊用戶(包括注冊賬號、電子病歷以及以真實醫療條件為基礎進行模擬的研究等)進行的隨機對照試驗數據、研究數據。對于某些特殊類型的臨床患者,最大程度地總結了治療數據,為他們的診斷和治療提供參考。隨著電子病歷系統和大數據網絡的發展,可以幫助RWS建立起它所需要的大數據來源,同時樣本的臨床資料和標準化系統的統計分析,也可以產生大量的真實世界的證據。在美國國會發表的《二十一世紀治愈法案》中明確提出,RWS將被用于藥品和醫療器械的批準。這是RWS重要性的體現,可以用作隨機對照試驗(Randomized Controlled Trial, RCT)重要的延續和補充[1]。RWS與傳統臨床試驗的具體關系如圖1所示。

筆者首先確定了所有檢索到的文獻具有研究意義。確保檢索到文獻的準確性和可用性,并獨立完成包括在萬方、維普、中國知網、PubMed、CBM等文獻搜索引擎上的檢索和檢索結果輸出。同時對每個網站上對于真實世界研究相關文獻都創建了獨立的檢索表達式。對每一項合格研究的數據都以標準提取使用檢查表進行檢查和評估以及數據提取,對預測進行系統的回顧。由于研究的性質,對RWS現階段研究所產生的結果測量、研究結果以及薈萃分析不予討論。同時,進行了定性評估,更關注具有特點、發展和表現的模型。對于經過驗證的模型,進行驗證并對方法和結果進行了歸納總結[2][3]。
共有18905篇文獻通過數據庫被確認搜索。其中有70項研究被筆者查重篩選確認通過并進行分析研究,共提供120份出版物。后刪除不符合錄入標準文獻30份,其中18份涉及成人住院醫療研究。另外12份研究是對文獻的分析及摘要的回顧綜合描述。剩余40份筆者對其進行通讀并綜合性分析了RWS現階段整體發展和應用情況,得出8篇符合條件的文獻進行整合[4]。
通過對RWS的綜合性研究及探討發現,很多學者及專家更傾向于將RCT和RWS當作同一概念看待,實則不然。雖然現實世界的研究有時被簡單地理解為觀察性研究,但這是不全面的。如圖2,就是將RWC與RCT進行系統化的對比:

圖2 RWS與RCT系統化對比圖
同時,RWS仍屬于研究范疇,在效果研究上與RCT還是具有一些共同的特點,但RWS在質量控制、人群選擇、研究指標、數據收集、樣本量、隨機化控制應用、評價時間點等方面都有其本身的特色,這些均用于研究干涉措施的適用性及影響性。在進行RWS研究時,人們往往是在樣本量龐大以及對象人群廣泛的基礎下,根據患者的愿意使用藥物或是介入治療的其他方式來進行研究,而不是使用隨機安排的方法進行干預和藥物治療,這是RWS和RCTS對實驗設計的主要區別。RWS經常需要長期評估并關注臨床有意義的結果指標,并且,對數據收集、管理和分析的嚴格控制也是RWS的關鍵。如圖3所示,是對RWS現階段發展很好的詮釋[5]。

圖3 RWS現階段發展概念示意圖
國內RWS剛剛開始,仍聚焦于觀察研究。RWS需要樣本含量較大,大多數時候有必要利用網絡和數據庫來形成大數據。并且,統計分析是困難的和需要的,需要通過多因素分析,如回歸、傾向得分協方差分析和數據挖掘技術等數據分析方法。
在RWS實踐的過程中,將包括來自不同來源和格式的數據。在整個臨床真實世界研究的過程中主要包括以下步驟:1.評估各種數據的相關性、真實性和可追溯性:數據必須能夠對干預或暴露因素對目標人群的影響作出反應,并且,元素的數據應該清晰地定義和可驗證的來源,此外,研究人員可以盡可能地追蹤原始數據。2.將不同來源的數據整合成適當的格式;研究人員需要將來自多個源的數據集成到一個統一和清晰的格式中,以確保分析結果的可重復性。3.處理離群值和缺失值:離群點可以增加離散數據的程度,允許研究者得到有意義的結果,因此研究人員應該預先建立離群值的合理標準。對于離群值,研究人員要探究原因。4.缺失數據的處理:有時數據的缺失不是隨機的。如果忽略了缺失數據的內在規律,就會丟失重要的信息。對于缺失數據,應進行探索性分析,以澄清缺失值在各種研究因素中的分布,并確定分布是否是隨機的。對于可追溯性數據,重要的是要完成補充丟失的數據[6]。
再接下來就是按照上述的各種研究方法對研究對象進行系統性的分析與得出想要的部分數據;最后一步則是對得出的數據進行整合和清理以及總結得出結論,這也是真實世界研究的核心部分,包括數據清理耗時、從手動清洗數據到自動數據清理,這些問題是通過人工數據清理、報告、數據返回、再次清理等數據編碼步驟生成的。許多研究開始使用電子數據錄入和管理系統進行數據管理,同時實現端口數據的錄入,數據核查量化和數據存儲,有助于提高真實世界的數據質量。
雖然RWS已經積累了超過10年的研究范式,但是仍發覺,真正的世界中臨床研究范式仍然處于“規范式”階段。目前,雖已有數十家醫院建立了“臨床研究信息共享系統”來支持這一示范。然而,要真正形成一個全國性的研究示范模式,仍需要獲得更多的醫務工作者的認可和參與。同時,若想要實施這一模式的理念也需要不斷更新理念,需要更多的跨學科研究團隊,對理論、技術和應用的運作進行支持,收集更多重要的信息來進一步完善;技術也需要吸納更多的專業性人才。現代科學技術,尤其是信息科學和數據科學領域,有必要深化應用。大數據時代的到來為臨床研究的整合范式提供了堅實的基礎,臨床研究的整合范式將成為醫學發展的新階段[7]。
RCT研究為臨床治療提供了基本參考,大量RWS作為RCT研究的延伸和補充,對提高臨床診斷和治療水平,促進臨床指南的改進具有重要意義,同時可以促進臨床指南的改進與提高。目前,如何設計和實現RWS,如何充分利用多通道數據,如何將RWS與醫學大數據相結合,仍處于探索階段。