宣建偉 程 江 薛雄峰 吳 茵
美國食品藥品監督管理局(FDA)、國際藥物經濟學與結果研究協會(ISPOR),定義真實世界醫療大數據為除傳統臨床試驗以外的任何臨床數據[1-2]。通過對真實世界醫療大數據科學、規范、同步、動態的分析,能更好地發揮其應有的價值,為臨床醫療決策管理,醫保支付決策,及政府衛生政策的制定提供證據支持。但有效的真實世界數據分析需建立在高質量的真實世界醫療大數據庫的建立及嚴謹的科學分析方法。否則真實世界數據的分析將難免于各類混雜因數的干擾。
我國擁有全球最多的人口,真實世界臨床數據 極為豐富但大多數據在各醫院以孤島形式存在。醫學信息數據得不到有效的共享和利用。迫切需要進行周密頂層設計下的醫療衛生大數據的優化整合,構建多個全人口的區域衛生綜合數據平臺,最終建立高質量的覆蓋面廣的真實世界醫療大數據庫。真實世界醫療大數據的可獲得性是高質量真實世界研究能否開展的關鍵前提。
隨著信息技術的迅速發展及各類數據標準化方法的建立。長期困擾醫療行業的海量和非結構化數 據無法進行有效整合及有效分析的問題也有了解決手段和方法,因此,高質量醫療大數據庫的建立也有了可靠的方法和基礎,累積的海量真實世界醫療歷史數據可以被充分分析,發揮更大的臨床指導及循證決策價值。高質量醫療大數據庫的建立應具有如下標準和內容。
高質量的醫療大數據庫的建立應基于各醫院真實臨床數據的實時抓取,直接接入,接入數據應包含全病種,門診,急診,住院,化驗,手術及影像學數據,對接入數據按國際通用診斷及分類標準運用機器自我學習語言對所接入數據進行清洗和結構化并建立標準化字典及知識庫,建立結構化數據庫以達到數據挖掘及分析的要求(圖1)。
高質量的醫療大數據庫的建立應對所結入數據按國際通用診斷及分類標準進行清洗和結構化(圖2)。所有從醫院得到的原始數據在研究前均需經過清洗和脫敏去除病人隱私信息。所有的變量都 經過標準化,結構化,如診斷ICD-10 編碼與藥品ATC 編碼等。

圖1 醫院HIS 信息數據整合示意圖

圖2 醫院HIS 信息數據清洗結構化示意圖
高質量的醫療大數據庫的建立應對同一病人的所有病歷記錄都經過整合,以提供以個體病人為基礎的長期縱向追蹤記錄以支持循證醫學研究。數據庫應包含以下信息:病人人口學數據和保險信息,診斷(ICD-10),并發癥,治療結果,實驗室檢查詳細信息,處方信息,住院詳細信息,手術信息,所有衛生資源利用和費用信息,及其他臨床及管理信息等(圖3)。
高質量臨床醫療大數據庫的建立及構建大數據模型進行多維度分析挖掘的結果將能為患者帶來高性價比的醫療服務,為醫療工作者提供循證醫學指導,為醫院管理者提供高效醫院運營管理決策指導,為制藥及醫療器械企業提供高效率的新技術研發,市場準入策略,市場營銷價值信息,為衛生、醫保決策部門提供循證依據,支持管理及準入決策,節約費用降低醫保基金風險,推動管理精準化進程, 達到提高醫療水平、降低醫療成本、提高病人生命質量之目的。
大數據分析技術應用于真實世界研究將使臨床決策支持系統更智能,這得益于對非結構化數據的處理,分析能力的日益加強。比如可以使用圖像分析和識別技術,識別醫療影像(X 線、CT、MRI)數據,從而給醫生提出診療建議。臨床輔助決策支持系統分析醫生輸入的條目及日常診療行為,比較其與醫學指南不同,從而提醒醫生防止潛在的錯誤,如藥物不良反應。在精準分析包括病人體征數據、費用數據和療效數據在內的大型數據基礎上,對比多種干預措施的有效性,結合臨床結果尋找到針對特定病人的最佳治療途徑,可以幫助醫生對個體病人確定臨床上實時采用最有效和最具有成本效益的治療方法以達到精準醫療目的。如下圖所示,所有病人從疾病開始到疾病臨床終點觀察,每位病人都經歷了各不相同的臨床治療路徑。最終結局為:好轉治愈,病情穩定,或者惡化死亡?;谡鎸嵤澜缗R床診療數據進行大數據分析方法即是對病人的各類特征進行詳細歸納分析,對各類臨床路徑及最終臨床結局進行聚類分析尋找最佳臨床效果,最高性 價比的臨床治療路徑指導臨床診療服務(圖4)。

圖3 結構化數據庫字典示意圖
中山大學醫藥經濟研究所與溯直健康有限公司合作,依據上述方法學對2 萬余例中國高血壓病人進行了類似分析。結果表明C08A0(鈣離子拮抗劑)占所有病人用藥例數的29.7%,是高血壓的最主要的用藥。其次是C07A0(β 受體阻斷劑)和鈣離子拮抗劑聯用。再次是C07A0 單用。值得注意的是數據分析展示C07A0(β 受體阻斷劑)和C03A2(環類利尿劑)及C03A1(保鉀類利尿劑)血壓控制率大大超過其他藥品,均達到70%,甚至達到80%。相對而言,C09A0[血管緊張素轉換酶抑制劑(ACE)]和C09C0[血管緊張素Ⅱ拮抗劑(ARB)]并沒有更好的表現。下一步工作將對病人進一步細分尋找各類人群最佳治療路徑以指導臨床決策(圖5)。
對真實世界醫療大數據庫的分析同時能對各種疾病病人情況及臨床用藥進行全面評估以找出問題,總結規律以指導臨床合理用藥。
一項基于50 余萬中國糖尿病病人10年追蹤數據分析顯示中國糖尿病病人發病高峰年齡為50~70 歲之間。病人用藥無規律性,在前10 位使用最多的藥物無效必須換藥時,醫生處方行為顯示了137種換藥路經。研究展示中國糖尿病病人急需高質量的臨床指南及臨床輔助決策系統指導醫生病人合理用藥以獲得最佳臨床療效(表1)。
真實世界數據分析同時也能對疾病治療藥物使用方式的變化從大人群角度予以展示治療技術的發展。在以上同一研究中,我們可以觀察到,從2014年至2017年,二甲雙胍類藥物使用比例幾乎未變,各類胰島素使用有所增加,DPP-4 及其他創新藥也略有增加,而磺脲類藥物有所下降。分析結果對中國糖尿病人歷年來用藥模式的改變進行了總結,也為創新藥物發展方向提供了循證依據。見圖6-7。

圖4 臨床診療路徑輔助決策系統建立示意圖

圖5 臨床診療路徑輔助決策系統建立示意圖(以高血壓為例)

表1 糖尿病病人個體追蹤數據
良好的真實世界臨床數據庫不僅需要數據量大,覆蓋人群地域范圍廣泛,包括全病種范圍,還 需要獲得對病人的全面的長期可追蹤數據以利觀察遠期療效。一項基于HIS/EMR 大數據庫的研究追蹤了我國50 余萬糖尿病病人。其中部分病人可追蹤達10年。通過研究發現糖尿病人遠期并發病不良事件(比如心絞痛,腦卒中,眼底視網膜病變,糖尿病腎病,糖尿病足/壞疽)3年發生率為一年的2 倍左右。該類數據對病人臨床干預手段的選擇,結果轉歸分析及病人長期追蹤帶來極大價值。
對真實世界臨床醫療研究型大數據庫的分析通過對個體醫院的臨床醫療管理及臨床醫療質量數據進行分析、比較及總結,找出差距,發現問題,確立目標,幫助醫療機構提高管理績效。
對我國某一醫院經營數據分析可以看出,在零加成政策下,醫院藥材收入理論上為醫院無效收入,藥占比,材支占比較高的科室則應為醫院重點管理,提高整體醫院績效的科室(表2)。

圖6 糖尿病病人用藥及換藥示意圖

圖7 糖尿病病人歷年用藥模式追蹤
臨床醫療大數據分析能對醫院病人管理質量的提高指出方向,對15 家醫院年齡40 歲以上男性患胃潰瘍/胃十二指腸炎病人是否進行了胃腸鏡檢查的簡單分析。結果顯示在這個高危人群中胃腸鏡檢查的比例較低。增加高危人群中的胃腸鏡檢查比例不但能更好地幫助臨床醫生遵循指南,更好地管理好慢性疾病,合理地增加醫院短期績效。同時遠期還能減少醫療費用,節約醫保開支(圖8)。
對真實世界醫療大數據的分析也能展示疾病治療花費在各個不同人群中的差異。在15 家醫院全病種費用對比研究中,研究發現醫保人群平均花費穩定持續地高于自費人群,差異費用可高達40%。顯示在實際工作中還有許多空間能夠更好地管理醫保經費(圖9)。

表2 各科室門診,住院均次花費舉例

圖8 高危病人胃鏡檢查比例

圖9 不同保險病人均次費用對比
大數據對各醫院的分析同時能對多醫院經營管理數據進行對比,反映各醫院經營者的經營成效,明確管理經驗改善方向,并提出整體性改善舉措。數據分析結果同時能精準定位費用結構,尋找節約單病種診療費用,在DRG 按病種分值支付條件下分析理解醫保收入來源。最后大數據對各醫院數據的分析結果可為衛生管理部門提供決策數據依據,促進有效的政策制訂。
隨著創新醫療科技技術的發展以及人均期望壽命的增長,人均衛生資源需求量的顯著增加。如何合理有效地使用衛生資源已成為政府、社會和個人必須面對的問題。醫保(作為付費方)需要鼓勵創新藥物及創新技術的使用,但由于總體支付能力的限制,不可能把層出不窮的新藥及創新技術照單全收,政府需要找到一個公平的方式評價哪些新藥/新技術的性價比最高以支持支付政策的決定。我國醫保正進入新的定位,即由被動的支付、補償,轉變成以價值為基礎的戰略性購買,為參保者購買具最佳性價比的服務。醫保作為民眾的醫療基金管理方,正在建立一個成熟、完善的以價值為基礎,以臨床結果導向為目標的購買機制。醫??紤]的核心是價值,是各類創新藥物及技術的性價比而不僅僅是單一分開地看療效或者價格。而高質量、完整、全面的評估離不開高質量真實世界醫療大數據。真實世界數據有助于更全面支持醫保精準管理,展示創新藥品及技術的價值,是衛生技術評估中至關重要的一環。醫保目錄制定、談判證據以及支付決策應基于真實世界數據分析及被評估創新藥品及技術,包括:臨床價值:RCT 證據為基礎,真實世界證據為調節因素。經濟價值:基于RCT和真實世界證據的性價比研究及基金沖擊影響研究。病人價值:病人生命質量,不良反應,疾病轉歸,及對生活各方面的影響。社會價值:對社會的總體價值,影響,生產力及其他。
案例1:Willis?(Microport)為用于治療顱內動脈瘤的覆膜支架能起到再造血管作用,但費用較貴。由中山大學藥學院醫藥經濟研究所完成的一項基于真實世界數據的成本效果研究,將Willis?與傳統治療方法(金屬彈簧圈)進行比較,證明Willis?治療大于0.7 cm 的動脈瘤相對于金屬彈簧圈治療更具成本效果?;诖搜芯孔C據,上海社會保障基金將Willis?用于顱內動脈瘤費用的80%納入醫保支付范圍(圖10)。

圖10 Willis?(Microport)治療顱內動脈瘤的 覆膜支架示意圖
案例2:醫保報銷數據庫研究支持醫保政策實施
醫保報銷數據庫也是進行真實世界數據研究的重要數據庫之一。中山大學藥學院醫藥經濟研究所基于2014、2015年廣州醫保大數據的一項對比研究展示了廣州醫保乙肝門特政策的實施導致了乙肝患者覆蓋率達到從2014年的82%增加到2015年的95%?;颊咦愿侗壤?3%顯著下降到33%,極大地降低了病人負擔。同時指南推薦的一線藥物的使用率獲得提高,病人一線藥物的治療依從性大幅提高。藥物持有率(medication possession ratio,MPR)由2014年的65%增加到2015年的84%,提示病人的遠期療效將獲得改善。
運用臨床醫療及大數據分析方法,可為患者提供更好的臨床體驗,最具性價比的干預手段,及最佳的的臨床結果。