文圖/《中國醫藥科學》 費 菲
近幾年,我國及全球各國藥物管理部門越來越重視加強對藥品不良反應的主動監測。對包括中藥注射劑在內的所有上市藥品,主要采用的藥品安全主動監測方法是傳統的流行病學專題調查方法,如隊列研究、病例對照研究等,這些方法固然彌補了被動自發監測報告的局限,但其花費和時效性從監管角度來看都是較差的。尤其是前瞻性隊列研究雖有很好的研究設計,但也存在一些問題,比如需要較大的樣本量。目前大數據的出現恰好為我們研究這些罕見的藥品不良反應發生頻率和事件帶來了很好的機遇。日前,在第二屆臨床中藥學大會上,北京大學公共衛生學院流行病與衛生統計學系主任詹思延教授分享了在大數據和藥品安全主動監測方面的最新研究成果。
世界衛生組織對藥物警戒(PV)的定義是發現、評價和預防藥物不良反應或其他任何可能與藥物有關問題的研究活動。藥物警戒前3個階段為藥物研發階段:第一階段20~50名健康志愿者收集同步數據,進行臨床前動物試驗以確定急性毒性、器官損傷、劑量相關性、代謝、動力學和致癌性。第二階段150~350名患者,確定安全性和劑量建議;第三階段250~4000多名不同種患者組確定短期安全性和效驗。之后進入注冊批準上市后階段,進行核準后新藥研究以確定特殊安全性問題,主動報告核準后研究,進行風險效益研究,進行藥品不良反應監測,自發報告系統風險和效益的評價。而藥品上市后臨床使用狀況與上市前臨床試驗所限定的使用條件不大相同,上市后風險管理的重點是廣泛使用情況下藥品的安全性,重在發現上市前觀察不到的安全性盲點,如新的罕見嚴重不良反應、遲發的嚴重不良反應、藥物相互作用、對特殊人群的影響等。因此,藥品在廣泛使用情況下,最常出現如肝毒性、腎毒性、心血管毒性、血液毒性、中樞神經系統損害、皮膚損害、骨骼和肌肉損害等安全性問題。
眾所周知,藥品需要全生命周期管理,在上市前經過嚴格的臨床前和Ⅲ期臨床試驗,但是僅這樣還不夠,由于樣本量和研究人群的局限,上市后仍需要開展上市后的藥品監管。現在對藥品不良反應更強調從被動監測走向主動監管。被動的監測是世界各國目前針對藥品不良反應的常規性工作。常見的自發報告系統有世界衛生組織(WHO)國際藥品監察中心、美國安全性信息和不良事件報告系統(MedWatch)、英國不良反應黃卡制度、加拿大藥物不良反應監測中心(CADRMP)、澳大利亞不良反應藍卡制度,我國也設立了國家藥品不良反應監測中心,收集由各級往上呈報的藥品不良反應報告。被動監測有很多優點,比如可快速進行追蹤、費用低、覆蓋范圍廣、研究工作的持續時間沒有限制、不影響醫師處方習慣或日常臨床工作等。但也存在局限性,比如漏報、報告帶有隨意性,且內容不完整,較難確定因果關系;由于缺少用藥基礎人群數量,無法計算不良反應的發生率、無法分析危險度;沒有對照組;存在報告偏倚等。
如果對研究要求較高,可開展前瞻性隊列研究,但此類研究存在需要較大的樣本量等問題。如果藥品不良反應(ADR)發生率在1/1000水平,至少需隨訪觀察3000名用藥人群從中發現1例才具有統計學意義;如果是1/10 000水平,則需隨訪觀察3萬例從中發現1例才具有統計學意義。詹思延團隊開展抗結核藥物不良反應發生率調查,2007年立項,2008年起在全國4個省52個縣市用隨機抽樣的整群抽樣方法進行調查,2013年才發表第一篇文章。全球基金投入150萬元,耗費4年時間(現場隨訪2年,數據整理、分析近1年,論文撰寫到發表1年),僅獲得一個抗結核藥物不良反應率(雖有其他副產品)的數據。

□詹思延:大數據為藥品安全主動監測帶來全新機遇
大數據(Big Data)的特點主要體現為4個“V”:體量巨大(volume)、類型多樣(variety)、價值密度低、商業價值高(value)、即時性和處理速度快(velovcity)。大數據給我們帶來抽樣與全體、精確性與混雜性、因果關系與相關性等思維改變。醫療大數據具有多種類型,每個人身邊也不斷產生各種數據。所謂大數據就是使用不同于傳統的統計分析方法,收集分析日常診療行為所產生的數據,如電子病歷、全國城鎮醫保數據及公共衛生領域的各種監測數據。
近年來,詹思延團隊一直在關注基于我國現有的集成數據源大數據回答藥品安全性問題的可行性,并開展了相關的分析和研究,總體結論是目前已進入基于大數據開展藥物上市后安全性主動監測和藥物流行病學研究階段。大數據在藥品主動監測中可發揮以下作用:便于前瞻性設計;實現不同數據庫不良事件的快速識別;獲得整體用藥人群(分母)計算不良反應事件發生率;選擇對照,控制混雜,進行關聯強度分析。但這一理念并不是我國首先提出,美國食品藥品監督局(FDA)在2007年獲得國會授權,啟動了建立藥品安全主動監測系統的行動。除建立大型電子數據庫,也十分重視數據分析方法。美國建立了公司和監管部門聯合的觀察性醫療結果合作(OMOP)項目,歐洲也有探索與理解藥品不良反應(EU-ADR)的項目,目的都是用各種數據源開展主動監測,并將數據分析方法作為最重要的研究方向之一。
從2013年開始,詹思延團隊與美國和歐洲相關數據庫管理者建立了交流和合作,邀請他們到北京大學醫學部開展講座,介紹經驗,同時對國際主動監測系統進行了系統梳理,為國家藥品監督管理局提供了各國藥品安全主動監測系統的整體情況報告,報告中分析了主動監測主要的特點是分布式網絡(distributed network),即主動監測基于的數據庫并不是固定到某一家,而是分散存在的。如何用好分布式網絡?國際上普遍采用通用數據模型(common data modal),即對多元易構的數據進行抽提轉換標準化,通過統計分析的方法,整合相關數據結果或原始數據總和來回答問題。
藥品安全性主動監測需要采集三組數據元素:一組是要研究的暴露(藥物),如中藥、西藥、疫苗、生物制品等;第二組元素是用藥后結局:安全有效或安全性不良事件/不良反應。研究暴露和結局不能直接看兩者關系,尤其是觀察性研究,有大量的復雜因素,很難判斷是合并用藥還是基礎疾病或本身遺傳特質帶來的影響,因此還要收集第三組元素,就是協變量。
通用數據模型是什么?無論是電子病歷還是醫保數據,把這些相關的數據元素抓取出來,將數據進行結構化標準化,就可以按照統一的方法進行相應的統計分析模式。比如QT 間期延長綜合征是心臟傳導阻滯的標志,可能由藥物的心血管毒性導致,就可以到每個數據庫里給個指令,對數據庫里QT間期延長、心電圖ST段抬高,肝臟損傷的數據實現快速識別。再查找醫院里使用了阿奇霉素的患者群和這些患者中出現QT間期延長的數據,就能得到不良反應的發生率。考慮到可能存在不使用阿奇霉素也發生QT間期延長的情況,需要觀察對照組。數據庫里可以快速找到對照組,比如將未使用阿奇霉素的患者群或使用其他藥物的患者群作為對照。有了對照就可以控制混雜進行藥物危險度分析。最新的大數據分析技術不僅能回顧性使用數據,隨著藥物和監測病例的數據不斷進入數據庫,還可開展前瞻性隊列研究;不限于回答安全性問題,還能回答藥物經濟學和真實世界的療效問題。
目前我國是否建立了相關的數據庫來開展藥品主動監測研究?詹思延團隊用了兩年的時間,完成了對我國典型數據庫和5%抽樣的醫保數據庫的調研和試用,其中也包括中醫電子病歷數據庫。通過對以上數據庫的調研,按照通用數據模型的表單構建進行案例分析,得出的結論是,基于我國現有的集成數據源,可以開展藥品主動監測和藥物流行病學研究。然而,開展主動監測和藥物流行病學調查并不等于必然能達到預期的結果,是否還存在一些挑戰?首先,電子病歷數據庫最大的問題在于如何實現標準化和結構化。先看標準化問題。比如,詹思延團隊2014年國家自然科學基金的一項研究,是關于耐多藥肺結核主動監測通用數據模型構建,5省8家醫院數據庫都存在不一致的問題(如吡嗪酰胺有十幾種寫法等)。再看數據結構化處理的問題。比如肝臟損傷的不良反應不僅要觀察轉氨酶、膽紅素指標,還需要病程記錄、電子病歷里很多其他數據。但文本沒有實現結構化就無法使用。針對這一問題,詹思延團隊與北大合作進行文本挖掘機器學習,建立了文本識別和結構化處理的一套規則。目前我國腫瘤、腎病、內分泌等學科都在開展通用數據模型的研究。
其次,城鎮醫保數據庫還存在一定的局限性。當前我國有兩大城鎮醫保數據庫,一個是7億人群醫保數據庫,詹思延團隊正在使用該數據庫進行罕見病發生率研究;第二個數據庫是基于5%抽樣的數據庫,涵蓋了十分詳細的就診信息。即所有醫保患者每年在所有醫療機構的就診信息。這兩大數據庫的局限性是缺乏結局數據,比如服藥后的結果無法追蹤。患者做了哪些檢查和相關費用都有記錄,但沒有檢測結果。正如上述所列出的藥品安全性主動監測需要采集三組數據元素,數據庫里有暴露信息,但缺乏結局信息,包含了部分協變量信息但不完整。在這種情況下能否進行藥品安全性主動監測?答案是可以通過統計學方法進行主動監測。同樣以肝損害為例,醫師給患者開了心血管疾病用藥處方,這個藥可能會導致肝功能異常,但大部分醫師肯定會相應開出保肝藥的處方,因此在醫保數據庫里雖然看不到轉氨酶指標改變和醫師開具肝損害的診斷,但如果在某個藥物后發現保肝藥的處方比之前明顯增加,就代表有肝損害的警戒信息。這種方法就是處方序列分析和處方序列對稱分析,通過借助這種統計學分析方法可以發現肝損害警戒信息。詹思延團隊在北京市科委的支持下,針對心血管系統的常用藥物進行了主動監測。比如,針對他汀類藥物肝臟安全性研究,在數據庫里能否發現這些肝損害信息?可基于現有的、完備的處方記錄數據庫,通過檢索、查找參考文獻和引文、咨詢方法學專家,對處方序列分析及處方序列對稱分析,了解其引起肝功能異常的數據,根據藥物的次序、頻率分布來得出藥物與不良事件是否存在關聯。詹思延團隊的碩士生已經完成了這項工作,通過數據庫的處方序列分析,發現在他汀類藥物使用后保肝藥處方明顯增多。然而僅依靠這樣一個已知事實的驗證遠遠不夠,因此詹思延團隊的一名博士生又針對上百種對照病例進行了系統研究,目前博士生論文還在整理中。總之,醫保數據庫最大的優點是基于真實世界的數據,每個參保者一年的數據累積量和總體樣本量極大,有助于發現藥品安全警戒信號,缺點是變量太少,不能提供直接證據。
第三,區域醫療數據庫缺乏全國代表性。目前國內最成熟的區域醫療數據庫(寧波鄞州衛生信息平臺)囊括了3家綜合性醫院,24家社區衛生服務中心,285家社區衛生服務站。平臺自2008年起戶籍人口電子檔案累計建檔122.2萬(98.19%),6358萬條門診就診記錄,47萬條住院登記記錄;每日新增門診就診記錄2.8萬條,住院平均日登記209條。平臺整合了1000多張表格,4億多條數據。詹思延團隊使用這一平臺進行了致癌致畸藥物的研究——育齡期婦女禁用利巴韋林,但是否做到了?鄞州區門診利巴韋林注射劑18歲至44歲育齡使用者用藥情況分析結論是,妊娠診斷記錄前后6個月有利巴韋林注射劑處方記錄617例,占0.33%。幾年來,借助這一數據庫還完成了縱向隊列研究,如中藥區域性肝損傷的發生率研究。區域性醫療數據平臺的優點是,適合常見病和常用藥品的研究,社區里30%~40%的人群均存在血壓、血糖、血脂“三高”問題,可進行多種健康數據、多暴露、長隨訪、多結局的藥品監測調查,但缺點是區域性數據庫缺乏全國代表性,對罕見病、非常用藥物的研究難以開展。
藥品不良反應(ADR)信號能否被獨立發現?詹思延團隊采用了職業衛生統計的調查方法,建立樹狀掃描統計量開展ADR信號發現研究。2003年由美國首次提出并于2013年用于ADR研究。這一方法適用于縱向數據,采用在區域醫療平臺上進行信號掃描的方法,同時檢測大量的ADR,并調整多重檢驗的問題,從而發現藥品不良反應信號。與一些傳統檢測方法相比,ADR信號發現系統具有較好的特異性,由于是隊列研究,觀察期可長達8 ~ 10年;且可發現和檢驗信號。國際上有研究者指出,他汀類藥物可能引起新發的2型糖尿病增加。為研究這兩者的關聯是否成立,詹思延團隊在鄞州區域醫療數據平臺開展了一項回顧性隊列研究,從9萬多例患者中篩選出7萬多例新用藥的非糖尿病患者,將其中2萬多例使用他汀類藥物的患者和5萬多例非他汀類藥物的患者隨機分為兩組,隨訪6年觀察其2型糖尿病發生率。結果顯示,他汀使用組是28‰,非他汀使用組16‰,差異具有統計學意義。隨后采用傾向評分技術等各種偏倚調整模型,得出他汀類藥物使用與2型糖尿病相關的一致性結論,各種亞組分析也得出同樣的結論。這是國內首次通過大數據平臺實現了藥品安全性監測的隊列研究,相關文章已于2018年7月發表。綜上所述,現有集成性的數據源可以支持開展藥品主動監測,數據庫如何鏈接、如何更好的學習各種數據庫,嘗試開發罕見病和非常用藥品研究的用途,是下一步需要解決的問題。
詹思延教授最后指出,2017年起,北京大學公共衛生學院開開始搭建中國隊列共享平臺,提供標準化數據模型和統計分析。目前平臺上已覆蓋了包括藥品安全性研究在內的30多個國內大型的隊列研究,呼吁更多隊列研究加入平臺,展示優質數據資源,擴大國際影響,未來這一平臺將不斷促進各隊列研究之間的合作共贏,打造一流的國際合作研究平臺。