馮 碩,劉文佳,胡 晶,張會娜,李 博*
(1 首都醫科大學附屬北京中醫醫院,北京 100010;2 北京市中醫研究所,北京 100010;3 山東中醫藥大學附屬醫院,濟南 255014)
藥品安全性評價可追溯至1961年歐洲的反應停事件,這一藥品在缺乏安全性評價的情況下流通6年,從而導致了成千上萬的海豹肢畸形。人們由此認識到了藥品不良反應監測和報告的重要性,推動了這一領域研究方法的形成和發展。
藥品安全性評價的重點在于,利用收集的不良事件和不良反應相關信息判斷藥品與可疑不良反應之間的因果關系。這一過程涉及諸多研究類型、信息收集方法和評價技術。
通常情況下,藥品在上市前已開展有效性和安全性評價的臨床試驗。然而臨床試驗僅針對可能出現的用藥風險譜有一定的驗證作用[1]。盡管隨機對照試驗位于證據等級金字塔的頂端,被視為療效評價的金標準,但在安全性評價方面,由于其實施難度和潛在的倫理學影響,又因其樣本代表性受限的特點[2],所以無法反映藥品真實的不良反應發生率和歸因危險。
從群體事件的角度,臨床試驗在統計分析時多使用差異性檢驗和點估計,即有差異的概率與P=0.05這一數值相比較。然而,在事件本身發生率特別低的情況下,有限的樣本量很難得出有統計學差異的檢驗結果,從而容易得出假陰性結果。對受試者個體而言,臨床試驗收集到的用藥背景信息和不良事件發生相關的信息不容易完整,評價不良反應的發生和藥品之間的因果關系有一定的困難。
因此,藥品安全性評價更多依賴真實世界的信息收集和上市后的臨床安全性評價。實際操作中,判斷某個藥品與特定不良反應的發生是否構成因果關系主要涉及可疑不良反應信息的收集和藥品不良反應因果關系的判斷。此外,一些數據挖掘算法可以對藥品不良反應起到提示作用。
英國于1964年“反應停”事件后率先實行自發呈報制度[3],以黃卡形式上報。然而黃卡的上報率僅為5%,大量的數據缺失限制了藥品安全性評價的實施[4]。英國政府于2014 年又發起了“不良事件報告倡議計劃”,倡導患者主動配合上報[5]。美國于1993年制定了Med Watch制度,其結合了互聯網的優勢,也使報告制度的教育得到普及[6]。目前全球覆蓋面最廣的自發呈報系統是WHO于1978年成立的全球藥物警戒監測中心(Uppsala Monitoring Centre,UMC),總部位于瑞典烏普薩拉,迄今已有150余個成員國加入,擁有全球最龐大的化學藥物不良反應數據庫[7-8]。
我國從1998年起成為了WHO藥物監測體系的成員國,國家藥品監督管理局下設的藥品不良反應監測中心建立了不良反應監測系統,負責收集相關的信息,成員國可以郵件、傳真等形式定期向UMC報告本國不良反應數據。近年來,開發的移動客戶端APP也可協助上報信息[9]。然而,自發呈報系統有賴于藥品上市許可的持有人主動上報,對此并未施行強制要求,因此常存在漏報現象[10-11]。此外,由于繁忙的臨床工作和填報信息復雜或意識缺乏,醫生和藥師的主動上報率較低[12-13]。僅僅依靠自發呈報系統并不能滿足藥品安全性評價的需求。
醫院集中監測法始于1969年,當時Hurwitz和Wade在BMJ雜志發表了一項關于1268例精神病患者的藥物不良反應監測研究[14]。醫院集中監測要求在一定時間和范圍內對某一家醫院或某一地區(可以是多家醫院和地區)使用某種藥物的用藥信息和不良事件進行詳細記錄,在此基礎上判定不良反應,探討藥品不良反應的發生規律。
與自發呈報相比,醫院集中監測以監測人群作為觀察隊列,因此有分母,能夠計算事件發生率。通過在大樣本人群中對某個產品進行監測,對產品的安全性有較為全面的認識,所得到的數據能反映不良反應發生率。該方法尤其針對上市后的藥品,有利于發現未知的或非預期的不良反應,可彌補上市前研究的局限性。我國在2009年由原國家食品藥品監督管理總局發布了“關于開展中藥注射劑安全性再評價工作的通知”,中成藥及注射劑的上市后集中監測已成為趨勢[15]。目前可以檢索到我國已開展的包含上萬例用藥者的真實世界中的不良反應監測研究[16-17]。
然而醫院集中監測法需經過嚴格的設計,實際操作中工作內容較多。為使樣本具有足夠的代表性,可能需要多家醫院的多個科室共同完成;同時需要有便捷的數據管理系統來承載相應的信息收集,如EDC系統;也需要專門的研究人員負責跟蹤和記錄,藥品使用情況和患者信息均需要詳細登記;對于慢性不良反應和罕見事件的發生,可能需要較長的觀察周期。盡管此種方法全面而規范,但需要耗費一定的人力財力和物力。
個體水平的不良反應評價主要針對特定不良事件,即可疑不良反應和藥品之間的因果關系判斷。群體水平主要涉及不良反應的信號挖掘。
因果關系判斷方法多針對單個病例,主要評價藥品導致該不良反應的可能性。在評價時一般需要逐個案例進行分析。其大致可以歸納為全面內省法和計分推算法。
全面內省法主要依靠專家的個人知識和經驗進行。專家需要綜合考慮各種相關因素,然后做出藥物與可疑不良反應之間的因果關系判斷,此過程類似于根據患者癥狀和體征做出的臨床診斷[18-20]。全面內省法并非一類標準化和定量化的方法,受主觀因素的影響,不同專家的意見可能存在較大的差距,而且可重復性差,限制了其內部一致性和外部一致性,因此不利于推廣使用。
相較于全面內省法,計分推算法是一種可重復性較強的方法。目前已有不少于20種的計分推算法[21],其中最為常用的包括Naranjo APS評分法及烏普薩拉評分法等,后者是世界衛生組織全球藥物警戒監測中心所倡議的評分方法[22]。計分推算法主要對藥物和事件之間的關聯性強度給出評分,在應用時,對可疑的不良反應根據表格中不同條目的分值計算總分,以評定不良反應與藥物間的因果關系強度。然而各類計分推算法的判斷結果也存在一定差異[23-24],并且針對不同條目之間的權重也存有爭議[25]。
基于大數據和數理統計的信號挖掘算法是一種有效的、新穎的和逐漸被接受的不良反應監測方法,能發現隱藏在數據中的不良反應發生規律。信號挖掘算法的應用環境可以是自發呈報系統的數據庫。隨著數據挖掘技術的發展和電子化病歷管理系統的應用,信號挖掘算法逐漸普及到一些電子醫療數據庫[26]。信號挖掘算法是利用一些數學模型,從數據庫中對現有的報告病例進行挖掘,作為信號提示,以便進一步分析不良反應與其他因素之間的關系。
傳統信號挖掘算法包括頻數法、回歸法等。其中頻數法計算簡單,但假陽性率較高,容易受到噪音干擾[27-29]。在此基礎上結合貝葉斯理論派生出了一些新的算法。傳統的信號挖掘算法主要以概率論為基礎,而貝葉斯邏輯學可用來解釋因果關系判定中的不確定性問題,根據背景統計信息計算出藥品與不良反應因果關系成立的可能性[30],具體包括貝葉斯可信遞進神經網絡法、伽馬-泊松縮量估計法、歐米伽收縮測量法、機器學習法等[29,31],其中貝葉斯可信遞進神經網絡法能計算出藥品引發不良反應的信息成分[32],被烏普薩拉藥物警戒中心所采用。
近年來針對大型電子醫療數據庫,又衍生出一些新的信號挖掘方法。一般多用于上市后藥品的具體評價。在應用各種方法時需要考慮方法的可行性和數據資料的可利用性。處方序列對稱分析(prescription sequence symmetry analysis)多針對有詳細用藥記錄的醫療信息管理系統的數據,通過評價用藥前和用藥后事件(通常為不良事件或標簽藥物)分布的對稱性,來評價藥物與不良事件是否存在關聯[33]。傾向評分匹配樹狀掃描統計量 (propensity score matched tree-based scan statistic)方法多針對縱向數據,可以將不良事件按類別和發展程度進行等級劃分,在經過傾向評分匹配調整混雜因素后,估算可疑不良反應的發生率[34],從而形成多層級不良反應分類樹形圖。時間關聯規則(temporal association rules)主要用于對一些無法提前預期的可疑不良反應進行預警,該分析方法主要根據因果關系的時序性進行信號挖掘,并用統計分析方法過濾掉一部分假陽性信號,對在醫療管理數據庫中發現新的不良反應有一定的潛力[35]。
我國在中藥安全性評價方面尚處于起步階段。截至目前,在中國知網中,以“中醫”和“中藥”為主題詞,同時以“不良反應”為支持基金檢索詞進行檢索,可以檢索到14篇文獻;同時檢索“不良反應”和“安全性”共可以檢索到28篇文獻。其中包括部分中成藥品種尤其是注射劑的上市后安全性醫院集中監測研究,以及部分來自自發呈報系統的信號監測。中成藥的不良反應報告和監測大致可以按照化學藥物的研究方法進行,但針對復方,尤其是諸多飲片構成的中醫處方的安全性評價仍然面臨方法上的挑戰。
由于中藥多為復方制劑,一次用藥多包含數十種藥材及眾多的化合物成分,而藥物警戒系統中一般的數據挖掘方法則針對的是單一藥物。復方中可能存在配伍減毒、炮制減毒等影響因素;復方的不良反應監測方法的穩定性受疾病特征、性別、年齡、耐藥性等因素的影響[36-37]。鑒于以上影響因素眾多,傳統方法很難計算處方中某一味藥材與不良反應的因果關系程度。在這一領域,未來有待開發高維的統計分析模型來解決這些障礙,進行方法學的探索。
在美國,正是由于不良反應受害者的強烈呼吁和要求,促成了廠家對安全性問題的重視[38]。美國從2007年起立法要求藥品的上市后安全性再評價工作。而我國的不良反應監測制度還應進一步完善,尤其在主動監測和中藥不良反應評價方法上與美國相比還有一定的差距。在政府加強監管力度的情況下,還有待于從法律和法規層面促使企業加大對藥品上市后安全性再評價工作的投入[39-40],建立適合我國國情的用藥安全性保障體系。