袁 冰
目前,國際流行的疾病分類系統(international classification of diseases,ICD)是依據疾病的病因、部位、病理及臨床表現4個分類軸心建立的多軸心系統。長期以來,現代醫學對治療方法的臨床試驗及療效評價基本上是以這個體系界定的疾病為基礎的。
近年來,隨著自然療法、傳統醫學以補充和替代醫學的方式得到現代醫學有限度的承認,隨著循證醫學的理念得到廣泛的認可,滿足可重復性的實證成為將醫學經驗和治療方法納入現代醫學體系的充分條件。自然療法、傳統醫學中一些有明顯效果和實用意義的治療方法和經驗被接納,充實進以疾病醫學為核心的現代醫學的治療體系;一些反映這些療法、經驗特點的要素和規則,也逐漸被納入臨床評價體系。而進入21世紀以來,為了適應創新藥物的發展,加速新藥推出的速度,降低研發和臨床評價的成本,美國食品藥品監督管理局(Food and Drug Administration,FDA)更是在臨床試驗方法和藥品評價方面推出了一系列改革舉措。
以個性化為特征的精準醫學的興起,不可避免會觸碰基于疾病醫學理念建立的臨床評價體系。為了支持創新型醫學和相關藥物研發,美國FDA出臺的舉措以及由此引發的一系列事件,引起了醫學界的廣泛關注:(1)為了加快精準醫學相關的藥物審批,FDA將創新性臨床試驗分成兩大類,第一類稱為籃子試驗(basket trial),就是將帶有相同靶基因的不同癌癥放進一個籃子里進行研究,以促進應對帶有相同靶基因的不同來源的腫瘤的藥物研發。第二類稱為雨傘試驗(umbrella trial),即把具有不同靶基因的同一疾病(如肺癌),攏聚在同一把雨傘之下,促進針對帶有不同靶基因的同一來源的腫瘤的標靶藥物的研發[1]。(2)2017年5月,具有里程碑的意義,FDA首次批準了不依照腫瘤來源,而是依照生物標志物進行區分的抗腫瘤藥物的適應癥。默沙東(Merck Sharp & Dohme,MSD)的一款新藥KEYTRUDA(pembrolizumab)獲批治療帶有微衛星不穩定性高(microsatellite instability-high,MSI-H)或錯配修復缺陷(mismatch repair deficient,dMMR)的更多類型的實體瘤患者。此前,FDA一直基于癌癥在體內的起源部位(如肺癌或乳腺癌)而進行癌癥療法的審批。MSI-H與dMMR是兩種常見的遺傳異常,含有這兩種變異的腫瘤,細胞內的DNA修復機制往往會受到影響,不能正常發揮作用。帶有這些異常的腫瘤分布非常廣泛,可出現在結直腸、子宮內膜、胃腸道、乳腺、前列腺、膀胱、甲狀腺等多個部位。因此,通過遺傳變異特征而非病發部位來區分這些癌癥,對于治療有著更好的指導意義。這一點在臨床試驗過程中得到了證實。但如果基于之前的臨床評價體系,這種藥物很難統計出臨床意義[2]。這個成果得以獲批,正是源于針對該藥物的“籃子試驗”。(3)2018年11月,FDA批準了首個“籃子試驗”:涉及攜帶原肌球蛋白受體激酶(tropomyosin receptor kinase,TRK)基因融合突變的小分子抑制劑Larotrectinib,用于治療患有與神經營養性酪氨酸激酶(neurotrophic tropomyosin-related kinase,NTRK)基因融合的成人和兒童實體瘤患者。根據Larotrectinib一項臨床試驗的全球研究負責人David Hyman博士的介紹,“NTRK基因融合是一種罕見的癌癥驅動因子,FDA批準Larotrectinib對于此類腫瘤的治療是一個重要的里程碑”。它是“首個獲批的針對這種基因改變且與腫瘤類型無關的治療藥物”[3]。Larotrectinib在臨床試驗納入的所有55例患者中總體有效率達到78%,完全緩解率13%,部分緩解率64%;這些患者涉及到13種不同的實體瘤類型,包括肺癌、甲狀腺癌、黑色素瘤、胃腸道間質瘤、結腸癌、軟組織肉瘤、涎腺腫瘤和嬰兒纖維肉瘤等,但都有一個共同的標靶分子——TRK基因的融合[4]。
FDA之所以會對一直實行的臨床評價體系做出改變,是以精準醫學的研究進展為依據的:(1)僅基于腫瘤來源的疾病分類和在此基礎上的進一步分型,通常不足以準確界定藥物的適用范圍。增加基于基因、蛋白質、代謝物等生物標志物描述的個性化特征,會大大提升藥物選擇性的精準度。這恰恰是精準醫學興起的原因。(2)用來標定患者某種個性化特征的有時不是單一的生物標志物,很多情況下會是多個生物標志物指標的組合。(3)這些生物標志物異常標定的靶點通常不止關聯于一種特定的疾病,可能會與多種疾病相關,如與MSI-H與dMMR兩種遺傳異常相關聯的腫瘤可出現在多個部位。
這些研究進展顯示,精準醫學用于標定靶點的生物標志物,其意義或許并不局限于對現代醫學的傳統疾病分類更加細致的區分和精準化。它們與疾病的關系在很多情況下,是一種多對多的網絡關系。也就是說,隨著精準醫學研究的進展,新的靶點和標靶藥物不斷被發現,在現代醫學架構下將會出現一個與傳統疾病分類不同的新的疾病分類和治療體系。這是一個以生物標志物定義的靶點和標靶藥物體系,它將是一個與傳統疾病分類體系并列的獨立的體系。由此,現代醫學將進入辨病治療與辨“靶點”治療相結合的時代。
今天,雖然以隨機雙盲對照為特征的大規模臨床試驗依然是檢驗治療方法安全有效性的金標準,但由于以往基于這種貌似嚴謹科學的試驗發展的藥物,在應用于臨床一段時間之后,常常會發現一些遠期的副作用,嚴重的甚至會導致藥物的淘汰或禁用。于是越來越多的人開始對這種臨床試驗結果的可靠性產生質疑。此外,這種臨床試驗的經濟性和合理性也受到越來越多的詬病。病人團體聲稱大規模的臨床試驗耗時費力,而且會拖延可能挽救生命的突破性藥物進入市場的速度。激進的市場化政策推動者倡導以“市場決定”的模式代替FDA的審批,宣稱只要藥品的安全性得到保證,不管有效性存在與否,都應該被許可在市場上銷售,因為市場競爭和理性的消費者會讓真正性價比高的藥物自然勝出[5]。
在這樣的大背景下,真實世界證據(real-world evidence,RWE)越來越引起人們的關注。2016年12月美國頒布《21世紀治愈法案》[6],要求FDA在醫療產品審批和監管程序中納入RWE。2018年12月6日,FDA重磅宣布《真實世界證據方案框架》,為實現RWE支持藥品審批決策的目標提供了一個相對清晰的路線圖。真實世界研究是指研究數據來自真實的醫療環境,反映實際診療過程和真實條件下的患者健康狀況的研究。真實世界數據(real world data,RWD)是通過多種途徑獲得的與患者健康狀態和醫療行為相關的數據。RWE是通過分析RWD產生的與醫療產品的使用及潛在獲益或風險相關的臨床研究證據[7]。RWD來源非常廣泛,可以是患者在門診、住院、檢查、手術、藥房、可穿戴設備、社交媒體等多種渠道產生的海量數據。數據類型可以是研究數據,如基于特定研究目的患者調查、電子病歷,以及基于真實醫療條件開展的干預性研究(如實效性隨機對照試驗)的數據;也可是非研究數據,如醫院、醫保部門、民政部門、公共衛生部門的日常監測記錄、儲存的各類與健康相關的數據,如醫院電子病歷、醫保理賠數據庫、公共衛生調查與公共健康監測(如藥品不良事件監測)、出生/死亡登記項目等[8]。
為了對藥品上市后安全性進行有效的監測和評價,需要大量貼近臨床實際的研究結果以及更貼近自然環境的流行病學數據。FDA自2008年起,開始建立全國范圍內的藥品安全性監測電子系統。該系統通過在數據庫中主動檢索和整合相關信息,實現了對醫療產品上市后安全性的實時動態監測。2018年8月時,該系統已與全美18家機構建立合作關系,涵蓋上億患者信息。目前FDA正在考慮能否利用這一系統,在藥品批準上市前開展真實世界研究,指導藥品安全性決策[6]。
作為最高等級的臨床證據標準,傳統的臨床隨機對照試驗(randomized controlled trial,RCT)需要嚴格控制試驗條件,在可能有效的目標人群中進行標準化治療,樣本量小,隨訪時間短。而真實世界研究可以納入復雜的、患有多種疾病的患者;可以非隨機的方式分配治療;可以在治療中根據患者的需求和臨床醫師治療策略的變化,同時采用多種措施;允許臨床醫師根據病情和患者的全身狀況而不是按照計劃書確定劑量,從而精確地滿足患者的需要;可以設定更長的研究期限以測試干預措施的遠期效果和風險;可以包括更寬泛的指標,如功效指標、患者結局報告、成本效益指標等,使研究證據有更強的外推性,更具臨床實用價值[7]。
傳統臨床試驗往往是前瞻性的,真實世界研究大多數是回顧性的隊列研究和病例對照研究;傳統臨床試驗耗時費力,臨床試驗流程繁瑣,涉及巨大的藥品和人員開支。相對地,真實世界研究可以通過較小的成本取得具有與臨床試驗同樣價值的信息[5]。藥物上市后,真實世界研究可以通過前瞻性/回顧性研究跟蹤藥物在真實世界中的長期安全性、有效性及患者依從性;也可以通過將更復雜的、患有多種疾病的患者分成不同的亞組,研究藥物在不同亞組人群的效果差異[7]。目前,FDA已經開始在腫瘤和某些罕見病領域,利用RWE參與評價藥品的有效性[9]。
目前,真實世界研究與臨床試驗有殊途同歸的趨勢。一方面,臨床試驗強調納入多樣化人群,提高試驗結果在真實場景的準確性。盡管可能因為病人的多樣性導致試驗結果準確性降低,但是卻保證了試驗結果的可外推性,即外部有效性。另一方面,是實用試驗的興起,臨床試驗盡可能模擬真實治療的場景,用較少的約束條件觀察大樣本病人對某些治療方法的療效和安全性。在這種減少干預情況下獲得臨床研究數據具有可接受性強、成本較低、操作靈活等優點,得到了越來越廣泛的應用。
與此同時,真實世界研究的方法也在實踐中得到不斷改進和完善。相比RCT,之前的回顧性研究無法從根本上解決試驗組和對照組可比性較差的問題。如今的真實世界研究會像傳統臨床試驗一樣,將分析計劃提前確定下來,最大程度地減少選擇性報告帶來的偏差。此外,真實世界研究也在進行著方法學的創新,更好地使用在現實生活中不斷產生的海量數據。大數據、機器學習、人工智能等技術,已被廣泛用于回顧性研究的方法學創新當中[7]。
2018年的美國臨床腫瘤學會(American Society of Clinical Oncology,ASCO)會議披露,CancerLinQ將與FDA合作,考察各種新批準的抗腫瘤藥在真實人群中的可靠性。該公司搜集全美不同類型腫瘤診所的真實病人數據,使用創新性大數據引導個性化的新藥研發,幫助FDA進行新藥批準的決策。并且,海量數據能夠更快核實罕見的藥品不良反應,有助于實時監督藥品的安全性。也許,CancerLinQ為整合臨床試驗和真實世界研究所做的,正是藥品評價體系未來的發展方向[10]。
隨著時間的推移,真實世界研究和臨床試驗不斷從對方汲取有益的成分以減少自身的缺陷,兩者的界限會變得更加不明顯。正如美國FDA腫瘤資深專家Sean Khozin醫生在ASCO年會上所說的那樣:“我們需要跨越隨機對照試驗的限制,使用真實世界數據來指導醫療系統改革和衛生政策的制定?!盵5]
今天,站在真實世界研究的角度看,“百年神藥”阿司匹林的前世今生,不就是一個正在進行并將會一直做下去的真實世界研究嗎?見圖1。

圖1 阿司匹林的前世今生
今天,精準醫學從零開始,啟動了構建個性化醫學體系的漫漫征程。卻不知,中國人的祖先,凝聚幾千年的智慧,經過了難以計數的人體試驗,給今天的世界留下了一個相當完備的個性化醫學體系。精準醫學的研究,目前還局限于以基因變異為主的生物標志物,短期目標是應對腫瘤。其對能個性化地描述人體狀態的生物標志物的研究,尚待拓展到蛋白質、代謝物以至更廣泛的領域。面對目前已有超過30 000種的疾病分類體系,對腫瘤的探索,只能說是漫漫長路邁出了第一步。而即使有一天搞清楚了這30 000種疾病,開發出了針對每種疾病的精準藥物,人們還要面對多種疾病同時出現時,治療方法的整合問題。屆時,能把針對這一個個疾病研究的帶有副作用的精準藥物同時應用在一個病人身上嗎?
現代醫學進入精準醫學時代,是近現代醫學沿著器官-組織-細胞-分子的次序,對生命研究逐步走向縱深的必然結果。分子是已知具有生命特征的最小組分。分子生物學的建立及發展,標志著向縱深的方向生命科學已經走到了盡頭。分子生物學、細胞生物學和精準醫學目前正在進行的是在分子和細胞層面的橫向拓展。然而今天,越來越多的生物學家、醫學家意識到,生命不能歸結為組成生命的分子與分子、細胞與細胞之間的相互作用,要了解生命的整體特性,要從整體上把控生命,生物學、醫學一定要走向整合。近年來,系統生物學的興起以及醫學領域整合呼聲日甚,無疑反映了生命科學和醫學發展的這種大趨勢。
然而,我們能在微觀分析基礎上實現整體綜合嗎?生命科學和醫學作為自然科學的應用領域,近幾百年來,一直是由自然科學方法和技術的進步驅動的。近幾十年來,自然科學一方面沿著分子、原子、基本粒子的方向把人類對自然規律的揭示引入更加微觀的層面;另一方面隨著科學方法的進化,已開始直面復雜性,不再把宇宙、地球、生態、人體、人腦這樣的復雜系統的問題歸結為簡單系統的問題,用簡單科學的方法去處理。
復雜性科學的進展,引發了科學觀念和思維方式的根本變革。復雜性科學推出的最重要的概念就是“涌現”。由于復雜系統“涌現”現象的存在,從微觀層次的組成及其行為規則不可能演繹推導出系統整體的宏觀結構或性質。也就是說,從整體通過分析走向微觀層次可以,但基于分析的結果走向整合卻不行。由此宣告了現代醫學試圖通過“分析-重構”的方式,在分析基礎上實現整合,最終從整體上把握人體的道路是行不通的。系統生物學迄今為止的研究現狀也對此提供了佐證。
20世紀七八十年代采用系統科學早期的“分析-重構”理念建立的系統生物學,對生物體進行的整合研究目前已跨過30多個年頭。然而,它展示給人們的不是整合起來的美妙前景,而是面對生命復雜性科學家的無奈:生物體系統的復雜程度遠超乎人們的想象, 現階段不宜研究整個生物體系統,只能從研究具有一定功能、相對獨立的“小系統”開始[11]。而面對生物體的適應性,系統生物學家更是一籌莫展:可重復性是自然科學研究的基本原則,然而,由于生物體的適應性,當科學家依據實驗科學視為天經地義的“可重復”理念,對生物體出現的某些現象及對某些刺激(或藥物)的反應進行重復試驗時,試驗結果嚴格意義上的重現性反而常常成了“奢侈”的要求。適應性是生物體與生俱來的特征,是科學無法改變的客觀存在。因此,問題只能出在我們研究它的方法,也就是說,系統生物學目前采用的研究方法可能本質上不適于研究具有復雜適應性的生命[12]。
如今,復雜性科學研究已經走過了它的早期階段。隨著“涌現”現象及規律的發現,隨著“分析-重構”方法在復雜系統整合實踐中屢屢碰壁,科學家不得不另辟蹊徑:既然復雜系統不能通過分析基礎上重構的方法去認識、去把控,那就只能把它作為一個整體,從對整體的輸入輸出的考察中,通過模擬仿真的方法建立它的模型,認識它的內在規律,并基于模型實現對它的整體調控。
今天,當我們站在復雜性科學的制高點,看待具有幾千年歷史的中醫時,發現它的理論體系的建立,它的狀態描述與調控方式,與復雜性科學的整體方法如出一轍。中醫學從整體層面建立個性化的狀態描述;而精準醫學建立的個性化狀態描述則是從分子層面開始?,F代醫學意識到了疾病醫學的局限,開始建立個性化的狀態描述,這無疑是醫學的巨大進步。但在微觀層面建立個性化的狀態描述,一定會面臨著需要整合到整體而又難以整合的問題。而中醫學直接從整體層面建立個性化狀態描述,不存在從微觀層面整合到整體的過程。
中醫學用于描述形形色色的個性化狀態,只有大約100個狀態變量(中醫學稱之為證候)。而精準醫學在微觀層面建立狀態描述,根據遺傳學研究的最新進展,僅人類基因(包括編碼和非編碼基因)的數量已達到約40 000個[13],遺傳突變的數量更遠大于此。而且,隨著蛋白質、代謝物組學研究的進展,發現的生物標志物異常會達到更大的規模。顯然,基于生物標志物的精準醫學狀態描述系統中狀態變量的數量會遠遠超過中醫學的規模。
近幾十年來,采用現代分析方法對中醫證候的研究表明,與中醫學的一種證候關聯,在人體實體的微觀層面通常會體現為多個生物標志物的異常,如中醫辨證有腎陽虛的患者,24小時尿17羥皮質類固醇含量普遍低于正常[14],三碘甲狀腺原氨酸(triiodothyonine,T3)、四碘甲狀腺原氨酸(tetraiodothyronine,thyroxine,T4)、血清促甲狀腺激素(thyroid stimulating hormone,TSH)(甲狀腺軸)、睪丸酮(testosterone,T)、雌二醇(estradiol,E2)、卵泡刺激素(follicle-stimulating hormone,FSH)、促黃體生成素(luteotropic hormone,LH)測定亦比正常人低,TSH興奮試驗通常會出現延遲反應[15]。而針對證候的有效治療,也常常會伴隨著實體微觀層面多個發生異常的生物標志物的恢復。也就是說,通過補腎陽的方法,隨著腎陽虛證候的改善,上述異常的指標通常會向正常值回復。而反過來從人體實體的微觀層面著眼,卻不能指望通過對一個證候對應的多個異常的生物標志物的精準治療,從整體上能夠達成使證候回復正常的宏觀效果。也就是說,將分別具有提升腎皮質類固醇含量、T3、T4、TSH、T、E2、FSH、LH等指標的藥物一同服用,不能設想會整合出改善中醫腎陽虛證的穩定效果。原因在于:(1)在腎陽虛證候對應的眾多的異常生物標志物指標中,相關性較好的指標通常是在造成腎陽虛的因果關系鏈中靠近結果的環節??拷虻沫h節可能由于與腎陽虛的相關性不明顯,因此很難將它們找出來。而針對靠近結果的環節的治療,難免會“治標不治本”,難于產生長期穩定的效果。(2)精準藥物并不是只對作為靶點的生物標志物發揮作用,在人體也會有其他作用或副作用。多種這樣的“精準”藥物對人體的綜合效應,難以期待會整合出宏觀層面我們期待的效果。
基于整體層面建立狀態描述的中醫學,其藥物研究的受控量直接是整體層面的證候,因此,進行疾病調控不涉及從微觀到整體的整合。而在整體層面同時出現多個證候的整合,由于中醫學的證候總數僅數以百計,而且通過對各部分疾病重要性、危害性進行的治療次序的綜合分析,一個臨床治療方案中需要應對的證候總數在絕大多數情況下不會超過10個(通常會在5個以內),相比從微觀層面整合到整體的復雜性會有天壤之別。
當我們理清了精準醫學、系統生物學以及中醫學在生命科學框架下的結構關系,了解了精準醫學建立的個性化醫學體系與中醫學辨證論治體系的層次關系以及它們在醫學整合方面的作用和意義,就不難理解中醫學令人稱奇的臨床療效后面蘊含的深刻方法論。
今天,美國FDA對臨床試驗和療效評價體系的改革,為精準醫學從微觀層面建立個性化狀態描述敞開了大門,而精準醫學的興起也使得人類能夠從科學的角度理解中醫學在整體層面建立個性化狀態描述的更深刻的科學性與先進性。更重要的是,這個適合個性化醫學的臨床評價體系,同樣適合于整體層面個性化醫學體系——中醫學的臨床療效評價。而在現代醫學構建它的個性化醫學體系的同時,基于這個體系對中國傳統醫學的臨床評價,將同時開啟從現代醫學整合中國傳統醫學,從分析走向整體綜合的歷史進程。
以個性化為特征的精準醫學中蘊含的“同病異治”、“異病同治”的理念與中醫學辨證論治深刻的一致性,自然引起了中國醫學界的關注。美國FDA為推進個性化醫學發展而對藥物臨床試驗和療效評價體系的創新,也自然推進了中國對與辨證論治相關的中藥新藥臨床評價體系的改革。2018年11月6日,國家藥品監督管理局發布了《證候類中藥新藥臨床研究技術指導原則》(以下簡稱《指導原則》)[16],旨在為證候類中藥新藥臨床試驗的開展和有效性、安全性評價提供基礎性指導。證候類中藥新藥臨床研究的參照系可為單純的中醫證候,可為某一中醫疾病下的某一證候類型,亦可為某一中醫證候下至少3個不同西醫疾病類型?!吨笇г瓌t》的發布,意味著將中醫證候開始納入可通過傳統的前瞻性臨床試驗進行評價的范疇。
國家藥品監督管理局的這一舉措,顯然順應了醫學走向個性化需要對藥物臨床評價體系變革的大趨勢,是在美國FDA為加速創新藥物的臨床評價推出了“籃子試驗”和“雨傘試驗”模式后,對中藥臨床評價方法的有限度的“松綁”?!爸嗅t證統西醫病的研究模式”完全就是“籃子試驗”的中藥版本。此前,單純針對中醫證候的藥物,在現行藥品評價體系下無從進行業界認可的臨床試驗和療效評價,其有效性也自然得不到科學的證明。
在中國持續數十年,投入大量人力和財力進行的針對疾病的中藥新藥研究及其臨床評價,并沒有產生出多少療效超越傳統中藥的新藥品種,也看不到對中醫藥發展的實質推動作用。這種研究目前似乎走到了盡頭,2015年以來,中藥研發一直處于政策等待階段?!吨笇г瓌t》的出臺,似乎為中藥研發指出了新的方向,也為中成藥品種數量的增長提供了新的空間。然而,基于這個《指導原則》對證候類中藥新藥的開發,能切實推出一批療效超越傳統中藥的新藥品種,或對中醫藥的發展產生實質性的推動?還是像以往一樣,投入大量的人力、財力,主要是為取得一張能合法銷售的注冊批號?對此,業界似乎并不樂觀。究其原因,從對《指導原則》作為參照系的三種研究模式的實用價值分析可見端倪。
中醫學經過千百年的人體試驗,形成了完備的中藥學和方劑學體系,針對單純證候的配方,很容易由治療該證候的單味中藥組合出來,或從對應的方劑類別中篩選出來。很難指望投入大量人力、物力和財力,在短時間開發的新藥會比傳統的中藥、方劑有更好的臨床效果。
中醫學針對證候的藥物主要是用于辨證論治。臨床上經常需要根據患者實際出現的不同證候組合對處方進行加減變通。這種模式研發出來的針對單一中醫證候的藥物,可否像中醫的傳統方劑一樣,方便臨床根據辨證進行配方?如果能,如何考量它與其他藥物聯合使用的協同與拮抗?它與中醫傳統的針對這一證候的中藥、方劑相比有無性能和性價比的優勢?如果不能或者不方便,在傳統中藥、方劑已提供了眾多選擇的情況下,如此大的新藥研發投入,又有多大的實用價值?
目前中醫界尚未形成統一的證候辨識標準,對其療效的判定與臨床評價的公信力不足,而且臨床試驗很難找到僅單一證候成立的病例,對大量有不同兼證的患者,只對一個證候進行統計,療效評價的可靠性需要探討。此外,針對證候的中藥,通常要了解藥物方方面面的作用及偏性,僅就其針對單一證候的效果進行評價,對藥物整體性能的認識很難滿足中醫辨證論治的需要。
此外,“選擇符合某個中醫證候診斷標準的適應人群進行研究,觀察藥物對該中醫證候所涉及的癥狀、體征以及相關指標的改善情況”,限定此類新藥研究的參照系為單一中醫證候。針對證候組合(如氣血兩虛,氣滯、血瘀兼氣虛)的新藥研究是同步開放還是逐步開放尚待明確。此外,對證候組合的數量是否有限制?如果限制,有何依據?如果不限制,5個證候的組合,假設每種組合只研究一種新藥,這種模式能提供的批號數量已達到百億級。如此大的新藥研發空間,龐大的研發資金和人力投入,究竟有多大的實用價值,也值得深思。
針對某一疾病下的單一證候進行藥物研究,臨床試驗是以該疾病下的特定證候為參照系進行統計的。在中醫學中,與一種疾病相關的單一證候可能有數種,通常適用不同的藥物。而這數種證候的不同組合也可能適用不同的藥物。這就出現了一個問題:假定與某一疾病相關的證候有5種,分別研究出了5種不同的藥物。那么,當患有該疾病的患者同時出現其中4種證候時,是否需要將其中的4種藥物一起讓病人服用呢?如果不妥,是否針對這些單一證候的每一種組合要研究出一種藥物呢?這個組合數是3 905種。也就是說,要做到針對這種疾病下同時出現不超過4種證候的每一種證候組合有藥可醫,需要研究3 905種新藥。
這就是針對中醫證候的“籃子試驗”。美國的FDA推出“籃子試驗”是為了加速針對生物標志物的標靶藥物的審批。這些標靶藥物通常是針對該靶點沒有藥物或已有的藥物療效不理想?!盎@子試驗”目前主要用于以往被視為“不治之癥”的抗腫瘤藥物的臨床試驗和療效評價。而針對中醫證候的“籃子試驗”所針對的證候,目前已有大量的傳統中藥或方劑可選。臨床試驗需要“在同一證候下選擇至少3個不同西醫疾病來進行研究”意味著不少于3倍的病例數,研發和臨床評價所需成本相對于新藥的實用價值遠不能與抗腫瘤的標靶藥物相比,如此的投入產出比對開發者會有多大的動力?
無疑,國家藥品監督管理局推出的新舉措符合中醫的特色,也順應了藥物臨床評價體系改革的趨勢。但這種有限的改良仍然沒有跳出疾病醫學和RCT的框框,與中醫臨床應用的“真實世界”相距甚遠。古往今來,中醫對數千種中藥和難以數計的方劑作用的認識和療效評價,是基于長期的“真實世界研究”的,就像現代醫學之于“百年神藥”阿司匹林一樣。只是科學方法和技術水平的限制,達不到現代醫學基于實證對阿司匹林臨床研究的嚴謹性。
應當看到,西藥以化學合成、生物制劑、有效成份提取為主要來源,研究參照系多為單一的特定靶點,用于人體的臨床試驗大多有副作用。但即使針對這樣的藥品,在歐美國家目前已經對這種耗時費力的臨床試驗的合理性和經濟性提出了質疑。常用中藥大多是無毒無害的動物、植物、礦物的組成部分,其毒性及因偏性導致的副作用大多可以通過炮制以及合理的配方減毒或進行佐制,與西藥的安全性完全不在同一個等級。而且類似的中藥及配方在過去、現在乃至將來中醫師日常的臨床診癥過程中經常使用。對它們的評價是否一定要參照和跟進西藥的評價體系?投入大量的社會資源(包括人力、物力和財力)建立這樣一個貌似科學的評價體系,對于提升人類的健康水平有多大的實際意義,有多大的投入產出比?在現代醫學藥品評價體系擺脫了傳統臨床試驗和評價方法的羈絆,開始走向“真實世界”的今天,將一直生存在“真實世界”的中醫學針對證候的藥物、方劑研究套上“科學的臨床試驗和療效評價”的羈絆,對中醫藥發展是否具有積極意義?這些都是值得中醫藥界以及相應的監督管理部門認真思考的問題。
“籃子試驗”和“雨傘試驗”作為適應個性化醫學的臨床試驗模式,無疑也適合同為個性化醫學的中醫辨證論治方法的臨床評價?!吨笇г瓌t》推出的“中醫證統西醫病的研究模式”是不折不扣的“籃子試驗”,完全適于針對證候的藥物研發,從而將中醫學對藥物作用的認識建立在實證的基礎上;而“中醫病證結合研究模式”,如果將研究范圍由針對某一中醫疾病下的“某一證候”改為“所有相關證候”,就變成了不折不扣的“雨傘試驗”,適于系統地研究一種疾病下的各種證候分型及相應的治療方法。由此,與一種疾病相關的證候類型的確定,將不再完全根據中醫師的經驗,而是建立在嚴格的統計分析的實證基礎上。
不同之處在于,對精準醫學個性化療法的臨床試驗采用的參照系是基于微觀層面的“靶點”,而對中醫辨證論治方法的試驗采用的參照系只能是中醫的證候。精準醫學的“靶點”可以基于規范的標準進行客觀的檢測,顯然,要將中醫的辨證論治納入“籃子試驗”和“雨傘試驗”進行科學的臨床試驗和療效評價,建立規范化的證候診斷標準是必不可少的前提。
中醫證候的規范化問題在20世紀80年代初就被擺上了臺面,但至今也未形成公認的行業標準,可見不是一個簡單的問題。中醫證候通常由一組有相關性的癥狀、體征(亦可引入客觀的檢測指標)定義。由于這些癥狀/體征對證候的診斷缺乏特異性,基于它們對證候進行診斷不僅涉及它們本身定性的規范化,也涉及證候成立的邏輯條件的設定以及癥狀、體征對相關證候診斷意義的定量化。此外,為確保辨證論治體系的完備性,這個體系應當包括哪些證候?如何對它們實行統一規范的命名?由于證候間的界限不清晰,如何確保每個證候一定程度的獨立性,不致因重復、冗余導致證候體系結構上的混亂?這些均是建立規范的證候體系無法回避的問題。
第一,癥狀、體征的規范化。近幾十年,中醫界在這方面已積累了很多有價值的研究。但由于受限于中醫癥狀、體征傳統描述方式的限制,還達不到科學規范的要求。基于科學規范的描述,首先,要做到命名統一,涵義表述清晰、無歧義;其次,需要將復合的癥狀/體征分解為獨立要素;癥狀/體征主體與描述它的屬性也要分離。基于這些原則,自上而下地建立癥狀、體征體系的結構,拋開中醫傳統描述的局限,對每一癥狀/體征進行規范的表述,完全可以將中醫癥狀、體征描述的水平提升到與現代醫學相應的水平。
第二,基于癥狀、體征對證候診斷的定性規則與診斷意義的定量量度。由于癥狀、體征對證候的診斷通常不具有特異性,在基于它們進行辨證過程中,既存在從癥狀、體征到證候的要滿足的邏輯條件,又存在一個癥狀/體征出現對于證候成立的診斷意義的量的量度。這是一個模糊識別問題,遠不是《指導原則》中提到的“證候診斷量表”所能解決[11]。隨著近年來人工智能技術的進步,與此類似的指紋識別、人面識別、語言識別,準確率均提升到95%以上,達到了實用要求并已實際投入實用。已經有成熟的算法和規則可以借鑒,不存在難以逾越的技術難題,只需要基于這些算法和規則,根據中醫證候辨識的實際情況先建立經驗模型,進而在基于經驗模型的應用中,收集數據,以對規則和參數進行調整優化,逐漸提升辨證診斷的準確率[17]。
第三,證候體系的結構化、規范化。在中醫學中存在臟腑-氣血津液辨證、六經辨證、衛氣營血辨證和三焦辨證幾大體系,不同體系的證候間存在實同名異、結構混亂的情況。如衛氣營血辨證的“氣分證”與六經辨證的“陽明經證”的“實同名異”,三焦辨證中的中焦濕熱與臟腑辨證中的肝膽濕熱、脾胃濕熱之間的結構混亂。此外,由于主神志的臟腑一直存在“心主”和“腦主”的分歧,也帶來相關證候的定義及結構的不清晰。證候體系的結構化包括證候列表的確定、證候界限的劃分、相互間的結構關系以及證候系統的整體布局。如果能撇開中醫理論傳承上的“來源”與“依據”,純粹把它作為一個結構設計問題,即采用什么樣的結構,能夠把與這幾個體系相關的證候按照結構化的原則合理的整合到一起,證候體系的結構化則是可以按照現代科學結構分析的方法合理解決并不斷優化的技術問題[18]。
以上給出的中醫辨證論治體系規范化的方案,是跳出了中醫學學科的局限,在現代科學的視野下提出的解決方案。其實,中醫證候規范化的障礙并不在于技術的復雜性,而是涉及是否將中醫學作為一門科學的認識論問題。近年來,關于“中醫是否科學”的爭論一次次成為輿論關注的焦點,實際上,這個爭論涉及兩個容易混淆的命題:一是中醫學是否具有科學性,二是中醫學是不是一門科學。對于前一個命題,隨著復雜性科學興起帶來的科學觀念的進化,隨著精準醫學帶來的個性化醫學理念的興起以及世界范圍內對中醫學臨床療效越來越廣泛的認可,答案似乎已經不成為問題。然而,對于后一個命題,中醫界似乎還缺乏認真的思考和共識?!爸嗅t學是不是一門科學”,重要的不在于別人怎么看,而在于中醫界自己。如果中醫界自己沒有將中醫學視為一門科學,就不必計較別人怎么看;如果中醫界真正把中醫學當作一門科學,就至少不應當排斥按照科學的規范規范中醫學的體系??偛荒艽蛑茖W的旗號而又不遵守科學的規矩。
“籃子試驗”和“雨傘試驗”極大地拓展了一個臨床試驗的涵蓋范圍。原來一件臨床試驗要求的樣本量分攤到一個證候相關的多種疾病或一種疾病相關的多種證候類型,顯然遠遠不夠了。相應地,不得不拉長試驗周期,擴大樣本量,以使證候相關的每種疾病,疾病相關的每種證候,均能達到作出結論所需要的樣本量。而這又無疑會使臨床試驗的實施難度及成本大大提升,進一步降低投入人力、財力進行證候相關中藥研究的實際意義和經濟價值。
無論在過去還是現在,中醫師因人而異,隨證處方均不需要任何預先的臨床試驗,只要辨證準確,用藥符合中醫的規范,臨床很少會出現不良反應。對這樣藥物的臨床評價更沒有必要一定跟進現代醫學的臨床試驗和療效評價體系。
然而,無論是采用傳統臨床試驗還是真實世界的研究,對治療方法或藥物的安全性評價都是必不可少的。RCT及其相應的療效評價體系,是在還原論為主流科學理念的時代,基于“每次只變動一個變量”設計的,原則適合于觀察范圍較局限的針對單一疾病或單一證候的藥物研究。而中醫用于辨證論治的藥物,通常需要觀察藥物對人體各個部分的全方位作用,RCT的方法顯然不太適合?!盎@子試驗”和“雨傘試驗”用于中醫學針對證候藥物的臨床評價是適合的,但由于中醫學證候的宏觀性,療效的判定會更多涉及需要長期隨訪觀察的遠期效應。而且現實中人患病常常不止一個證候異常,也就是說大多數的統計案例是多個證候同時并存的情況,因此,采用可以納入復雜的、患有多種疾病的患者,可以非隨機的方式分配治療,并且需要大量的案例的真實世界研究,似乎更為適當。顯然,在現代醫學臨床評價越來越重視“真實世界證據”的今天,幾千年來一直基于“真實世界研究”發展起來的中醫藥學體系,它的臨床評價體系更不應脫離“真實世界證據”。
只是今天的“真實世界”研究,已不能象古代一樣完全依據醫生的主觀感覺和臨床經驗,而是應建立在嚴格的實證和統計分析基礎上。而實現這種大樣本的真實世界研究,證候體系的規范化和標準化是必不可少的前提。有了規范化、標準化的人體模型和證候體系,有了統一而規范化、標準化的癥狀、體征和檢測指標體系,還需要按照統一、規范的原則,去全面收集患者的信息,而不是只收集患者敘述的和醫生認為重要的部分信息。在這方面,美國“全美健康研究項目”的信息采集方案及建立的數據平臺是值得借鑒的[19]。就是說也要建立能夠基于規范化的癥狀、體征體系和證候體系,全面收集患者疾病相關信息的數據平臺。如此,才能最大限度地保證收集到的患者疾病數據的客觀性和全面性。否則,收集的信息難免擺脫“瞎子摸象”的境遇:不同的醫師在同一患者身上會看到不同的病情,或注重患者不同方面的病情信息。以這樣的臨床數據為基礎,不僅會影響療效評價的準確性,也會影響基于數據進行機器學習的可靠性。
基于“真實世界研究”進行療效評價,“籃子試驗”、“雨傘試驗”不再是臨床研究方法,而成了設計統計算法的依據?;谂c“全美健康研究項目”相類似的數據平臺收集的臨床數據,甚至能夠對藥物各方面的作用(包括副作用)進行全面的統計分析。以這樣的數據為基礎,才能確保臨床療效和安全性評價的準確性。進而通過數據挖掘和機器學習,調整規范化體系涉及的一些規則和參數,不斷提升診斷規范的準確性。由此,依據真實世界研究中產生的數據,中醫學對藥物及方劑性能的認識將建立在嚴格實證的基礎上,并隨著真實世界研究的深化而得到持續的發展。而這樣一個體系,同樣可以用于中成藥新藥、新療法的療效評價。
為適應醫學走向個性化的趨勢,美國FDA對臨床評價體系做出了具有里程碑意義的變革。精準醫學發展的某些標靶藥物,基于之前的臨床評價體系不具有臨床意義,而按照新的療效評價體系卻具備了顯著的有效性。而目前還不被這一變革的始作俑者所知的更重要的意義在于,這個新的療效評價體系,同樣可用于中醫學的臨床療效評價。
中醫學的臨床評價,經歷了幾十年按照西藥針對疾病的“隨機對照試驗”模式,目前開始了向與美國FDA推出的“籃子試驗”和“雨傘試驗”相一致的模式過渡。然而,最適合中醫藥臨床療效評價的是建立在實證和統計分析基礎上的“真實世界研究”。而實現“臨床應用與療效評價的統一”的真實世界研究,辨證論治體系的規范化是必不可少的,規范化的信息采集體系的建立及推行是核心,而在此基礎上,便是與療效評價相關的統計算法設計以及評價原則的制定及實施。隨著臨床評價體系的變革,中醫學的有效性將得到科學的證明,同時也將啟動基于科學規范對中醫學體系的完善整理。由此,將推動中醫學在理論更新和實踐檢驗的相互作用下,逐步發展為一個嚴格科學化的醫學體系。