黃櫻碩, 魏 巍, 佟小非, 孫亞朦, 張健雄, 董瑞華, 賈繼東, 尤 紅
首都醫科大學附屬北京友誼醫院 a.研究型病房, b.臨床流行病學與循證醫學研究室, c.肝病中心,d.肝硬化轉化醫學北京市重點實驗室, e.國家消化系統疾病臨床醫學研究中心, 北京100050
非酒精性脂肪性肝病(NAFLD)是一種與胰島素抵抗和遺傳易感密切相關的代謝應激性肝損傷,疾病譜包括非酒精性肝脂肪變、非酒精性脂肪性肝炎(NASH)、肝硬化和肝細胞癌[1]。NAFLD和NASH已成為全球慢性肝病的最主要病因[2]。除了增加心血管疾病風險,NAFLD/NASH也是肝硬化、肝細胞癌和肝移植的主要病因之一[3]。已經有治療NASH的多種新藥臨床試驗處于早期臨床研究階段,但到目前為止,很多被寄予厚望的藥物在2期和3期未達到預期的療效終點,因此從NASH新藥治療的臨床研發和臨床試驗的實施仍然面臨巨大挑戰。
目前NASH新藥治療的主要治療靶點包括:法尼酯X受體(farnesoid X receptor,FXR)、成纖維細胞生長因子(fibroblast growth factor,FGF)、過氧化物酶體增殖物激活受體(peroxisome proliferators-activated receptors,PPAR)、抗炎/抗纖維化以及以改善糖脂代謝為目標的藥物等[4]。
為了規范NASH新藥研發和臨床試驗實施,更好地指導臨床實踐,2018年食品藥品監督管理局(FDA) 發布了NASH伴肝纖維化治療藥物的研發指南草案[5],2019年美國肝病學會和歐洲肝病學會發布了對NAFLD臨床試驗終點的聯合報告[6],2019年我國食品藥品監督管理局發布了《非酒精性脂肪性肝炎治療藥物臨床試驗技術指導原則(試行)》[7],對NASH新藥試驗進行了詳細的規范和指導。
本研究對國內外臨床試驗注冊網站上關于NASH新藥臨床試驗方案的篩選失敗和試驗失敗原因進行系統分析,為今后NASH新藥臨床試驗設計、招募和實施等過程提供參考和依據。
1.1 檢索策略 (1)檢索詞。以Nonalcoholic Steatohepatitis為主題詞檢索美國臨床試驗數據庫(www.clinicaltrial.gov),以“非酒精性脂肪性肝炎”和“NASH”為主題詞檢索中國臨床試驗注冊中心(http://www.chictr.org.cn)以及國家藥品監督管理局藥品審評中心(http://www.cde.org.cn/),檢索時間為建庫以來至2021年8月6日。(2)檢索條件。美國臨床試驗數據庫檢索狀態選擇包括:沒有招募、招募中、通過邀請納入、啟動未招募、暫停、終止、完成;年齡組包括:成人、老年人;性別選擇:全部;接受健康受試者;研究類型選擇干預試驗,研究分期包括:早期1期、1期、2期和3期。中國臨床試驗注冊中心限定干預性試驗;國家藥品監督管理局藥品審評中心不限定檢索條件。
1.2 納入標準 (1)研究類型:干預性試驗;(2)研究對象:確診為非肝硬化性非酒精性脂肪性肝炎的患者;(3)干預措施:NASH的新藥,可合并肝纖維化,不伴代償性/失代償性肝硬化;(4)試驗狀態:尚未招募、招募中、通過邀請納入、啟動但未招募、暫停、終止、完成。
1.3 排除標準 (1)試驗分期:Ⅳ期臨床試驗;(2)試驗狀態:已撤銷、狀態未明;(3)研究對象:僅診斷為NAFLD但未診斷為NASH的患者,其他代謝疾病如肥胖、糖尿病、心血管疾病患者,合并其他肝病或病毒感染(如乙型肝炎、丙型肝炎、丁型肝炎、HIV感染等)、合并代償性/失代償性肝硬化、合并肝功能異常(無論程度),兒童、青少年等非成人患者(<18歲);(4)干預措施:非NASH治療新藥,如不飽和脂肪酸、魚油、維生素D、食物或其他營養素、干細胞、生活方式干預等;或不以改善NASH主要療效指標作為評價標準,如以改善血脂或其他實驗室指標作為主要評價指標等。
1.4 資料提取 由2位研究者獨立查詢和提取資料,并進行交叉核對,提取的信息包括:注冊名稱、官方名稱、注冊編號(NCT編號)、開始時間、試驗狀態(完成、終止、招募等)、試驗分期、單一干預或聯合干預、藥物名稱/藥物代號、試驗用藥物作用機制(可通過Clinicaltrial.gov以外的其他渠道查詢)、研究目的(安全性、耐受性、有效性、藥代動力學、藥效動力學等)、試驗設計包括是否隨機、是否盲法(包括開放標簽、單盲、雙盲、三盲、四盲)、有無安慰劑對照、干預類型(平行試驗、序貫試驗、交叉試驗、單臂試驗)、是否適應性設計、入組例數、主要入選標準(病理、影像學、臨床診斷、ALT、BMI限制范圍、有無體質量變化的限制、主要結局評價指標(安全性、耐受性、病理改變及間隔時間、影像學改變及間隔時間、ALT改變及間隔時間)類型、申辦方所在國家、是否單中心/多中心研究等。(3)由2位研究者獨立檢索及篩選文獻,意見不一致時進行討論或參考第3位研究者的意見。
2.1 注冊情況及基本情況分布 共檢索到符合上述條件的NASH相關注冊試驗共400項(美國臨床試驗數據庫354項,中國臨床試驗注冊中心21項,國家藥品監督管理局藥品審評中心25項),除外僅以NAFLD作為研究對象、合并肝纖維化、非NASH的其他代謝性疾病、合并其他病毒感染(如HCV、HIV感染)、不以NASH作為治療目標、非藥物干預(營養成分/食物/其他生活方式)、合并肝腎損傷、藥物相互作用、物料平衡、兒童等情況,以及國內外多中心針對同一藥物的分別注冊的試驗,共篩選出196項(圖1)。
2.2 試驗地域分布及完成情況 根據本研究的入排標準,最后納入的為196項。申辦方為中國(含臺灣地區)企業共有38項,其他國家共158項,以美國最多,為105項。按照中心數量分組,包括多中心研究104項,單中心研究92項(圖2)。
試驗進行狀態分布情況:啟動未招募25項,完成 97項,通過邀請入選 1項,招募過程中 53項,暫停3項,終止10項(終止原因包括安全事件、缺少預計療效、未達主要療效終點、根據衛生部門意見、申辦方決定、實驗室異常值等),狀態不明7項。詳見圖3。
圖1 篩選流程圖
圖2 申辦方公司所在國家的注冊試驗數量Figure 2 The number of clinical trials in different countries where sponsor companies located
圖4 注冊試驗數量隨年份分布情況Figure 4 Numbers of registered trials distributed by year
2.3 試驗時間分布情況(按照注冊時間或開始時間計算) 2000年以前沒有NASH注冊試驗,2001年—2005年共有9項,2006年—2010年共17項,2011年—2015年共32項,2016年—2020年共105項,2021年到篩選日為止33項,注冊數量呈遞增趨勢(圖4)。
2.4 NASH治療藥物機制類型和給藥類型 NASH治療藥物主要包括如下種類:FXR類16項(激動劑14項,受體抑制劑1項,受體配體1項),FGF類14項(FGF受體抗體3項,FGF-21類似物8項,FGF-19類似物2項,FGF激動劑1項),PPAR激動劑11項,胰高血糖素樣肽(glucagon-like peptide,GLP)-1類13項(激動劑9項,類似物4項),胰島素增敏劑7項,激素類6項(睪酮類3項,糖皮質激素類2項,雌激素類1項),保肝藥5項(水飛薊素類3項,膽汁酸調節劑2項),己酮可可堿類似物4項,趨化因子受體(chemokine receptor,CCR)拮抗劑4項,乙酰輔酶A(acetyl CoA carboxylase,ACC)抑制劑3項,脂肪酸合成酶抑制劑3項,胰島素3項,瘦素類似物3項,抗生素3項,大麻素受體抑制劑3項,降脂藥3項(依折麥布1項,考來維侖1項,阿托伐他汀1項),鈉-葡萄糖協同轉運蛋白(sodium-glucose-linked transporter,SGLT)抑制劑3項,頂端鈉離子依賴性膽酸轉運體抑制劑2項,酮己糖激酶抑制劑2項,氨基脲敏感性胺氧化酶抑制劑2項,其他46項[其中包括利尿劑1項,Toll樣受體4拮抗劑1項,甲狀腺激素受體β1(激動劑1項,磷酸二酯酶4抑制劑1項,RNA干擾(RNA interference,RNAi)類藥物1項],各種中藥10項,未知30項(見圖5,僅列舉數量較多的靶點類型,數量較少的靶點類型合并為其他新藥機制)。比例最高的前4名依次為FXR類16項(8.16%),FGF類14項(7.14%),PPAR激動劑11項(5.61%),GLP-1類13項(6.63%)。其中單藥給藥為180項(91.8%),聯合給藥為16項(8.2%)。
2.5 NASH新藥臨床試驗的設計特點 按照是否隨機分為隨機試驗和非隨機試驗,其中非隨機試驗23項,隨機試驗173項;按照盲法分類包括開放標簽35項、單盲6項、雙盲53項、三盲26項、四盲75項、未知1項,其中采用盲法為112項(57.1%)。163項試驗采用了安慰劑對照,2項涉及生活方式干預作為對照,3項陽性對照。
圖5 NASH新藥試驗的靶點類型Figure 5 Types of targets for NASH drug trials
根據干預模型分類,平行試驗159項,序貫試驗12項,單臂試驗18項,交叉試驗4項,未知3項。
根據是否新型試驗設計分類,常規設計有193項,適應性設計有3項。
根據試驗評價目的分類,其中目的涉及安全性有145項,涉及耐受性77項,涉及效果138項,涉及藥代動力學/藥效動力學有62項(上述研究目的部分有重疊)。
2.6 NASH新藥試驗的主要入選標準
2.6.1 病理作為主要入選標準 以NASH作為受試對象的試驗中,病理作為主要入選標準共有125項,占全部試驗的63.8%,其中病理診斷NASH的有效時間范圍,接受病理有效時間分為3個月、6個月(含18~24周)、12個月(含1年、360 d、48周)、18個月、24個月、36個月,分別為3項、39項、21項、2項、7項、2項,另外有51項盡管有病理作為入選標準,但對病理結果的有效時間沒有規定;病理有效時間為6~12個月的臨床試驗數量最多(圖6)。對于病理評分,主要以NAS評分和NASH-CRN病理評分的分級為標準[8],其中≥4分為35項,≥3分為6項,≥5分為2項,并且規定小葉炎癥和氣球樣變等不同維度均≥1分;按照NASH-CRN評分系統的分級,F2~F3為15項,F1~F3為12項,F1~F4為2項。
圖6 NASH新藥試驗病理評價診斷標準的有效時間Figure 6 Effective time of pathological assessment for NASH drug trials
2.6.2 影像學作為主要入選標準 以NASH作為受試對象的試驗中,影像作為入選標準共有66項,占全部試驗的33.7%,其中以MRI質子密度脂肪分數(proton density fat fraction,PDFF)作為入選標準有46項,定義為≥8%(含>8%和≥7%)有21項,≥10%(含>10%)有15項,≥5%(含>5%及≥5.5%)有5項,>15%有1項;對磁共振彈性成像(magnetic resonance elastography,MRE)有規定的有8項,范圍為2.5~3.63 kPa;以Fibroscan作為入選標準的有21項,受控衰減參數(CAP)>230~300 dB/m,肝臟瞬時彈性值/肝臟硬度值(LSM)為7~13 kPa。
2.6.3 臨床診斷作為主要入選標準 在非Ⅰ期研究中(包含Ⅰ~Ⅱ期),以臨床診斷作為入選標準的有42項,占全部試驗的21.4%。其中對ALT范圍進行規定的有22項。
2.6.4 對BMI和體質量變化的規定 對BMI有范圍規定的有98項,其中34項僅對BMI低限進行規定,10項僅對BMI高限進行規定,54項同時對BMI的低限和高限進行規定;BMI低限≤24 kg/m2有40項,25~28 kg/m2有40項,>28 kg/m2有8項;BMI高限≤28 kg/m2有13項,29~35 kg/m2有18項,>35 kg/m2有33項。對體質量變化有限制規定的59項,其中增加或減少以≤5%為界有28項,10%有21項(含7%1項),5 kg為界的2項,未規定7項;體質量穩定時間范圍≤3個月有19項,6個月有22項,12個月有6項,未規定有12項。
2.7 NASH新藥試驗的主要評價指標 主要評價指標與試驗分期有關,其中Ⅰ期主要以安全性、耐受性及藥代動力學參數為主要評價指標,Ⅱ~Ⅲ期試驗除評價安全性,還評價有效性,NASH新藥試驗的有效性主要以病理、影像學的變化為主要指標。在入選的全部試驗中,以安全性為主要評價指標有120項,以耐受性為主要評價指標有78項,藥代動力學指標為主要評價指標有19項。以病理學為主要評價指標有62項,病理評價的有效時間≤6個月(含26周)、28~52周、72~120周對應的試驗數量分別為14項、34項和13項,還有1項試驗未規定病理評價的有效時間。以影像學改變為主要評價指標的試驗有40項,觀察時間為≤24周和28~52周分別有31項和6項,還有3項未規定觀察時間。以ALT改變作為主要觀察指標的試驗有28項,觀察時間為≤24周和28~52周分別有20項和4項,其他4項未規定觀察時間。
NASH新藥數量呈遞增趨勢,尤其是近5年,較前成倍增長,表明申辦方和研究者對NASH的認識不斷深入,對NASH治療的需求也在增加,除了已完成的100項試驗,還有進行中的近80項試驗。由于發展至肝硬化階段的NASH與非肝硬化性NASH在治療上有較大差異,因此本文在進行分析時排除了肝硬化,僅納入非肝硬化性NASH。
根據申辦方的地區分布,仍以歐美國家為主,其中美國數量最多,在非歐美地區,中國的申辦方注冊試驗的數量最多,并且有多項1.1類新藥,還有部分為中藥。國內注冊試驗數量近年來也有逐漸增加的趨勢。隨著中國加入國際人用藥品注冊技術協調會,NASH新藥發展速度也進入了快車道。
NASH/NAFLD新藥治療以改善臨床結局、代謝結局、炎癥和纖維化等作為目標,新藥設計的靶點主要包括改善代謝和胰島素抵抗、抗炎、抗纖維化等作用于NASH的不同機制[9]。數量最多的藥物涉及FXR類、FGF類以及PPAR激動劑、GLP類、CCR和ACC抑制劑等[9-10],除了GLP類為新型降糖藥,還有傳統的降糖藥、降脂藥、激素類藥物也在開發關于NASH的新適應證[4]。中國自主研發的NASH新藥仍以化學藥品為主,還有一部分中藥試驗。除了國外申辦方發起的國際多中心試驗在中國進行注冊外,中國自主研發的NASH新藥的作用機制幾乎未公開,與國際NASH新藥的作用機制無法比較。
NASH新藥試驗以單藥治療為主,因為研究對象大部分為病理分級在F3以內的人群,部分試驗涉及纖維化,少數試驗為聯合治療。聯合用藥也是近年來NASH新藥試驗發展的一個趨勢,如GLP-1類似物與ACC抑制劑、FXR激動劑的雙藥或三藥聯合,白三烯A4水解酶抑制劑與FXR激動劑的聯合,FXR激動劑與阿托伐他汀聯合,FXR激動劑與SGLT抑制劑聯合,FXR激動劑與趨化因子受體CCR2/5雙重拮抗劑聯合等。這些聯合方案以不同NASH治療的不同機制出發,通過抗炎、抗纖維化等效果聯合實現治療NASH的目的,這也是NASH新藥治療試驗設計的一種新模式和新思路。
NASH新藥試驗多為隨機、盲法、安慰劑對照的試驗設計,其中雙盲、三盲、四盲的比例最高,開放標簽和單盲的試驗較少,從研究設計類型看,主要涉及平行試驗、序貫試驗、單臂試驗、交叉試驗這四種類型,其中平行試驗占大多數,是最常用的臨床試驗設計類型。由于NASH尚無公認有效的治療藥物,目前一般以安慰劑作為陰性對照,少數以生活方式干預作為對照。大多數NASH新藥試驗處于早期探索階段,大多因為沒有達到預期終點而未能成功上市。盡管新型試驗設計有望減少研究成本,但由于NASH新藥試驗的結果具有較大的不確定性,總體而言現有的試驗仍以傳統設計為主。
NASH的診斷仍以病理作為金標準,但是隨著對NASH認識的增加,以及臨床試驗數據的支持,MRI-PDFF、MRE、Fibroscan等無創影像學手段在相對早期階段的NASH試驗的地位逐漸提升[11],而且作為金標準的病理診斷,可能存在較大的組間和組內診斷差異[12],但對于確證性試驗,病理仍作為最重要的入選和療效標準。根據美國FDA、美國肝病學會和歐洲肝病學會、我國食品藥品監督管理局發布的相關指導文件,可將病理、影像學、臨床表型診斷作為主要的入選標準。由于NASH可能受到生活方式、體質量變化等的影響,病理狀態、評分和CRN-NASH分級也可能在一定時間內發生變化,因此比較規范的NASH新藥試驗對病理有效時間和體質量變化范圍及時間均做了明確的規定,占比最高的病理有效時間為6~12個月,但仍有較多試驗對病理的有效時間沒有做出明確規定。
目前主要以NAS評分作為NASH的主要病理評價標準[8],NAS評分包含脂肪變性、小葉炎癥和氣球樣變三個維度,除了規定NAS評分外,還對每個維度的得分進行限制,多數為小葉炎癥和氣球樣變的不同維度得分均≥1分,這樣NASH的病變較均衡。對既往病理有效時間的規定范圍與試驗分期有關。大部分試驗接受12個月以內,以3~6個月為主。對于12個月以上的病理有效時間,或者為早期試驗,或者在入選標準中還結合了影像學標準、代謝狀態等更多限定條件。
對以降低脂變為治療靶點的NASH新藥中,MRI-PDFF是一種比較好的無創影像學評價方式[13],可以在一定程度上代替病理金標準,有研究[14]表明影像學與病理的一致性較好。目前MRI-PDFF診斷NASH的標準比較統一,多數認可8%~10%的范圍,但MRI-PDFF也存在組間判斷差異較大的問題[15]。MRE受到儀器和人員的限制,開展和適用性受限,無法普遍實施。Fibroscan是近年來新發展的無創檢測手段[16],但是受到檢查者的操作因素影響較大,并且注冊試驗中, CAP和LSM限定值的變化范圍也較大,可能需要更多對比數據支持。
雖然NASH與肥胖的關系較為密切,但是仍有部分瘦型NASH人群,一般來說,Ⅰ期試驗以健康受試者為主,對BMI多要求在正常范圍,而Ⅱ、Ⅲ期試驗納入多為NASH患者,因此BMI限定超重和肥胖患者的試驗數量較多,但是在試驗設計時不能忽略瘦型NASH這一特殊人群,可以適當擴大BMI的入選范圍,以病理及影像學的診斷為主。體質量變化可能對NASH的新藥療效、觀察指標等都有影響,也可能導致安慰劑效應[17-18]。因此較多試驗的入選標準對體質量變化進行了規定,要求在篩選至基線期保持穩定。
Ⅰ期試驗的受試對象為健康人,主要以安全性、耐受性和藥代動力學指標為主要評價重點;對于Ⅱ期NASH新藥試驗的療效評價,以病理和影像學作為主要療效評價標準[11,19-20]。療效評價的病理觀察時間以半年至1年為主,而影像學的變化以半年內為主。Ⅲ期試驗,大部分將病理組織學的改善作為替代終點[11],因為NASH發展至肝硬化甚至出現死亡事件的時間較長,常規的Ⅲ期試驗可能較難觀察到臨床結局事件。部分觀察時間較長(如5年)可能納入了肝硬化、死亡等臨床終點事件。對于觀察指標的時間范圍主要與試驗分期、研究目的等有關。
由于NASH新藥試驗的觀察時間較長,因此導致新藥研發周期較長;盡管很多新藥試驗將血清生化標志物如細胞角蛋白18[9,20]或一些多項復合指標的評分系統如增強的肝纖維化評分等[21]也作為評價指標,但由于新藥作用機制的多種多樣,目前并無公認統一的生化標志物可供作為療效評價指標。探索能夠早期診斷和評價NASH療效的指標也是新藥試驗的研究方向之一。
綜上,國際NASH創新藥臨床試驗注冊量增長速度較快,近年來顯著增多,多處于早期階段,藥物作用機制多種多樣,入選標準和評價指標差異較大,病理和影像學仍為主要的入選標準及療效評價指標,聯合治療和納入代謝狀態作為復合指標可能是是未來試驗設計的趨勢,但病理和影像指標的具體值及觀察時間缺少統一的標準。由于觀察時間的限制,臨床事件硬終點的支持證據相對較少,并且新型試驗設計較少。國內注冊的NASH新藥臨床試驗盡管數量較少,但總體數量呈增長趨勢;相對化學類新藥,中藥注冊試驗數量較少。
利益沖突聲明:本研究不存在研究者、倫理委員會成員、受試者監護人以及與公開研究成果有關的利益沖突。
作者貢獻聲明:尤紅、賈繼東負責選題及文章結構設計;黃櫻碩、魏巍負責檢索數據庫、篩選文獻及提取資料;黃櫻碩、佟小非負責撰寫文章并修改;董瑞華、孫亞朦、張健雄負責對結果進行分析和討論;黃櫻碩參與完成初稿的撰寫。