尹潞,韓國亮,丁麗娟,李思冬,劉小云,趙延延,李衛,王楊
上市前臨床試驗在設計階段的樣本量估算是必不可少的過程,需以試驗設計類型、研究假設、主要評價指標及預期效應值估計等為基礎,按統計學原則最終計算所需的樣本量規模。統計學的樣本量估算不是憑空產生的,而是以分析變量的信息積累為基礎完成的,研究者往往可以通過預試驗結果、文獻回顧、專業知識等做出判斷和預設[1]。
冠狀動脈分叉病變占所有經皮冠狀動脈介入治療的15%~20%,因介入操作難度大,手術成功率低,并發癥發生率高,在冠狀動脈介入治療中具有一定挑戰性[2-5]。目前國家藥品監督管理局(NMPA)批準用于分支病變的藥物洗脫球囊(drug eluting balloon,DEB)導管僅有遼寧垠藝生物科技股份有限公司生產的輕舟?(Bingo?)DEB 導管[6],故在為新DEB 導管設計臨床試驗方案時,可選取該產品為對照產品,使用隨機對照設計,比較類型為非劣效試驗。經臨床討論決定擬采用術后9 個月隨訪時基于造影獲得的分支血管靶病變節段內直徑狹窄百分比(percentage diameter stenosis,DS%)作為主要療效指標。本研究詳細介紹為此類試驗的樣本量設計提供文獻依據的過程,特別是預期療效估計及非劣效界值的確定。
本研究數據來源有兩個:(1)申辦方直接提供的文獻;(2)根據方案草稿擬定的適應證和產品類型所規定的關鍵詞組合“drug eluting balloon”和“coronary bifurcation lesion”在PubMed 網站進行文獻檢索。
2020 年9 月8 日根據上述關鍵詞檢索組合在PubMed 檢索,再用“clinical trials”、“randomized controlled trial”、“meta-analysis”進一步限定后,潛在合格文獻導入EndNote X 9.3.3 軟件進行文獻篩選和管理,根據每篇文獻的標題和摘要判斷文獻合格性;若摘要和標題無法判斷其合格性,需下載全文進一步評判合格性。除上述檢索以外,交叉檢索會作為補充檢索防止潛在合格文獻遺漏,交叉檢索即通過合格文獻和綜述類文獻檢查是否有遺漏。所有不合格文獻需在EndNote 中標記出不合格的理由,用于流程圖的制作。
滿足如下標準的文獻定義為合格:(1)適應證為冠狀動脈分叉病變,而冠狀動脈原位病變、支架內再狹窄、小血管病變、外周血管病變等排除;(2)分支病變的分支需采用DEB 導管或藥物涂層球囊(drug-coated balloon,DCB)導管處置,藥物種類不限,主支處置也不限,而普通球囊、對吻球囊等排除;(3)研究設計以臨床試驗優先,其次為觀察性隊列研究,但綜述(含Meta 分析)、指南、無隨訪的觀察性研究、病例報告或病例序列報道除外;(4)文獻需報道術后隨訪期間基于造影獲得的分支血管靶病變節段內DS%結果。
所有納入文獻的數據提取需按照統一的標準提取。需提取的數據包括:第一作者姓名、文章發表年份、研究實施國家、研究實施時間、研究設計類型、患者基線特征(含樣本量、平均年齡、性別比例等)、分支置入藥物洗脫支架(DES)類型及生產商、主支處置策略、對照組分支處置策略、分支血管靶病變節段內DS%及其評估時間點等。
經與研究者和申辦方溝通后,擬定采用前瞻性、多中心、隨機對照設計,比較類型為非劣效試驗。對照器械為遼寧垠藝生物科技股份有限公司生產的輕舟?(Bingo?)冠狀動脈DEB 導管;適應證為冠狀動脈分叉病變;主要評價指標為術后9 個月隨訪時基于造影獲得的分支血管靶病變節段內DS%,對應的統計學假設檢驗為:

公式中的XT對應試驗組預期術后9 個月隨訪時DS%水平,XC對應對照組預期術后9 個月隨訪時DS%水平,Δ 代表非劣效界值(因DS%為低優指標,所以在此取正值)。
在統計檢驗的顯著性水平取單側0.025,把握度取80.00%時,按1:1 的比例分組。使用的樣本量計算公式為:

σ代表兩組療效指標的合并標準差,μ則代表標準正態分布對應的分位數[1]。
使用Stata 12.0 進行Meta 分析。評價指標DS%為計量數據,針對DEB 導管組的結果進行評價時,單組均數及其95%CI 作為效應值進行統計合并,用于樣本量計算時預期效應值的假設,并根據DS%評估時間點進行亞組分析。針對DEB 導管與普通球囊相比較的術后DS%差值的結果進行評價時,加權均差(WMD)及其95%CI 作為效應值進行Meta 分析,為非劣效界值設定提供依據。使用Cochran's Q檢驗評估納入研究的異質性。若P<0.10 則拒絕零假設(存在異質性),使用I2統計量評價每項Meta 分析和亞組分析的異質性,I2<25%異質性可以忽略,25%~49%為低水平異質性,50%~74%為中水平異質性,>75%為高水平異質性。如果存在異質性(P<0.10),則使用DerSimonian 和Laird 的隨機效應模型對各結局指標進行合并,否則使用基于Mantel-Haenszel 的固定效應模型[7-9]。所有指標合并結果P<0.05(取雙側)時,認為差異具有統計學意義。
根據“drug eluting balloon”和“coronary bifurcation lesion”關鍵詞檢索組合在PubMed 檢索到395 篇文獻,再用“clinical trials”、“randomized controlled trial”、“meta-analysis”進一步限定后有65 篇文獻入選,申辦方提供的33 篇,交叉檢索發現8 篇文獻,共計106 篇。經篩重發現6 篇重復文獻,剩余100篇經過閱讀摘要和文獻標題后排除45 篇采用DES治療分支病變研究、12 篇冠狀動脈原位病變、11篇冠狀動脈小血管病變、6 篇綜述類文獻(含1 篇Meta 類文獻[10])、4 篇對吻球囊研究、3 篇支架內再狹窄研究、3 篇DES 治療ST 段抬高型急性心肌梗死(STEMI)研究、2 篇指南;在14 篇全文評判中3篇未報告DS%結果[11-13]、1 篇為普通球囊研究[14]。最終剩余10 篇合格文獻[6,15-23],其中2 篇文獻來自于同一研究(DEBIUT)[15,17],參見圖1。

圖1 文獻篩選流程圖
表1 為9 項研究的基本特征,其中4 項為DEB導管與普通球囊相比較的研究(含3 項隨機對照試驗[6,15,17,22]和1 項前瞻性隊列研究[18]),1 項為DEB導管與DES 比較的隨機對照試驗[19],4 項為單組DEB 導管研究[16,20-21,23]。DEB 導管型號以SeQuent Please 居多[16,18-19,22],Bingo?為中國目前唯一批準用于治療冠狀動脈分支病變的DEB 導管[6]。這9 項研究有6 項在歐洲開展,如德國[16]、法國[20]、西班牙[18-19]、荷蘭[17]、比利時[17],2 項在中國大陸[6]和中國香港[23]開展,1 項在澳大利亞[21]開展。有關報道主要評價指標DS%的評價時間點,以9 個月居多[6,16,19,21-22],3 項研究報道評估時間點為術后6 個月[15,17,20,23],1 項為12 個月[18]。

表1 納入文獻的基本特征
對9 項研究進行Meta 分析,圖2 為DEB 導管術后不同隨訪DS% 的森林圖,因納入研究間異質性較大(I2=83.9%,P<0.01),故采用隨機效應模型,得到術后總效應值DS% 為27.34%(95%CI:24.18%~30.50%)。其中術后6 個月有3 項研究,合并DS% 為28.36%(95%CI:22.01%~34.70%),術后9 個月有5 項研究,合并DS% 為27.74%(95%CI:23.28%~32.21%),術后12 個月僅有1 項研究,DS%為23.00%(95%CI:19.95%~26.05%)。

圖2 不同術后隨訪時間分支血管靶病變節段內DS%森林圖
對4 項DEB 導管與普通球囊相比較的試驗進行Meta 分析,圖3 為術后兩組DS%的加權均差森林圖,因納入研究間異質性較大(I2=99.0%,P<0.01),故采用隨機效應模型,得到總效應值WMD 為-9.61%(95%CI:-15.29%~-3.93%,P<0.01)。

圖3 藥物洗脫球囊導管與普通球囊分支血管靶病變節段內DS%的比較森林圖
鑒于試驗采用前瞻性、多中心、隨機對照設計,且比較類型為非劣效試驗,主要評價指標為術后9個月隨訪時分支血管靶病變節段內DS%。在樣本量計算時需要對如下關鍵參數進行假設:試驗與對照組產品的預期療效水平(包括DS%的均值和標準差),以及非劣效界值。
結合上述Meta 分析結果,假設兩組DEB 導管術后9 個月能夠達到同樣的DS% 水平,即27.74%;鑒于納入的9 項研究中DEB 導管對應DS%標準差最大值為18.70%(BEYOND 研究)[6],故進一步將兩組DEB 導管的DS%標準差保守設置為±18.00%;在設定非劣效界值上,結合4 項DEB 導管與普通球囊相比較試驗的Meta 結果,提示DEB導管較普通球囊術后DS%減少9.61%,結合臨床經驗保守預估療效,將非劣效界值設定為7%。
以上述參數為基礎,即試驗組與對照組預期的9 個月隨訪DS%水平為(27.74±18.00)%,非劣效界值取7.00%,在統計檢驗的顯著性水平取單側0.025,把握度取80.00%時,按1:1 的比例分組,計算得到每組所需的最低樣本量為104 例,考慮造影隨訪最大不超過25%的脫落率,最終計劃入組280 例患者,試驗組和對照組各140 例。
醫療器械的有效性和安全性需通過上市前確證性試驗才能夠得到充分證實;確證性研究需要基于前期研究結果完成嚴謹的試驗設計、樣本量估算,最終確定研究規模[1]。以同類產品為對照的隨機對照設計,是確證性臨床試驗的金標準,雖然目前NMPA 僅獲批一個用于冠狀動脈分支病變的DEB 導管產品[6],但在新產品上市申報時,可以綜合參考文獻報道的國外用于治療此類型病變的產品結果,如SeQuent Please、DIOR-paclitaxel、Pantera Lux、Danubio 等[2-3]。綜合現有的臨床文獻用于新的同品種產品進行上市前確證性試驗時樣本量估算所使用參數的確定依據,具有合理性。本研究提供了一種基于Meta 分析匯總同品種產品結果估算樣本量的方法,共納入9 項研究,涉及458 例接受過DEB 導管治療冠狀動脈分支病變的患者,其中進一步有4項研究,支持 DEB 導管與普通球囊相比較的術后DS%均差的Meta 分析從而為非劣效界值的設定提供支持,上述過程可為類似產品的上市前臨床試驗設計提供參考。
以單項研究結果作為樣本量計算的基礎存在風險,而基于Meta 分析結果確定樣本量計算所需的參數是更科學的方式,本研究中試驗產品與對照產品主要療效指標的預期效應值直接選擇Meta 分析的結果;但由于DS%屬于定量指標,其標準差的假設則直接參考了現有文獻結果中相對保守的數值(接近最大值),以應對試驗開展研究時個體差異對結果造成的潛在影響;而非劣效界值的確定,則是以DEB 導管與普通球囊相比較的Meta 分析基礎,綜合臨床考慮后進行的設置,其原因在于,醫療器械試驗不同于藥物試驗,常規很難或根本無法獲得陽性對照相對于安慰劑的治療凈獲益水平,裸球囊由于同樣提供了對狹窄病變的成型治療、嚴格意義上不能算為“安慰器械”,因此,以DEB 導管相比于裸球囊治療獲益Meta 分析的點估計(9.61%)而非置信限作為非劣效界值的參考具有一定的合理性,而且最終選擇的7%界值更為嚴格,如果試驗DEB 導管與對照DEB 導管相比DS%相差不超過7%,某種程度上試驗產品仍然是要“好于”裸球囊的治療效果。
雖然本研究借鑒了系統綜述和Meta 分析的部分方法對同品種產品進行了較為全面的文獻檢索,但并不是系統檢索,PubMed 作為業內最為權威的文獻數據庫,即使不能包括全部研究,但以其為基礎的檢索整理仍相對穩妥;為上市前醫療器械臨床試驗進行樣本量估算時,快速瀏覽尋找同品種產品的研究為上市前臨床試驗提供數據依據才是最重要的。另外,本研究屬于二次研究,研究結果的可靠性依賴于原始研究的設計和報告質量。最后,DEB導管治療冠狀動脈分支病變的研究中,主要評價指標的選擇本身也應具有充分依據,常用的造影替代指標包括DS%或節段內晚期管腔丟失等,不同試驗應該根據自身試驗特點由臨床專家選定,在這里就不贅述。
總而言之,樣本量估算是上市前確證性臨床試驗研究設計中的重要環節。針對不同的數據屬性(定性或定量),以及已知的臨床數據(主要指標),采用相應的估算公式或者借助相應的統計學軟件完成樣本量估算,看似是個統計學問題,實際需要臨床專家和統計師結合既往研究數據和臨床經驗,綜合考慮試驗預期規模、指標的預期大小和變異以及試驗成本等,優化工作量,用盡量少的精力得到想要的試驗結果。既往文獻的檢索和整合時,Meta 分析可以作為一種選擇,為樣本量計算時所使用的參數提供依據。
利益沖突:所有作者均聲明不存在利益沖突