楊麗虹,肖晶旻,劉少南,吳大嶸,葛龍,郭新峰
(1.廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院/廣東省中醫(yī)院,廣東廣州 510120;2.蘭州大學(xué)公共衛(wèi)生學(xué)院循證社會(huì)科學(xué)研究中心,甘肅蘭州 730000)
最小臨床意義差值(minimal clinically important difference,MCID)亦被稱為最小重要差值(minimal importance difference,MID),是指在沒(méi)有副作用和成本負(fù)擔(dān)的情況下,患者認(rèn)為有獲益的最小變化值[1-2]。MCID的提出為試驗(yàn)結(jié)果的臨床意義判斷、樣本量估算以及臨床決策等提供了依據(jù)。MCID常用的估算方法包括效標(biāo)法、分布法和文獻(xiàn)分析法等。效標(biāo)法通過(guò)分析目標(biāo)測(cè)量指標(biāo)與效標(biāo)之間的相關(guān)性,所得結(jié)果可結(jié)合臨床意義進(jìn)行解釋,但其估算過(guò)程中的樣本、效標(biāo)和統(tǒng)計(jì)方法的選擇等均可影響估算結(jié)果。分布法基于樣本數(shù)據(jù)特征或測(cè)量工具精確性等進(jìn)行估算,所得結(jié)果為標(biāo)化無(wú)量綱的指標(biāo),可在不同人群和研究之間進(jìn)行比較,但其結(jié)果的臨床意義解釋存在難度。文獻(xiàn)分析法依賴于已發(fā)表的文獻(xiàn),是對(duì)既往相關(guān)臨床研究的系統(tǒng)回顧和分析,可提供目標(biāo)測(cè)量指標(biāo)與臨床終點(diǎn)之間相關(guān)性的數(shù)據(jù),為確定MCID提供依據(jù)。各種估算方法的細(xì)節(jié)、適用范圍及其利弊可參考《最小臨床意義差值的概念與估算方法》[3]。
MCID的不同估算方法各有優(yōu)缺點(diǎn),估算結(jié)果有所差異,這對(duì)最終的MCID確定及其應(yīng)用帶來(lái)了困難。MCID的確定方法尚未有統(tǒng)一標(biāo)準(zhǔn),故大部分研究同時(shí)采用多種方法進(jìn)行估算,通過(guò)不同策略對(duì)多個(gè)初始估算值進(jìn)行合并或選擇其一作為MCID。以下對(duì)如何整合多個(gè)MCID估算值或從中選擇最終的MCID值的方法、MCID的應(yīng)用及其注意事項(xiàng)、MCID評(píng)價(jià)工具的開(kāi)發(fā)等進(jìn)行分析,以期為臨床研究提供參考。
MCID的確定可基于效標(biāo)法或效標(biāo)法結(jié)合分布法或綜合多種方法進(jìn)行。
1.1 基于效標(biāo)法確定MCID效標(biāo)法是通過(guò)關(guān)聯(lián)一個(gè)獨(dú)立的測(cè)量指標(biāo)即外部效標(biāo)來(lái)估算目標(biāo)測(cè)量指標(biāo)的MCID,而分布法是單純從統(tǒng)計(jì)角度基于樣本數(shù)據(jù)特征或測(cè)量工具精確性等進(jìn)行估算。主流觀點(diǎn)認(rèn)為基于分布法的估算結(jié)果對(duì)應(yīng)的是最小可測(cè)變化值(minimal detectable change,MDC),而不是MCID[4]。MDC是測(cè)量工具可以檢測(cè)到的最小變化,是對(duì)測(cè)量工具的可靠性評(píng)價(jià)[5]。而MCID是對(duì)評(píng)價(jià)結(jié)果的真實(shí)性評(píng)價(jià)。有學(xué)者[6-7]認(rèn)為兩者有本質(zhì)不同,不應(yīng)使用分布法的估算結(jié)果直接確定MCID。效標(biāo)法的結(jié)果更能給出合理的臨床解釋。但是,當(dāng)無(wú)法達(dá)到效標(biāo)的要求時(shí),如效標(biāo)與目標(biāo)測(cè)量指標(biāo)之間的相關(guān)性較差甚至無(wú)相關(guān)性,應(yīng)放棄效標(biāo)法,采用其他方法做初步估算。
1.2 效標(biāo)法結(jié)合分布法確定MCID分布法估算出的區(qū)別于測(cè)量誤差的MDC可作為MCID選擇的參考范圍,故可采用分布法輔助效標(biāo)法確定MCID。目前普遍認(rèn)為MCID應(yīng)大于或等于MDC[8-10],否則無(wú)法判斷該變化是存在真實(shí)變化或是測(cè)量誤差所引起的。當(dāng)效標(biāo)法初始估算值大于分布法估算值時(shí)(圖1-A),取前者作為MCID。當(dāng)分布法估算值大于效標(biāo)法初始估算值時(shí)(圖1-B),說(shuō)明該測(cè)量工具對(duì)于個(gè)體水平變化的測(cè)量不夠精確,取分布法估算值為MCID更為保守。

圖1 最小臨床意義差值(MCID)與最小可測(cè)變化值(MDC)的關(guān)系及其意義Figure 1 The relationship of minimal clinically important difference(MCID)and minimal detectable change(MDC)and their significance
另有學(xué)者提出需將多個(gè)估算結(jié)果合并以確定MCID。如Reddy V K等[10]提出取效標(biāo)法和分布法得出的全部估算值的均數(shù)來(lái)確定MCID;張傳猛[11]和陳銘揚(yáng)[12]則只取兩種方法得出的最大值和最小值的均數(shù)來(lái)確定MCID;許清安等[13]提出對(duì)效標(biāo)法和分布法的估算結(jié)果加權(quán)整合,并根據(jù)效應(yīng)值和測(cè)量工具的相關(guān)系數(shù)的大小選擇不同的估計(jì)值確定MCID;Yost K J等[14]提議,僅當(dāng)測(cè)量指標(biāo)的效應(yīng)值在0.2~0.5之間時(shí)才考慮將分布法估算的結(jié)果納入確定MCID的參考值,因?yàn)樵摲秶鷥?nèi)的效應(yīng)值認(rèn)為是最小效應(yīng),并以分布法多個(gè)估算值的均數(shù)和效標(biāo)法估算值的均數(shù)確定MCID的范圍。
1.3 綜合多種方法確定MCIDRevicki D等[15]建議以效標(biāo)法為主,先參考文獻(xiàn)分析法和分布法的結(jié)果縮小MCID取值范圍,然后通過(guò)專家共識(shí)法最終確定一個(gè)MCID值或是更小的MCID區(qū)間。
MCID不是測(cè)量工具的內(nèi)在特性,樣本特征和統(tǒng)計(jì)方法等的選擇都可導(dǎo)致其結(jié)果有所差別。基于西醫(yī)療效評(píng)價(jià)數(shù)據(jù)估算出來(lái)的MCID無(wú)法直接應(yīng)用在中醫(yī)藥的療效評(píng)價(jià)中,因此有必要運(yùn)用中醫(yī)藥療效評(píng)價(jià)的數(shù)據(jù)來(lái)確定中醫(yī)藥自己的MCID。中醫(yī)藥領(lǐng)域結(jié)局指標(biāo)的MCID研究尚處于起步狀態(tài)。
姚丹霓等[16]開(kāi)展了基于一項(xiàng)陽(yáng)性藥物作對(duì)照的隨機(jī)對(duì)照試驗(yàn),分別采用效標(biāo)法和分布法估算耳穴貼壓治療尋常型銀屑病患者的皮膚病生活質(zhì)量指數(shù)(DLQI)的MCID。該研究以銀屑病皮損面積和嚴(yán)重程度指數(shù)(PASI)為效標(biāo)得出初始估計(jì)值為2.53,通過(guò)效應(yīng)值、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)測(cè)量誤差估算得到MDC為0.23~2.58。效標(biāo)法估算結(jié)果包含在分布法估算范圍中,結(jié)合臨床意義考慮,作者最終取效標(biāo)法估算結(jié)果2.53確定為耳穴貼壓治療尋常型銀屑病患者DLQI的MCID。路桃影等[17]采用中醫(yī)藥治療失眠患者的隨機(jī)對(duì)照試驗(yàn)數(shù)據(jù)計(jì)算匹茲堡睡眠質(zhì)量指數(shù)(PSQI)的MCID;以WHOQOL-Bref量表中第16個(gè)條目即個(gè)體關(guān)于睡眠情況的主觀感受為效標(biāo),得出治療第29天初始估算值為1.93~2.90,以效應(yīng)值和標(biāo)準(zhǔn)測(cè)量誤差估算得到MDC為1.14~1.80。作者僅通過(guò)多種方法估算出PSQI的MCID初始值,但未確定其最終值或取值范圍。
3.1 研究結(jié)果的解釋臨床試驗(yàn)報(bào)告規(guī)范(CONSORT)強(qiáng)調(diào),研究報(bào)告中下結(jié)論時(shí)應(yīng)考慮試驗(yàn)結(jié)果的臨床意義。Howard A F等[18]回顧了2016年以前發(fā)表的95篇兒童腫瘤的隨機(jī)對(duì)照試驗(yàn),僅22.1%的研究結(jié)合了研究結(jié)果的臨床意義進(jìn)行結(jié)論推導(dǎo),其中4.2%的研究給出了臨床意義判斷的依據(jù)。研究結(jié)果的臨床意義可以通過(guò)比較研究結(jié)果95%可信區(qū)間(95%CI)與MCID的關(guān)系進(jìn)行判斷。以正向指標(biāo)(數(shù)值越大,療效越好)為例,在樣本量充足且結(jié)果具有統(tǒng)計(jì)學(xué)意義的前提下,當(dāng)研究結(jié)果95%CI下限大于MCID時(shí),該研究結(jié)果具有臨床意義(圖2-A);當(dāng)95%CI上限小于MCID時(shí),該研究結(jié)果不具有臨床意義(圖2-B);當(dāng)95%CI下限小于MCID,但點(diǎn)估計(jì)值大于MCID時(shí),該研究結(jié)果可能具有臨床意義(圖2-C);在95%CI上限大于MCID,但其下限和點(diǎn)估計(jì)值均小于MCID時(shí),則尚不能確定該研究結(jié)果是否具有臨床意義(圖2-D)[19-21]。

圖2 結(jié)合最小臨床意義差值(MCID)解釋研究結(jié)果臨床意義的示意圖Figure 2 Illustration of the clinical significance of the research results explained by comparing with MCID
例如,在采用可逆性間歇性腹內(nèi)迷走神經(jīng)阻滯術(shù)治療肥胖癥的雙盲隨機(jī)對(duì)照試驗(yàn)中,手術(shù)組平均體質(zhì)量減輕22.4%,假手術(shù)組平均體質(zhì)量減輕15.9%,組間差異為8.5%(95%CI[3.1%,13.9%]),差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)。但是差異的點(diǎn)估計(jì)值未達(dá)到項(xiàng)目預(yù)設(shè)的MCID(平均體質(zhì)量減輕10%)且95%CI跨越了MCID,故基于該研究的結(jié)果尚未能確定該手術(shù)治療肥胖癥患者是否具有臨床意義[22]。
在制定臨床指南過(guò)程中,需依據(jù)GRADE(Grading of Recommendations,Assessment,Devel?opment and Evaluations)標(biāo)準(zhǔn)對(duì)證據(jù)結(jié)果的精確性進(jìn)行評(píng)價(jià),此時(shí)需首先判斷95%CI是否跨過(guò)推薦或不推薦的臨床決策閾值,MCID即可作為這個(gè)臨床決策閾值。如果95%CI跨過(guò)決策閾值,則判斷該結(jié)果的精確性不足,證據(jù)可能不具有臨床意義,需要對(duì)證據(jù)等級(jí)做降級(jí)處理[23]。
3.2 響應(yīng)者分析經(jīng)治療干預(yù)后,評(píng)價(jià)指標(biāo)變化達(dá)到MCID受試者定義的為響應(yīng)者。Cates C等[24]認(rèn)為研究結(jié)果臨床意義的判斷除了上述比較之外,還需結(jié)合如響應(yīng)者分析等反映個(gè)體響應(yīng)度的結(jié)果。均數(shù)差95%CI反映的是群體平均治療效應(yīng)有95%的概率落在該范圍,均數(shù)差95%CI上限未達(dá)到MCID,并不意味著95%的患者未達(dá)到MCID。在噻托溴銨治療慢性阻塞性肺疾病的系統(tǒng)評(píng)價(jià)中,與安慰劑相比,噻托溴銨治療后的圣喬治呼吸問(wèn)卷總分下降-2.89(95%CI[-3.35,-2.44]),差異具有統(tǒng)計(jì)學(xué)意義,但未達(dá)到該量表的MCID(-4)。依據(jù)95%CI與MCID的關(guān)系判斷,噻托溴銨治療慢性阻塞性肺疾病后患者生存質(zhì)量改善程度沒(méi)有達(dá)到臨床意義。Karner C等[25]對(duì)該系統(tǒng)評(píng)價(jià)納入的研究進(jìn)行響應(yīng)者分析,將經(jīng)治療后評(píng)分下降大于4分者定義為響應(yīng)者,結(jié)果顯示噻托溴銨的有效率優(yōu)于安慰劑(RR=1.25,95%CI[1.20,1.31])。由于連續(xù)性變量轉(zhuǎn)換為二分類變量會(huì)損耗統(tǒng)計(jì)效能,Cates C等[24]不建議用響應(yīng)者分析代替95%CI與MCID比較作為臨床意義判斷的依據(jù),但指出應(yīng)在群體結(jié)果的基礎(chǔ)上考慮不同個(gè)體對(duì)治療的反應(yīng)。
澳大利亞衛(wèi)生部發(fā)布的新藥/新適應(yīng)證申請(qǐng)指南中亦指出,在評(píng)價(jià)臨床試驗(yàn)時(shí),除了根據(jù)研究結(jié)果是否大于或等于MCID以判斷其有效性外,還可采用響應(yīng)者分析并以累積分布函數(shù)的形式直觀展現(xiàn)[26](見(jiàn)圖3)。

圖3 累積分布函數(shù)展現(xiàn)研究結(jié)果臨床意義示例Figure 3 Illustration of the clinical significance of the research results showed by cumulative distribution tunction
3.3 樣本量估算理論上可采用MCID作為樣本量估算的臨界值,包括優(yōu)效界值和非劣效界值。Gerlinger C等[27]通過(guò)3種方法估算視覺(jué)模擬量表評(píng)分評(píng)價(jià)子宮內(nèi)膜異位癥相關(guān)盆腔痛的MCID,3種方法的估算結(jié)果與既往同類非劣效試驗(yàn)中使用的非劣效界值相近,故而作者認(rèn)為在非劣效試驗(yàn)中可以使用MCID作為非劣效界值來(lái)計(jì)算樣本量。實(shí)際使用時(shí),為了避免實(shí)際比對(duì)照療法差的新療法卻在統(tǒng)計(jì)分析中得到優(yōu)于對(duì)照療法的錯(cuò)誤結(jié)論,研究者們會(huì)較為保守地選擇小于MCID的數(shù)值,如以MCID的1/2或2/3作為非劣效界值[6]。
隨著系列臨床研究報(bào)告規(guī)范的發(fā)表,樣本量估算逐漸受到研究者重視,但目前也僅有少數(shù)的研究報(bào)告了樣本量估算參數(shù)確定的依據(jù)。文獻(xiàn)研究結(jié)果顯示,僅4.2%~11.0%的隨機(jī)對(duì)照試驗(yàn)采用MCID作為樣本量估算的依據(jù)并報(bào)告了該選擇的原因[18]。
3.4 個(gè)體療效預(yù)測(cè)和臨床決策支持目前MCID估算方法是基于群組數(shù)據(jù),極少研究提供了個(gè)體水平的分析。由于不同個(gè)體對(duì)治療響應(yīng)的差異,未達(dá)到MCID的患者未必就沒(méi)有臨床獲益,反之亦然。因此基于群體數(shù)據(jù)的MCID不適合直接應(yīng)用于個(gè)體臨床決策。Stratford P W等[28]參考診斷試驗(yàn)的思路,計(jì)算樣本中達(dá)到MCID的患者比例作為驗(yàn)前概率,達(dá)到MCID的似然比為陽(yáng)性似然比,未達(dá)到MCID的似然比為陰性似然比,再算出達(dá)到和未達(dá)到MCID的驗(yàn)后概率,用于個(gè)體療效預(yù)測(cè)。如對(duì)226例腰背痛患者進(jìn)行治療后并隨訪,采用羅蘭莫里斯腰痛問(wèn)卷評(píng)分進(jìn)行評(píng)價(jià)療效。結(jié)果顯示經(jīng)治療后63%的患者達(dá)到MCID,陽(yáng)性似然比和陰性似然比分別為4.00和0.34,算出達(dá)到和未達(dá)到MCID的驗(yàn)后概率分別是87%和37%。依據(jù)驗(yàn)后概率可判斷,臨床特征與樣本人群相似的患者經(jīng)同一方案治療后,羅蘭莫里斯腰痛問(wèn)卷評(píng)分改善達(dá)到MCID者將有87%的概率具有臨床獲益,而未達(dá)到MCID者但具有臨床獲益的概率為37%。
4.1 MCID的適用范圍有限MCID是為了更好地解釋生活質(zhì)量量表和臨床療效問(wèn)卷等患者報(bào)告結(jié)局分值變化的臨床意義而提出的[1]。后續(xù)應(yīng)用擴(kuò)展到如6 min步行試驗(yàn)、摔倒率、肌鈣蛋白等生理功能指標(biāo)和實(shí)驗(yàn)室指標(biāo)[29-31]。但基于患者報(bào)告結(jié)局提出的MCID估算方法是否完全適用于生理功能和實(shí)驗(yàn)室指標(biāo)等的估算,仍有待評(píng)估和檢驗(yàn)。硬終點(diǎn)指標(biāo)死亡率和病死率以及臨床重要結(jié)局指標(biāo)如心腦血管事件等不需要確定MCID。死亡率和病死率若能減少1%,也同樣具有臨床意義。在確切存在統(tǒng)計(jì)學(xué)意義的前提下,應(yīng)用過(guò)程中更多的是衛(wèi)生經(jīng)濟(jì)學(xué)和資源等方面的考慮。故MCID通常更適用于患者報(bào)告結(jié)局和中間指標(biāo)或替代指標(biāo)的臨床意義解釋。
4.2 使用MCID時(shí)報(bào)告細(xì)節(jié)不詳因MCID并非測(cè)量工具的內(nèi)部特性,在估算過(guò)程中各個(gè)環(huán)節(jié)的多樣性決定了MCID的使用場(chǎng)景隨方法和樣本變化而不同。樣本人群的臨床特征(如疾病分期、嚴(yán)重程度、年齡、性別等)、干預(yù)措施、統(tǒng)計(jì)方法等都會(huì)影響MCID的結(jié)果。一個(gè)MCID無(wú)法適用于所有臨床場(chǎng)景。例如,基于早期糖尿病腎病研究確定尿蛋白的MCID可能不適用于晚期患者的臨床研究和臨床決策[32]。基于效標(biāo)法所得的MCID可以是組內(nèi)前后變化值,也可能是組間治療前后變化的差值[33-34];前后變化值的這類MCID不應(yīng)用于作為組間治療差異的臨床意義判斷依據(jù),而組間變化差值在使用時(shí)也需了解該MCID估算時(shí)對(duì)照組與本研究中的對(duì)照組是否同質(zhì)。目前存在上述兩類MCID無(wú)差別地用于評(píng)價(jià)組間差異和樣本量估算的應(yīng)用誤區(qū)。對(duì)此,在應(yīng)用MCID時(shí)必須了解其估算的方法和樣本的特征,方可判斷該MCID是否適用于目前開(kāi)展的研究或臨床場(chǎng)景。
澳大利亞衛(wèi)生部的新藥/新適用證申請(qǐng)指南中明確提出,提交的臨床試驗(yàn)材料中應(yīng)包括評(píng)價(jià)指標(biāo)的MCID及其估算方法、樣本特征、指標(biāo)定義等細(xì)節(jié)內(nèi)容,以評(píng)估該MCID應(yīng)用于這個(gè)試驗(yàn)的樣本量估算和/或結(jié)果判斷的適用性(表1)[35]。

表1 應(yīng)報(bào)告的最小臨床意義差值(MCID)細(xì)節(jié)Table 1 The details of MCID needing to be reported
4.3 缺少M(fèi)CID可信區(qū)間MCID一般報(bào)告形式是基于人群的點(diǎn)估計(jì)值,少數(shù)研究報(bào)告MCID的范圍,但是都缺少相應(yīng)的可信區(qū)間估計(jì)。在臨床應(yīng)用時(shí)可能存在把未達(dá)到MCID但實(shí)際有臨床獲益的療法錯(cuò)誤地評(píng)價(jià)為無(wú)效的風(fēng)險(xiǎn)[35]。
Johnston B C等[36]于2015年啟動(dòng)了MCID數(shù)據(jù)庫(kù)項(xiàng)目,系統(tǒng)收集基于效標(biāo)法估算的患者報(bào)告結(jié)局的MCID研究,并開(kāi)發(fā)MCID可信度評(píng)價(jià)工具。可信度定義為MCID研究的設(shè)計(jì)和實(shí)施方案可防止誤導(dǎo)性結(jié)果產(chǎn)生的程度。項(xiàng)目組初步擬定評(píng)價(jià)工具條目,通過(guò)與GRADE工作組、Cochrane協(xié)作網(wǎng)、WHO以及加拿大藥品與技術(shù)衛(wèi)生局等多個(gè)組織和機(jī)構(gòu)密切合作,邀請(qǐng)全球范圍內(nèi)參與過(guò)臨床試驗(yàn)、系統(tǒng)評(píng)價(jià)、患者報(bào)告結(jié)局開(kāi)發(fā)和臨床指南制定等的研究人員,開(kāi)展多輪專家咨詢。在MCID可信度評(píng)價(jià)工具達(dá)成共識(shí)后,對(duì)納入數(shù)據(jù)庫(kù)的MCID研究開(kāi)展可靠性評(píng)價(jià):每個(gè)MCID研究由3名專家采用可行性分析工具進(jìn)行評(píng)價(jià),通過(guò)二次加權(quán)Kappa系數(shù)計(jì)算評(píng)價(jià)者之間的可靠性(Kappa系數(shù)≥0.6為最低可接受水平,≥0.7判斷為評(píng)價(jià)者之間的可靠性良好)。項(xiàng)目的研究成果將整合到GRADEprofiler和MAGICapp(http://magicproject.org/magicapp/,MAGICapp是使用GRADE框架的指南和證據(jù)摘要來(lái)創(chuàng)建工具)以供研究者使用[37]。
基于以上分析可知,MCID更適用于患者報(bào)告結(jié)局和中間指標(biāo)或替代指標(biāo)的臨床意義解釋。而MCID的估算和確定方法尚未達(dá)成共識(shí)。臨床方法學(xué)家傾向于選擇容易從臨床專科角度解釋的效標(biāo)法,而支持分布法的統(tǒng)計(jì)學(xué)專家也認(rèn)識(shí)到分布法需要與其他臨床療效標(biāo)準(zhǔn)比較以提高其結(jié)果的臨床可解釋性[37]。目前各種估算方法均存在一定局限,建議同時(shí)使用多種估算方法獲得多個(gè)MCID初步估算值,并以效標(biāo)法為主,采用其他方法輔佐或?qū)⒍喾N方法通過(guò)統(tǒng)計(jì)整合的估算值來(lái)確定最終的MCID。MCID可協(xié)助進(jìn)行臨床研究結(jié)果的臨床意義判斷、樣本量估算以及臨床決策等,但建議在具體應(yīng)用之前,應(yīng)充分了解該MCID的估算方法和樣本特征。