最小臨床意義差值的確定和應(yīng)用

2022-03-29 08:11:16楊麗虹肖晶旻劉少南吳大嶸葛龍郭新峰

廣州中醫(yī)藥大學(xué)學(xué)報(bào) 2022年4期

楊麗虹，肖晶旻，劉少南，吳大嶸，葛龍，郭新峰

（1.廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院/廣東省中醫(yī)院，廣東廣州 510120；2.蘭州大學(xué)公共衛(wèi)生學(xué)院循證社會(huì)科學(xué)研究中心，甘肅蘭州 730000）

最小臨床意義差值（minimal clinically important difference，MCID）亦被稱為最小重要差值（minimal importance difference，MID），是指在沒(méi)有副作用和成本負(fù)擔(dān)的情況下，患者認(rèn)為有獲益的最小變化值[1-2]。MCID的提出為試驗(yàn)結(jié)果的臨床意義判斷、樣本量估算以及臨床決策等提供了依據(jù)。MCID常用的估算方法包括效標(biāo)法、分布法和文獻(xiàn)分析法等。效標(biāo)法通過(guò)分析目標(biāo)測(cè)量指標(biāo)與效標(biāo)之間的相關(guān)性，所得結(jié)果可結(jié)合臨床意義進(jìn)行解釋，但其估算過(guò)程中的樣本、效標(biāo)和統(tǒng)計(jì)方法的選擇等均可影響估算結(jié)果。分布法基于樣本數(shù)據(jù)特征或測(cè)量工具精確性等進(jìn)行估算，所得結(jié)果為標(biāo)化無(wú)量綱的指標(biāo)，可在不同人群和研究之間進(jìn)行比較，但其結(jié)果的臨床意義解釋存在難度。文獻(xiàn)分析法依賴于已發(fā)表的文獻(xiàn)，是對(duì)既往相關(guān)臨床研究的系統(tǒng)回顧和分析，可提供目標(biāo)測(cè)量指標(biāo)與臨床終點(diǎn)之間相關(guān)性的數(shù)據(jù)，為確定MCID提供依據(jù)。各種估算方法的細(xì)節(jié)、適用范圍及其利弊可參考《最小臨床意義差值的概念與估算方法》[3]。

MCID的不同估算方法各有優(yōu)缺點(diǎn)，估算結(jié)果有所差異，這對(duì)最終的MCID確定及其應(yīng)用帶來(lái)了困難。MCID的確定方法尚未有統(tǒng)一標(biāo)準(zhǔn)，故大部分研究同時(shí)采用多種方法進(jìn)行估算，通過(guò)不同策略對(duì)多個(gè)初始估算值進(jìn)行合并或選擇其一作為MCID。以下對(duì)如何整合多個(gè)MCID估算值或從中選擇最終的MCID值的方法、MCID的應(yīng)用及其注意事項(xiàng)、MCID評(píng)價(jià)工具的開(kāi)發(fā)等進(jìn)行分析，以期為臨床研究提供參考。

1 MCID的確定

MCID的確定可基于效標(biāo)法或效標(biāo)法結(jié)合分布法或綜合多種方法進(jìn)行。

1.1 基于效標(biāo)法確定MCID效標(biāo)法是通過(guò)關(guān)聯(lián)一個(gè)獨(dú)立的測(cè)量指標(biāo)即外部效標(biāo)來(lái)估算目標(biāo)測(cè)量指標(biāo)的MCID，而分布法是單純從統(tǒng)計(jì)角度基于樣本數(shù)據(jù)特征或測(cè)量工具精確性等進(jìn)行估算。主流觀點(diǎn)認(rèn)為基于分布法的估算結(jié)果對(duì)應(yīng)的是最小可測(cè)變化值（minimal detectable change，MDC），而不是MCID[4]。MDC是測(cè)量工具可以檢測(cè)到的最小變化，是對(duì)測(cè)量工具的可靠性評(píng)價(jià)[5]。而MCID是對(duì)評(píng)價(jià)結(jié)果的真實(shí)性評(píng)價(jià)。有學(xué)者[6-7]認(rèn)為兩者有本質(zhì)不同，不應(yīng)使用分布法的估算結(jié)果直接確定MCID。效標(biāo)法的結(jié)果更能給出合理的臨床解釋。但是，當(dāng)無(wú)法達(dá)到效標(biāo)的要求時(shí)，如效標(biāo)與目標(biāo)測(cè)量指標(biāo)之間的相關(guān)性較差甚至無(wú)相關(guān)性，應(yīng)放棄效標(biāo)法，采用其他方法做初步估算。

1.2 效標(biāo)法結(jié)合分布法確定MCID分布法估算出的區(qū)別于測(cè)量誤差的MDC可作為MCID選擇的參考范圍，故可采用分布法輔助效標(biāo)法確定MCID。目前普遍認(rèn)為MCID應(yīng)大于或等于MDC[8-10]，否則無(wú)法判斷該變化是存在真實(shí)變化或是測(cè)量誤差所引起的。當(dāng)效標(biāo)法初始估算值大于分布法估算值時(shí)（圖1-A），取前者作為MCID。當(dāng)分布法估算值大于效標(biāo)法初始估算值時(shí)（圖1-B），說(shuō)明該測(cè)量工具對(duì)于個(gè)體水平變化的測(cè)量不夠精確，取分布法估算值為MCID更為保守。

圖1 最小臨床意義差值（MCID）與最小可測(cè)變化值（MDC）的關(guān)系及其意義Figure 1 The relationship of minimal clinically important difference（MCID）and minimal detectable change（MDC）and their significance

另有學(xué)者提出需將多個(gè)估算結(jié)果合并以確定MCID。如Reddy V K等[10]提出取效標(biāo)法和分布法得出的全部估算值的均數(shù)來(lái)確定MCID；張傳猛[11]和陳銘揚(yáng)[12]則只取兩種方法得出的最大值和最小值的均數(shù)來(lái)確定MCID；許清安等[13]提出對(duì)效標(biāo)法和分布法的估算結(jié)果加權(quán)整合，并根據(jù)效應(yīng)值和測(cè)量工具的相關(guān)系數(shù)的大小選擇不同的估計(jì)值確定MCID；Yost K J等[14]提議，僅當(dāng)測(cè)量指標(biāo)的效應(yīng)值在0.2～0.5之間時(shí)才考慮將分布法估算的結(jié)果納入確定MCID的參考值，因?yàn)樵摲秶鷥?nèi)的效應(yīng)值認(rèn)為是最小效應(yīng)，并以分布法多個(gè)估算值的均數(shù)和效標(biāo)法估算值的均數(shù)確定MCID的范圍。

1.3 綜合多種方法確定MCIDRevicki D等[15]建議以效標(biāo)法為主，先參考文獻(xiàn)分析法和分布法的結(jié)果縮小MCID取值范圍，然后通過(guò)專家共識(shí)法最終確定一個(gè)MCID值或是更小的MCID區(qū)間。

2 中醫(yī)藥領(lǐng)域MCID的研究現(xiàn)狀

MCID不是測(cè)量工具的內(nèi)在特性，樣本特征和統(tǒng)計(jì)方法等的選擇都可導(dǎo)致其結(jié)果有所差別。基于西醫(yī)療效評(píng)價(jià)數(shù)據(jù)估算出來(lái)的MCID無(wú)法直接應(yīng)用在中醫(yī)藥的療效評(píng)價(jià)中，因此有必要運(yùn)用中醫(yī)藥療效評(píng)價(jià)的數(shù)據(jù)來(lái)確定中醫(yī)藥自己的MCID。中醫(yī)藥領(lǐng)域結(jié)局指標(biāo)的MCID研究尚處于起步狀態(tài)。

姚丹霓等[16]開(kāi)展了基于一項(xiàng)陽(yáng)性藥物作對(duì)照的隨機(jī)對(duì)照試驗(yàn)，分別采用效標(biāo)法和分布法估算耳穴貼壓治療尋常型銀屑病患者的皮膚病生活質(zhì)量指數(shù)（DLQI）的MCID。該研究以銀屑病皮損面積和嚴(yán)重程度指數(shù)（PASI）為效標(biāo)得出初始估計(jì)值為2.53，通過(guò)效應(yīng)值、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)測(cè)量誤差估算得到MDC為0.23~2.58。效標(biāo)法估算結(jié)果包含在分布法估算范圍中，結(jié)合臨床意義考慮，作者最終取效標(biāo)法估算結(jié)果2.53確定為耳穴貼壓治療尋常型銀屑病患者DLQI的MCID。路桃影等[17]采用中醫(yī)藥治療失眠患者的隨機(jī)對(duì)照試驗(yàn)數(shù)據(jù)計(jì)算匹茲堡睡眠質(zhì)量指數(shù)（PSQI）的MCID；以WHOQOL-Bref量表中第16個(gè)條目即個(gè)體關(guān)于睡眠情況的主觀感受為效標(biāo)，得出治療第29天初始估算值為1.93～2.90，以效應(yīng)值和標(biāo)準(zhǔn)測(cè)量誤差估算得到MDC為1.14～1.80。作者僅通過(guò)多種方法估算出PSQI的MCID初始值，但未確定其最終值或取值范圍。

3 MCID在臨床研究和臨床實(shí)踐中的應(yīng)用

3.1 研究結(jié)果的解釋臨床試驗(yàn)報(bào)告規(guī)范（CONSORT）強(qiáng)調(diào)，研究報(bào)告中下結(jié)論時(shí)應(yīng)考慮試驗(yàn)結(jié)果的臨床意義。Howard A F等[18]回顧了2016年以前發(fā)表的95篇兒童腫瘤的隨機(jī)對(duì)照試驗(yàn)，僅22.1%的研究結(jié)合了研究結(jié)果的臨床意義進(jìn)行結(jié)論推導(dǎo)，其中4.2%的研究給出了臨床意義判斷的依據(jù)。研究結(jié)果的臨床意義可以通過(guò)比較研究結(jié)果95%可信區(qū)間（95%CI）與MCID的關(guān)系進(jìn)行判斷。以正向指標(biāo)（數(shù)值越大，療效越好）為例，在樣本量充足且結(jié)果具有統(tǒng)計(jì)學(xué)意義的前提下，當(dāng)研究結(jié)果95%CI下限大于MCID時(shí)，該研究結(jié)果具有臨床意義（圖2-A）；當(dāng)95%CI上限小于MCID時(shí)，該研究結(jié)果不具有臨床意義（圖2-B）；當(dāng)95%CI下限小于MCID，但點(diǎn)估計(jì)值大于MCID時(shí)，該研究結(jié)果可能具有臨床意義（圖2-C）；在95%CI上限大于MCID，但其下限和點(diǎn)估計(jì)值均小于MCID時(shí)，則尚不能確定該研究結(jié)果是否具有臨床意義（圖2-D）[19-21]。

圖2 結(jié)合最小臨床意義差值（MCID）解釋研究結(jié)果臨床意義的示意圖Figure 2 Illustration of the clinical significance of the research results explained by comparing with MCID

例如，在采用可逆性間歇性腹內(nèi)迷走神經(jīng)阻滯術(shù)治療肥胖癥的雙盲隨機(jī)對(duì)照試驗(yàn)中，手術(shù)組平均體質(zhì)量減輕22.4%，假手術(shù)組平均體質(zhì)量減輕15.9%，組間差異為8.5%（95%CI[3.1%，13.9%]），差異具有統(tǒng)計(jì)學(xué)意義（P＜0.05）。但是差異的點(diǎn)估計(jì)值未達(dá)到項(xiàng)目預(yù)設(shè)的MCID（平均體質(zhì)量減輕10%）且95%CI跨越了MCID，故基于該研究的結(jié)果尚未能確定該手術(shù)治療肥胖癥患者是否具有臨床意義[22]。

在制定臨床指南過(guò)程中，需依據(jù)GRADE（Grading of Recommendations，Assessment，Devel?opment and Evaluations）標(biāo)準(zhǔn)對(duì)證據(jù)結(jié)果的精確性進(jìn)行評(píng)價(jià)，此時(shí)需首先判斷95%CI是否跨過(guò)推薦或不推薦的臨床決策閾值，MCID即可作為這個(gè)臨床決策閾值。如果95%CI跨過(guò)決策閾值，則判斷該結(jié)果的精確性不足，證據(jù)可能不具有臨床意義，需要對(duì)證據(jù)等級(jí)做降級(jí)處理[23]。

3.2 響應(yīng)者分析經(jīng)治療干預(yù)后，評(píng)價(jià)指標(biāo)變化達(dá)到MCID受試者定義的為響應(yīng)者。Cates C等[24]認(rèn)為研究結(jié)果臨床意義的判斷除了上述比較之外，還需結(jié)合如響應(yīng)者分析等反映個(gè)體響應(yīng)度的結(jié)果。均數(shù)差95%CI反映的是群體平均治療效應(yīng)有95%的概率落在該范圍，均數(shù)差95%CI上限未達(dá)到MCID，并不意味著95%的患者未達(dá)到MCID。在噻托溴銨治療慢性阻塞性肺疾病的系統(tǒng)評(píng)價(jià)中，與安慰劑相比，噻托溴銨治療后的圣喬治呼吸問(wèn)卷總分下降-2.89（95%CI[-3.35，-2.44]），差異具有統(tǒng)計(jì)學(xué)意義，但未達(dá)到該量表的MCID（-4）。依據(jù)95%CI與MCID的關(guān)系判斷，噻托溴銨治療慢性阻塞性肺疾病后患者生存質(zhì)量改善程度沒(méi)有達(dá)到臨床意義。Karner C等[25]對(duì)該系統(tǒng)評(píng)價(jià)納入的研究進(jìn)行響應(yīng)者分析，將經(jīng)治療后評(píng)分下降大于4分者定義為響應(yīng)者，結(jié)果顯示噻托溴銨的有效率優(yōu)于安慰劑（RR=1.25，95%CI[1.20，1.31]）。由于連續(xù)性變量轉(zhuǎn)換為二分類變量會(huì)損耗統(tǒng)計(jì)效能，Cates C等[24]不建議用響應(yīng)者分析代替95%CI與MCID比較作為臨床意義判斷的依據(jù)，但指出應(yīng)在群體結(jié)果的基礎(chǔ)上考慮不同個(gè)體對(duì)治療的反應(yīng)。

澳大利亞衛(wèi)生部發(fā)布的新藥/新適應(yīng)證申請(qǐng)指南中亦指出，在評(píng)價(jià)臨床試驗(yàn)時(shí)，除了根據(jù)研究結(jié)果是否大于或等于MCID以判斷其有效性外，還可采用響應(yīng)者分析并以累積分布函數(shù)的形式直觀展現(xiàn)[26]（見(jiàn)圖3）。

圖3 累積分布函數(shù)展現(xiàn)研究結(jié)果臨床意義示例Figure 3 Illustration of the clinical significance of the research results showed by cumulative distribution tunction

3.3 樣本量估算理論上可采用MCID作為樣本量估算的臨界值，包括優(yōu)效界值和非劣效界值。Gerlinger C等[27]通過(guò)3種方法估算視覺(jué)模擬量表評(píng)分評(píng)價(jià)子宮內(nèi)膜異位癥相關(guān)盆腔痛的MCID，3種方法的估算結(jié)果與既往同類非劣效試驗(yàn)中使用的非劣效界值相近，故而作者認(rèn)為在非劣效試驗(yàn)中可以使用MCID作為非劣效界值來(lái)計(jì)算樣本量。實(shí)際使用時(shí)，為了避免實(shí)際比對(duì)照療法差的新療法卻在統(tǒng)計(jì)分析中得到優(yōu)于對(duì)照療法的錯(cuò)誤結(jié)論，研究者們會(huì)較為保守地選擇小于MCID的數(shù)值，如以MCID的1/2或2/3作為非劣效界值[6]。

隨著系列臨床研究報(bào)告規(guī)范的發(fā)表，樣本量估算逐漸受到研究者重視，但目前也僅有少數(shù)的研究報(bào)告了樣本量估算參數(shù)確定的依據(jù)。文獻(xiàn)研究結(jié)果顯示，僅4.2%～11.0%的隨機(jī)對(duì)照試驗(yàn)采用MCID作為樣本量估算的依據(jù)并報(bào)告了該選擇的原因[18]。

3.4 個(gè)體療效預(yù)測(cè)和臨床決策支持目前MCID估算方法是基于群組數(shù)據(jù)，極少研究提供了個(gè)體水平的分析。由于不同個(gè)體對(duì)治療響應(yīng)的差異，未達(dá)到MCID的患者未必就沒(méi)有臨床獲益，反之亦然。因此基于群體數(shù)據(jù)的MCID不適合直接應(yīng)用于個(gè)體臨床決策。Stratford P W等[28]參考診斷試驗(yàn)的思路，計(jì)算樣本中達(dá)到MCID的患者比例作為驗(yàn)前概率，達(dá)到MCID的似然比為陽(yáng)性似然比，未達(dá)到MCID的似然比為陰性似然比，再算出達(dá)到和未達(dá)到MCID的驗(yàn)后概率，用于個(gè)體療效預(yù)測(cè)。如對(duì)226例腰背痛患者進(jìn)行治療后并隨訪，采用羅蘭莫里斯腰痛問(wèn)卷評(píng)分進(jìn)行評(píng)價(jià)療效。結(jié)果顯示經(jīng)治療后63%的患者達(dá)到MCID，陽(yáng)性似然比和陰性似然比分別為4.00和0.34，算出達(dá)到和未達(dá)到MCID的驗(yàn)后概率分別是87%和37%。依據(jù)驗(yàn)后概率可判斷，臨床特征與樣本人群相似的患者經(jīng)同一方案治療后，羅蘭莫里斯腰痛問(wèn)卷評(píng)分改善達(dá)到MCID者將有87%的概率具有臨床獲益，而未達(dá)到MCID者但具有臨床獲益的概率為37%。

4 應(yīng)用MCID存在的問(wèn)題及注意事項(xiàng)

4.1 MCID的適用范圍有限MCID是為了更好地解釋生活質(zhì)量量表和臨床療效問(wèn)卷等患者報(bào)告結(jié)局分值變化的臨床意義而提出的[1]。后續(xù)應(yīng)用擴(kuò)展到如6 min步行試驗(yàn)、摔倒率、肌鈣蛋白等生理功能指標(biāo)和實(shí)驗(yàn)室指標(biāo)[29-31]。但基于患者報(bào)告結(jié)局提出的MCID估算方法是否完全適用于生理功能和實(shí)驗(yàn)室指標(biāo)等的估算，仍有待評(píng)估和檢驗(yàn)。硬終點(diǎn)指標(biāo)死亡率和病死率以及臨床重要結(jié)局指標(biāo)如心腦血管事件等不需要確定MCID。死亡率和病死率若能減少1%，也同樣具有臨床意義。在確切存在統(tǒng)計(jì)學(xué)意義的前提下，應(yīng)用過(guò)程中更多的是衛(wèi)生經(jīng)濟(jì)學(xué)和資源等方面的考慮。故MCID通常更適用于患者報(bào)告結(jié)局和中間指標(biāo)或替代指標(biāo)的臨床意義解釋。

4.2 使用MCID時(shí)報(bào)告細(xì)節(jié)不詳因MCID并非測(cè)量工具的內(nèi)部特性，在估算過(guò)程中各個(gè)環(huán)節(jié)的多樣性決定了MCID的使用場(chǎng)景隨方法和樣本變化而不同。樣本人群的臨床特征（如疾病分期、嚴(yán)重程度、年齡、性別等）、干預(yù)措施、統(tǒng)計(jì)方法等都會(huì)影響MCID的結(jié)果。一個(gè)MCID無(wú)法適用于所有臨床場(chǎng)景。例如，基于早期糖尿病腎病研究確定尿蛋白的MCID可能不適用于晚期患者的臨床研究和臨床決策[32]。基于效標(biāo)法所得的MCID可以是組內(nèi)前后變化值，也可能是組間治療前后變化的差值[33-34]；前后變化值的這類MCID不應(yīng)用于作為組間治療差異的臨床意義判斷依據(jù)，而組間變化差值在使用時(shí)也需了解該MCID估算時(shí)對(duì)照組與本研究中的對(duì)照組是否同質(zhì)。目前存在上述兩類MCID無(wú)差別地用于評(píng)價(jià)組間差異和樣本量估算的應(yīng)用誤區(qū)。對(duì)此，在應(yīng)用MCID時(shí)必須了解其估算的方法和樣本的特征，方可判斷該MCID是否適用于目前開(kāi)展的研究或臨床場(chǎng)景。

澳大利亞衛(wèi)生部的新藥/新適用證申請(qǐng)指南中明確提出，提交的臨床試驗(yàn)材料中應(yīng)包括評(píng)價(jià)指標(biāo)的MCID及其估算方法、樣本特征、指標(biāo)定義等細(xì)節(jié)內(nèi)容，以評(píng)估該MCID應(yīng)用于這個(gè)試驗(yàn)的樣本量估算和/或結(jié)果判斷的適用性（表1）[35]。

表1 應(yīng)報(bào)告的最小臨床意義差值（MCID）細(xì)節(jié)Table 1 The details of MCID needing to be reported

4.3 缺少M(fèi)CID可信區(qū)間MCID一般報(bào)告形式是基于人群的點(diǎn)估計(jì)值，少數(shù)研究報(bào)告MCID的范圍，但是都缺少相應(yīng)的可信區(qū)間估計(jì)。在臨床應(yīng)用時(shí)可能存在把未達(dá)到MCID但實(shí)際有臨床獲益的療法錯(cuò)誤地評(píng)價(jià)為無(wú)效的風(fēng)險(xiǎn)[35]。

Johnston B C等[36]于2015年啟動(dòng)了MCID數(shù)據(jù)庫(kù)項(xiàng)目，系統(tǒng)收集基于效標(biāo)法估算的患者報(bào)告結(jié)局的MCID研究，并開(kāi)發(fā)MCID可信度評(píng)價(jià)工具。可信度定義為MCID研究的設(shè)計(jì)和實(shí)施方案可防止誤導(dǎo)性結(jié)果產(chǎn)生的程度。項(xiàng)目組初步擬定評(píng)價(jià)工具條目，通過(guò)與GRADE工作組、Cochrane協(xié)作網(wǎng)、WHO以及加拿大藥品與技術(shù)衛(wèi)生局等多個(gè)組織和機(jī)構(gòu)密切合作，邀請(qǐng)全球范圍內(nèi)參與過(guò)臨床試驗(yàn)、系統(tǒng)評(píng)價(jià)、患者報(bào)告結(jié)局開(kāi)發(fā)和臨床指南制定等的研究人員，開(kāi)展多輪專家咨詢。在MCID可信度評(píng)價(jià)工具達(dá)成共識(shí)后，對(duì)納入數(shù)據(jù)庫(kù)的MCID研究開(kāi)展可靠性評(píng)價(jià)：每個(gè)MCID研究由3名專家采用可行性分析工具進(jìn)行評(píng)價(jià)，通過(guò)二次加權(quán)Kappa系數(shù)計(jì)算評(píng)價(jià)者之間的可靠性（Kappa系數(shù)≥0.6為最低可接受水平，≥0.7判斷為評(píng)價(jià)者之間的可靠性良好）。項(xiàng)目的研究成果將整合到GRADEprofiler和MAGICapp（http://magicproject.org/magicapp/，MAGICapp是使用GRADE框架的指南和證據(jù)摘要來(lái)創(chuàng)建工具）以供研究者使用[37]。

基于以上分析可知，MCID更適用于患者報(bào)告結(jié)局和中間指標(biāo)或替代指標(biāo)的臨床意義解釋。而MCID的估算和確定方法尚未達(dá)成共識(shí)。臨床方法學(xué)家傾向于選擇容易從臨床專科角度解釋的效標(biāo)法，而支持分布法的統(tǒng)計(jì)學(xué)專家也認(rèn)識(shí)到分布法需要與其他臨床療效標(biāo)準(zhǔn)比較以提高其結(jié)果的臨床可解釋性[37]。目前各種估算方法均存在一定局限，建議同時(shí)使用多種估算方法獲得多個(gè)MCID初步估算值，并以效標(biāo)法為主，采用其他方法輔佐或?qū)⒍喾N方法通過(guò)統(tǒng)計(jì)整合的估算值來(lái)確定最終的MCID。MCID可協(xié)助進(jìn)行臨床研究結(jié)果的臨床意義判斷、樣本量估算以及臨床決策等，但建議在具體應(yīng)用之前，應(yīng)充分了解該MCID的估算方法和樣本特征。