何朝凱 ,劉春香 ,王輝 ,張俊華
(1.天津中醫藥大學循證醫學中心,天津 301617;2.中國醫學科學院北京協和醫院,北京 100730)
目前,在醫療、護理、康復、營養以及精神衛生等健康領域的臨床研究中普遍存在結局指標選擇、測量和報告不一致、不實用性、不規范性等問題,甚至一些至關重要的結果可能被低估或完全忽視[1-6]。為了得到實用性、可靠性更高的研究結果,使之成為患者、醫療健康專業者和衛生政策制定者等決策時的重要參考依據,研究者在進行臨床試驗和系統評價時需要高度重視結局指標報告的規范化[7]。
核心指標集(COS)是一組關于健康衛生行業中特定領域的所有臨床試驗被要求測量和報告的最少化、共識化的指標集合[8]。COS研究通過候選條目產生、兩輪Delphi問卷調查、舉辦多方共識會議這3個階段與18條最基本的報告條目要求來產生標準化的指標集合,從而在臨床研究結局指標的選擇和報告上達成共識[9],以提高同類研究指標的一致性和實用性[10],避免同類研究結果因異質性無法進行合并與比較所造成的不必要的資源浪費[11-12]。
中醫藥臨床研究的結局指標問題同樣較多,且有一定的特殊性,迫切需要探索形成符合自身特點的COS[13-14]。本研究采用COS研究的方法,通過對近5年中醫藥治療乳腺癌隨機對照試驗(RCT)進行收集,分析研究報告的結局指標及存在的問題,為構建中醫藥防治乳腺癌核心指標集奠定基礎。
1.1 納入與排除標準
1.1.1 納入標準 1)研究類型:隨機對照試驗,語言限定為英文和中文。2)患者類型:明確符合乳腺癌診斷標準的患者,不受乳腺癌病理類型、乳腺癌臨床分期、病程、年齡、種族和地域的限制。3)干預措施:觀察組單獨或聯合使用中醫藥相關療法,包括中藥方劑和中成藥,對照措施不進行限制。4)結局指標:提取納入研究中報告的所有結局指標。
1.1.2 排除標準 1)合并其他疾病的研究。2)以針灸、推拿、中藥熏洗、穴位注射、穴位貼敷等為干預措施的研究。3)學位論文。4)綜述性文章。5)重復發表的研究。
1.2 文獻檢索 采用自由詞和主題詞結合的方式 檢 索 Cochrane Library、Pubmed、Embase、Web of Science、SinoMed、萬方數據和中國知網(CNKI)數據庫。檢索時間為2014年1月—2019年10月。中文檢索詞為“乳腺癌”“乳腺腫瘤”“臨床試驗”“臨床研究”“臨床觀察”“臨床評價”“臨床調查”“隨機對照試驗”“中醫”“中藥”等。英文檢索詞為“Breast Neoplasms”“Breast Cancer”“Breast Tumor”“Traditional Chinese Medicine”“herbal medicine”“zhongyi”“zhongyao”“Clinical Trial”“Randomized Controlled Trial”等。
1.3 文獻篩選與資料提取 由兩名評價者獨立閱讀題目和摘要,排除明顯不符合納入標準的研究,對可能符合納入標準的研究閱讀全文,確定是否納入,并提取資料,交叉核對。如遇分歧,經討論解決。
采用預先設計的Excel表格對納入文獻進行資料提取,主要內容包括:1)研究的基本信息,包括題目、第一作者、發表年限、發表期刊等。2)研究對象的基線情況,包括人口學特征如例數、年齡,以及臨床特征如病理分型、臨床分期、病程、中醫證型等。3)干預措施,包括藥物名稱、療程、頻次、用量等。4)結局指標及其測量方法和評價時間點。
2.1 文獻篩選流程 根據檢索策略初檢獲得10202篇相關文獻,刪除重復文獻后,根據納入排除標準,經篩選后最終納入112篇文獻,其中中文110篇,英文2篇。見圖1。

圖1 文獻篩選流程Fig.1 Literature screening flow
2.2 納入研究的基本特征
2.2.1 樣本量 112個RCT研究中共包含9 430例患者,其中觀察組4 738例,對照組4 692例,年齡范圍17~80歲。樣本量范圍為20~620例,研究的平均樣本量為84例。
2.2.2 病程 共有23個(23/112,21%)研究報告了病程,具體病程為0~25年,89個研究未報告病程。
2.2.3 病理分型 共53個(53/112,47%)研究報告了乳腺癌患者的病理分型,主要包括乳頭狀癌、髓樣癌、小管癌、黏液腺癌、鱗狀細胞癌、浸潤性導管癌、浸潤性小葉癌和腺癌等。
2.2.4 臨床分期 65個(65/112,58%)研究報告了具體臨床分期,根據國際抗癌聯盟(UICC)和美國癌癥聯合會(AJCC)聯合制定的乳腺癌TNM分期法分為Ⅰ~Ⅳ期。
2.2.5 中醫證型 報告中醫證型的研究共25個(25/112,22%),包括氣陰兩虛、氣血兩虛、正氣虧虛、中陽氣虛、氣虛、血虛、腎虛、腎陰虛、肝腎陰虛、肝郁痰凝、肝瘀痰凝、肝郁脾虛、肝郁氣滯、瘀毒蘊結、沖任失調、正虛毒熾、心脾兩虛、脾虛痰濕、脾胃虛弱、脾胃濕熱、脾胃虛寒,共21種證型。
2.2.6 干預措施 干預措施分為中藥湯劑和中成藥兩種類型,分別有62個和49個研究,另有1項研究采用湯劑結合中成藥療法。其中中成藥22個為注射液,28個為口服制劑。
2.2.7 療程 除5個研究未報告療程相關信息外,其余107項RCT均報告試驗療程。療程為7 d~5年,具體分布為:療程≤2周有3個(2.6%),療程2~4周有7個(6.3%),療程4~8周有34個(30.4%),療程8周~6個月有53個(47.3%),療程6個月以上共10個(8.9%)。
2.3 結局指標
2.3.1 指標域 納入研究報告的所有結局指標共61項,單個研究報告的最少結局指標為1個,最多為7個,每項研究平均報告3個。根據指標的功能屬性,將納入研究的所有結局指標歸類為臨床療效、中醫癥狀/證候、癥狀體征、理化檢測、生活質量、遠期預后、經濟學評估和安全性事件8個域。見圖2。

圖2 指標域Fig.2 Outcome measures field
2.3.2 指標頻次 在所有納入文獻中,結局指標使用率排前15位的依次為:臨床療效、不良反應、生活質量、腫瘤標志物、生存情況、免疫功能指標、安全性評價、復發轉移情況、中醫證候積分、中醫證候療效、中醫癥狀積分、血管生成指標、體力狀況、骨髓抑制、睡眠質量。見表1。

表1 使用率排前15位的結局指標Tab.1 Top 15 indicators of utilization rate
其中,臨床療效的評價標準以世界衛生組織擬定的實體瘤客觀評價標準為依據,主要分為完全緩解(CR)、部分緩解(PR)、穩定(SD)、進展(PD),臨床受益率=CR+PR+SD。
2.3.3 指標組合 結局指標組合使用情況的統計結果顯示,有10個研究同時使用臨床療效、不良反應、生活質量3個指標;有4個研究同時使用臨床療效、不良反應兩個指標;有4個研究同時使用臨床療效、不良反應、安全性評價3個指標;有3個研究同時使用臨床療效、不良反應、免疫功能3個指標。具體的結局指標組合類型多達82種。不同指標組合使用頻數詳見開放科學(資源服務)標識碼(OSID)。
2.3.4 測量時間點 頻次排列前5位的有效性指標測量時間點如下。1)臨床療效:83項研究采用臨床療效指標,測量的時間點共14個,3項研究未報告時間點,其中20個研究(24.1%)選擇在治療6周后測量,15個研究(18.1%)為治療12周后測量,12個研究(14.5%)為治療8周后測量,10個研究(12.0%)為治療9周后測量。2)腫瘤標志物:26項研究共報告9個測量時間點,9個研究(34.6%)選擇在治療6周后測量,其次為治療9周后(5/26,19.2%)。3)免疫功能指標:22項研究共9個測量時間點,以治療6周后進行測量的最多(6/22,27.3%),其次為9周(4/22,18.2%)。4)中醫證候積分:8個研究選擇了中醫證候積分指標,2項(25%)研究在治療6周后進行測量。5)中醫證候療效:8個研究選擇了中醫證候療效指標,2項(25%)研究在治療6周后進行測量,另有2項(25%)研究在治療9周后進行測量。詳見OSID。
有學者在對中醫藥治療心絞痛臨床試驗COS研究中指出,原始研究所報告的結局指標存在差異性大、不規范和不實用等問題[13,15]。本研究中同樣發現相似的問題,但以指標組合過于隨意、指標測量方法差異性大和指標報告不規范這3個問題更為突出。
本研究在對中醫藥治療乳腺癌隨機對照試驗的結局指標分類整理過程中發現,原始研究在選擇和報告結局指標時主要存在以下6個方面的問題。
1)缺乏終點指標,臨床實用性不強。對于腫瘤的療效評價,最具臨床價值的指標是預后,而現有研究中過多的中間指標被研究者所使用,缺少對生存期等的報告。本研究中,僅17項(15.2%)納入研究報告了患者生存期,10項(8.9%)報告了生存率,2項(1.8%)報告了死亡情況。
2)指標組合過于隨意。在112個RCT中就出現了多達82種不同的指標組合類型,組合條目有2~7條不等,隨意性較大。其中,僅4個指標組合使用的類型就有29種,且在所有組合類型中單個組合的使用頻次普遍不高。如使用頻次最高的臨床療效、不良反應、生活質量這一組合指標僅為10次,其余大多為1次。
3)同一指標的測量時間點不統一,缺少遠期效應觀測。如臨床療效這一指標的測量時間點就多達14個,且大部分研究的指標測量時間點多在12周以內。對于腫瘤治療來說,長期隨訪的結果評價是關鍵,但目前中醫藥治療乳腺癌的研究,缺乏對遠期預后結果的測量與評價。
4)相同指標測量方法差異性大。如在進行生活質量評價時,研究者采用了8個不同的測評量表。部分結局指標的評價標準也不盡相同,也存在自擬評價標準的情況。
5)指標報告不規范。主要體現在指標變量類型隨意轉換、指標名稱不規范和不同指標存在相似交叉條目這3個方面。如臨床療效、生存情況和中醫癥狀療效等連續性變量被轉化成等級資料進行報告,多用顯效、有效、無效、總有效率、總生存率等形式。同一指標存在錯用或亂用不同名稱進行報告的情況,如部分研究將KPS評分報告為生活質量評分,而另一部分研究卻報告為體力狀況或功能狀態評分。此外,還有研究在報告結局指標時存在條目交叉重復報告的情況。如生活質量評分中包含了軀體功能、心理功能、社會功能和物質生活狀態4個維度,在臨床療效、中醫癥狀療效和睡眠質量評分等條目中均有重復交叉的內容。
6)自擬癥狀或證侯積分,缺乏能體現中藥特色效果的特異性指標。在所有納入研究中,僅18%左右的研究報告了中醫相關指標。
本研究還對所有指標的使用頻次進行了統計,為核心指標集條目池的構建提供數據支持。這些在原始文獻中使用頻次高的指標將被推薦為候選指標條目進入初選條目池,然后通過Delphi調查和多方共識會議,最終形成中醫藥治療乳腺癌的臨床研究COS。
本研究納入的原始研究類型較為單一,且文獻限定為近5年發表,樣本的代表性存在一定的局限。未來的研究應該進一步擴充納入研究的類型,如病例報告文獻、注冊研究方案等,同時擴大文獻的年限跨度進行補充和對比研究,為COS的制定提供更為全面的初始條目池。
中醫藥治療乳腺癌相關臨床研究所報告的結局指標主要存在終點指標過少、遠期效應測量缺乏等臨床實用性差的問題;同時還存在組合過于隨意、測量方法差異性大、表達不規范、數量不一致以及測量時間點跨度大等異質性過高的問題。因此,需要構建公認的中醫藥核心指標集,以提高中醫藥臨床研究的質量,減少不必要的資源浪費。