田 甜,倪夕秀,劉 路,李 曉,王亞楠,王林嘉,趙 凌
(成都中醫藥大學針灸推拿學院 成都 610075)
圍絕經期是指女性絕經前后的一段時期,包括從接近絕經出現與絕經有關的內分泌、生物學和臨床特征起至最后一次月經的后一年。在此期間,隨著女性生殖器官功能衰退,女性激素水平急劇減退,引起植物神經系統功能紊亂,并且常出現神經心理癥狀的一組癥候群,西醫學稱為“ 圍絕經期綜合征(Perimenopausal syndrome,PMS)”,中醫學謂之“絕經前后諸證”[1]。隨著圍絕經期的到來,PMS 的各種不適癥狀逐漸出現,多達40%-85%的女性會發生明顯的不適癥狀,而且癥狀往往持續時間較久,嚴重時甚至長達數年或者數十年之久,給女性的生理和心理健康帶來極大的負面影響[2]。
現代醫學較多采用激素療法及對癥處理,但不良反應較多[3],不適合長期服用,限制了其在臨床的廣泛應用;中藥根據患者病情、表現的異同,所選處方及藥物不盡相同,療效亦參差不齊。與中、西藥物治療相比較,針刺對PMS 的治療具有良好的調節作用,越來越受到重視[4]。但現有的針刺治療PMS 系統評價及Meta 分析文章[5-7]質量良莠不齊,臨床亟需高等級的證據支持針刺治療PMS的有效性及安全性。本研究旨在用系統評價及Meta分析的方法,為針刺治療PMS的有效性和安全性進行綜合評估,以及運用GRADE 進行證據質量評價,以為臨床實踐提供推薦和證據支持。
與支持的基金項目關聯:項目課題在臨床研究過程中發現偏頭痛患者大部分為女性,且處于圍絕經期的患者是其中一個主要群體,遂預想先通過系統評價評估針刺對圍絕經期患者的針刺療效及安全性,以期為后期進行偏頭痛亞組分析提供一定的科學參考及依據。
1.1.1 納入標準
(1)研究類型
隨機對照試驗(Randomized Controlled Trial,RCT)(包括期刊論文、會議論文、學位論文),無論是否采用盲法。
(2)研究對象
臨床診斷為圍絕經期綜合征(診斷標準[8]:①年齡>40歲,月經紊亂或絕經。②伴隨癥狀[9]:血管舒縮功能不穩定癥狀,如潮熱、汗出等;精神神經癥狀,如抑郁、焦慮、煩躁、易激動等;泌尿生殖道萎縮癥狀,如陰道干燒灼感、反復泌尿道感染等。③E2/FSH 升高或正常。),其國籍、種族、病程不限。
(3)干預措施
試驗組采用針刺療法(針具材料、治療選穴、實施手法、留針時間及療程不限)或配合藥物(試驗組和對照組的藥物在同一研究中必須相同);對照組采用西藥治療、中藥治療(藥物種類不限)、假針灸、安慰劑或等待治療。
(4)結局指標
主要結局指標為治療總有效率(總有效率=臨床控制率 + 顯效率 + 有效率。);次要結局指標為Kupperman 指數、更年期評定量表(Menopause Rating Scale ,MRS)、潮熱評分(Hot flash scores,HF scores)。
1.1.2 排除標準
①干預組中針刺不是主要干預手段,僅作為輔助治療;②除圍絕經期綜合征外伴有其他疾病如腫瘤等;③觀察性研究、非隨機對照研究、病案報道、隊列研究、動物實驗;④重復檢出或重復發表的文章,則僅保留發表時間最早的1篇。
計算機檢索公開發表的關于針刺治療原發性圍絕經期綜合征的隨機對照研究,中文以“針刺”“耳針”“頭針”“腹針”和“圍絕經期”“圍絕經期綜合征”“更年期”“更年期綜合征”“絕經期綜合征(癥)”“經斷前后諸證”為關鍵詞檢索CNKI、萬方、維普數據庫,英 文 以“acupuncture”“Electroacupuncture”和“Peri”“perimenopausal period”“perimenopause”“Menopause”“Hot flashes”及“vasomotor symptoms”組合檢索PubMed、Embase,檢索式主要采取主題詞結合自由詞進行,根據各個數據庫特點進行調整,經多次檢索后確定,檢索起止日期為2008.01.01-2018.12.31。
由2位評價員獨立根據納入排除標準進行文獻篩選,以及采用數據提取表進行資料提取。提取表內容包括:①納入研究的基本信息,包括作者姓名、發表時間等;②研究對象的基本特征,如各組例數等;③干預的具體措施及時間;④所關注的結局指標及相關測量數據;⑤偏倚風險評價的關鍵要素。納入RCT 的偏倚風險評估:采用Cochrane Handbook 5.1 推薦的偏倚風險評估工具[10]的6 個條目對納入研究進行評價,并采用RevMan 5.3 軟件生成偏倚風險圖。內容包括隨機序列的產生、分配隱藏、盲法的實施、數據完整性、選擇性發表和其他偏倚,皆可分為“低風險”“不清楚”“高風險”3 個等級。對以上結果進行交叉核對,如若存在分歧,則討論解決。
采用RevMan 5.3 軟件分析數據及Meta 分析。對于二分類數據用OR(優勢比)及RR(危險比)和95%CI(可信區間)作為統計效應量;對于連續性資料用MD(均數差)或SMD(標準化均數差)和95%CI 作為統計效應量。
采用國際上通用的證據質量分級系統(GRADE系統)對結局指標的證據質量進行分級[11,12]。本研究納入的均為RCT 試驗,因RCT 試驗被設定為最高等級證據,故只用考慮5個降級因素:偏倚風險、不一致性、間接性、不精確性和發表偏倚。具體分析見GRADE(表2)評價部分。
按檢索策略和資料收集方法,共篩選到相關文獻90 篇,發表語種均為中文及英文。經閱讀文題、摘要、全文后最終納入30 個隨機對照試驗[13-42(]包括期刊論文26篇,學位論文4篇;20篇中文,10篇英文),完成試驗者共2767例患者。文獻檢索流程及結果見圖1。
共納入2767例受試對象,納入研究基本特征見表1;納入文獻質量評價見圖2。
2.3.1 總有效率Meta分析結果
共納入15,RCT,1355 例患者,由于對照組采用的干預方式不同(西藥和中藥),為避免其異質性高,故采用亞組分析。其中針刺VS西藥納入11個[13-18,20-,24]RCT,1090 例患者,異質性檢驗結果I2= 46%,小于50%,采用固定效應模型,Meta 分析結果顯示:優勢率(Odds Ratio,OR)= 3.74,95%CI(2.57,5.46),P< 0.0001;針刺VS中藥圖4個[25,29-31]RCT,265例患者,Meta分析結果顯示:OR = 8.54,95%CI(3.72,19.58),P< 0.0001。針刺較藥物治療圍絕經期綜合征的總有效率更高,結果具有統計學意義(圖3)。
圖4 為15 個RCT 的發表偏倚,形狀似倒置漏斗,故可認為無明顯發表偏倚(圖4)。
2.3.2 Kupperman指數Meta分析結果
共納入9個RCT,1002例患者,由于對照組采用的干預方式不同(西藥和中藥),為避免其異質性高,故采用亞組分析。其中宋晶[16]、楊繼若[20]、余慧[25]等Kupperman指數無具體均值及方差描述,未納入;趙燕菲[17]因其分組有組內和組間,與其他試驗異質性大,未納入。針刺-西藥共納入7 個[13-15,18-21,23]RCT,882 例患者,Meta 分析結果顯示:異質性檢驗結果I2= 23%,異質性低,采用固定效應模型。對效應量進行合并后,均數差(Mean Difference,MD)= -3.54,95%CI(-4.12,-2.93),P= 0.25。針刺-中藥納入 2 個[26-27]RCT,120例患者,I2= 0%,同質性較好。對效應量進行合并后,P=0.57,MD=-2.79,95%CI(-3.33,-2.26)(圖5)。Kupperman 指數數值越大,說明圍絕經期綜合征癥狀越嚴重,圖5可見針刺VS西藥其合并效應量位于森林圖左側,提示針刺治療圍絕經期綜合征在改善Kupperman 指數上優于西藥。但針刺VS 中藥合并效應量后跨過無效線,故認為針刺比中藥治療PMS 在Kupperman指數的改善上無統計學意義。

圖1 研究流程圖
圖 6 為 Kupperman 指數 9 個 RCT 的發表偏倚漏斗圖,根據漏斗圖可看出可能存在一定的發表偏倚。
2.3.3 HF scores Meta分析結果
共納入 5 個[32,36,39-40,42]RCT,441 例患者,Meta 分析結果顯示:異質性檢驗結果I2= 7%,同質性好,采用固定效應模型。對效應量進行合并后,P= 0.23,MD =-0.30,95%CI(-0.79,0.19)。結果顯示針刺對HF scores的改善程度與假針刺對比結論暫不具統計學意義(圖7)。
2.3.4 MRS Meta分析結果
共納入 4 個[32,36,37,41]RCT,185 例患者,Meta 分析結果顯示:異質性檢驗結果I2=0%,同質性好,采用固定效應模型。對效應量進行合并后,P= 0.53,MD = -0.72,95%CI(-2.47,1.03)。結果顯示針刺對MRS 的改善程度較假針刺治療好,不具有統計學意義(圖8)。
18 篇[16-18,24,26,28-30,34-42]研究提及不良反應發生情況,其中均未見患者出現嚴重不良反應;12篇[13-15,19-23,25,27,31-32]未報道不良反應。
根據GRADE 系統要求對結局指標進行質量評價。目前認為,RCT 在GRADE 證據質量評價中被預先設定為最高等級證據,故只考慮5個降級因素(分別為:偏倚風險、不一致性、間接性、不精確性和發表偏倚)進行處理,結果見表2。降級分析如下:①偏倚風險:隨機方法正確,但納入文章大多未描述是否采用或未采用盲法,分配方案的隱藏僅有1篇文獻報告,故降1 級;②不一致性:所有結局指標I2均<50%,故均不降級。③間接性:試驗人群為PMS 患者,無需考慮年齡及性別,不予降級;對照藥物及結局指標不全相同,降1級;④不精確性:納入的研究中,樣本量除個別研究外均屬大樣本,故可不做降級處理;MRS 置信區間過大,存在難以抉擇區間,故降級。⑤發表偏倚:根據漏斗圖可知,總有效率與Kupperman 指數無明顯發表偏倚,不予降級,HF scores 和 MRS 由于納入 RCT 數量少,未做漏斗圖,無法明確判斷是否存在發表偏倚,故降1級。得出結論:總有效率、HF scores為低質量證據,Kupperman指數、MRS為極低質量證據。

表1 納入研究材料基本特征

圖2 偏倚風險百分條圖

圖3 針刺對照藥物總有效率的Meta分析森林圖

圖4 針刺對照藥物總有效率的漏斗圖

圖5 針刺-西藥和針刺-中藥Kupperman 指數Meta分析森林圖

圖6 針刺對照藥物Kupperman指數的漏斗圖

圖7 針刺-假針刺HF scores Meta分析森林圖

圖8 針刺-假針刺MRS Meta分析森林圖
本研究納入的30個研究結果顯示針刺相較西、中藥及假針刺等對于PMS 治療在總有效率方面改善大,針刺較西藥在Kupperman 指數方面的改善大,可以更程度地改善圍絕經期的多個癥狀,但針刺對照假針刺在HF scores、MRS 的改善方面不具有統計學意義。分析如下:針刺相較西藥除臨床療效更好可能原因為①針刺治療通過不同的穴位配伍起到滋養胞宮,調理氣血,平衡陰陽,以及根據不同癥狀而增加的配穴起到相對應療效;②針刺有助于促進下丘腦-垂體-內分泌腺體功能,調整激素水平,平衡內環境,從而改善患者癥狀[43]。針刺較西藥治療PMS除療效更好之外還有副作用少等好處,如本文納入的多個研究采用了激素替代療法,其副作用常見的有發胖、消化道潰瘍等,以及結合PMS 的發病人群骨質疏松亦為其常見的副作用;藥物的副作用限制了其在臨床的應用,故針刺可作為PMS 治療的另一有效且安全的方法。Meta 分析結果中針刺較假針刺在HF scores、MRS 等改善方面不具有統計學意義可能原因為①納入分析的研究個數較少,且部分納入研究間或組間的樣本量差異懸殊;②各研究間假針刺無統一操作標準,如有研究選取腧穴近處部位進行淺刺,有些則不刺入皮膚,故產生的結果偏倚較大。女性內分泌主要通過下丘腦-垂體-卵巢軸調節,本文納入研究中部分采用了血清激素來評估療效(因相關研究數量較少,故結局指標未納入),針刺通過調節血清激素的水平來改善癥狀,提示針刺對PMS 治療的潛在機制可能是針刺通過調節患者內分泌系統而起效。根據現有的證據,針刺治療PMS 只能進行弱推薦,隨機對照試驗是驗證干預措施療效的標準設計方案,而高質量的RCT 是生產高質量的系統評級和指南的基礎,為臨床提供高級別證據。基于現階段的研究狀況,我們在今后的研究中應當加強設計、提高質量、保證證據一致性和直接性。
①納入的研究文獻結局指標相同者較少;②以HF scores、MRS 做為結局指標做Meta 分析時納入RCT數量少,不能做發表偏倚分析;③關于針刺治療PMS的中文期刊文獻整體質量不高,但部分文獻質量較高,中文期刊盲法僅有4 篇(13%)研究實施,絕大多數文獻并未使用分配隱藏方法及病例脫落,可能會對評價結果產生一定的影響。今后的研究設計基于規范化、科學化,才能夠更全面、系統、客觀地進行評價;④盡管進行了相關RCT 的廣泛檢索,但仍無法排除潛在的發表偏倚;⑤本研究缺乏灰色文獻,同時未能獲取尚未發表的研究;⑥本文評價涉及到部分多中心的RCT研究,不同中心在針刺選穴、手法(治療醫師經驗)以及治療時間上存在差異,因此可能存在實施偏倚。

表2 GRADE質量評價表
①試驗設計不夠嚴謹、規范:如盲法的應用等。盲法是降低試驗結果偏倚重要的環節,尤其是對于主觀結果的評估,由于針灸治療的特殊性,難以實現真正雙盲或者三盲,尤其盲針灸治療師,但是試驗設置為盲受試者及數據采集、評價者,或者可采用“三分離”的原則亦能降低試驗結果的偏倚。②試驗內容闡述不夠詳盡:如受試者基線情況(年齡、病程、病情嚴重程度等);病例脫落的登記及應對措施;是否進行隨訪以及隨訪的結果。③不良反應的規定及登記。不良反應為試驗提供安全性數據,所以對此客觀真實的記錄尤為重要;30 個RCT 中雖有18 篇記載了不良反應或者安全性評估,但其中9 篇為國外文獻,5 篇為學位論文,即僅有4篇國內期刊文獻談到了不良反應;④或可在試驗設計時應用更多客觀指標來進行療效評估,以及為PMS 的機制研究提供更多依據;⑤應采用較為統一的療效評定指標,本次納入研究國內、國外的結局指標差異較大,Meta 分析時無法進行對比。故以后RCT 研究可根據先前類似文獻驗證指標或指南推薦,以提高測量質量并有助于與類似研究進行比較。今后的研究應嚴格對照試驗的要求,嚴格、謹慎進行設計和實施,做出更高質量的RCT。