許凱強,邱國春,張菠,施權,王寓平,尚忠明
(西南醫科大學附屬中醫醫院血管甲狀腺乳腺外科,四川 瀘州 646000)
甲狀腺結節是普通外科常見的疾病,在一般人群中發病率高達76%[1]。根據既往的研究,大多數甲狀腺結節是良性的[2],但即使大多數為良性,患者仍經常遭受不同困擾,例如吞咽困難、局部疼痛及由結節造成頸部腫塊引起的美容問題。特別是冷結節還會增加惡變的風險。目前,對于甲狀腺結節的標準治療方法仍為甲狀腺切除術,雖然能達到根治的目的,但它可能導致嚴重的并發癥,如喉返神經和甲狀旁腺的損害,或美容問題,如永久性疤痕形成等。而且部分行全甲狀腺切除術的患者還可能會出現甲狀腺功能減退,需要終生服用左旋甲狀腺素治療,這不僅會造成經濟損失,還會導致不良反應[3,4]。此外,甲狀腺切除術對于手術風險高或年齡較大的患者可能不是一種選擇。雖然左旋甲狀腺素和放射性碘已被用作老年和高手術風險患者的非侵入性治療,但這些治療不能避免醫源性甲狀腺功能減退或甲狀腺功能亢進的出現[5,6]。因此,臨床診療工作中,亟待需要一種新的治療技術來彌補現有技術的不足,以提高甲狀腺良性結節的治療效果。
隨著醫療技術的發展,超聲引導下的熱消融(射頻、微波)治療已成為良性甲狀腺結節的替代治療方法[7-9]。既往研究表明,熱消融對于甲狀腺良性結節的治療具有很好生活質量和性價比[10]。然而,對于良性甲狀腺結節的治療,熱消融是否與常規甲狀腺切除術具有相當甚至優于切除術的效果,至今仍不清楚。目前,對于熱消融和手術切除在甲狀腺良性結節治療中的有效性和安全性,還沒有進行過大樣本meta 分析比較。因此,考慮到缺乏證據,本meta 分析的目的是系統回顧已發表的文獻,評估TA 與SR 在BTN 中的有效性和安全性。研究結果可為臨床實踐提供參考。
通過計算機從Pubmed、Web of Science、Embase、Cochrane Library、中國生物醫學文獻數據庫、中國知網數據庫、萬方數據庫和維普數庫系統的檢索從建庫至2020 年07 月關于比較TA 和SR 治療BTN 患者的臨床對照研究。英文檢索詞包括:Thermal ablation, microwave, radiofrequency, benign thyroid nodules, surgical excision, thyroid;中文檢索詞包括:熱消融、微波、射頻、甲狀腺良性結節、手術切除、甲狀腺。
①需要治療的甲狀腺結節疾病患者;②比較TA 與SR 治療BTN 已發表的回顧性或前瞻性對比研究;③至少報告下列結果之一且數據完整的研究:手術時間、術中出血量、住院時間、術后并發癥;④經手術病理或細胞病理學確診為良性甲狀腺結節;⑤本研究無語言限制,且發表文獻限于核心期刊及以上級別。
①沒有對比TA 與SR 治療BTN 的研究;②個案報道、摘要、會議報告或者實驗論文及重復性研究;③沒有全文,同時從摘要中不能提取有效數據的研究。
2 位評研究者對文獻獨立進行檢索、資料提取并進行質量評價,如遇到不一致的情況,則通過雙方討論或征求第3 位評價者的意見。數據不全時,盡可能通過與通信作者取得聯系獲得。對于沒有均值和標準差(SD)的定量數據,如果無法從作者處獲得缺失的信息,則采用基于中位數、范圍和樣本量的均值和標準差估算方法進行計算[11,12]。
對RCT 研究的方法學質量評估,采用Jadad 量表[13]進行評分,分數大于等于3 分表明該RCT 是相對高質量的研究。對非RCT 研究的質量評價均采用紐卡斯爾-渥太華量表(NOS)進行評估,該量表已被廣泛用于非隨機研究的質量學評價中[14]。該評估量表對納入研究的質量評分,主要包括3 個方面:研究對象的選擇、研究群體的可比性及對結局的評估。該量表最高評分為9 分,如果分數大于5 分,表明該研究方法質量較高。
為檢測不同研究設計結果的一致性與潛在的偏倚,根據消融類型分組( 微波和射頻)進行總體分析和兩個亞組分析(微波meta 分析和射頻meta 分析)。所有分析都采用Revman 5.1 軟件進行數據合并及處理。對研究中的連續性變量及二分類變量分別采用均數差(mean difference,MD)及率差(odds ratio ,OR)為效應指標計算它們的合并值及95%CI,P<0.05 為差異有統計學意義。并用Mantel-Haenszel 檢驗法對研究進行異質性檢驗,以I2表示各研究之間的異質性。若I2≤ 50.0%,表明各研究結果差異無統計學意義(P ≥ 0.1),則采用固定效應模型;若I2>50.0%,表明有統計學異質性(P<0.1),則采用隨機效應模型分析;明顯的臨床異質性采用敏感性分析方法處理。如果納入研究數量超過10 篇則通過漏斗圖來判別可能的發表偏倚[15]。
通過系統的檢索,共找到1816 篇文獻;去除重復性研究文獻892 篇。對剩下的924 篇文獻進行全文閱讀后,排除911 篇個案報道、非對照研究文獻或普通期刊。最后,本Meta 分析共納入13 項研究[16-28],其中RCT 1 篇[16],回顧性隊列研究12篇[3,17-27],共包括2688 例患者。文獻篩選流程詳見圖1。納入研究基本特征及質量學評分見表1。總的來說,納入的研究顯示出中等到高的方法學質量。因此,納入研究都為高質量研究。

圖1 納入文獻篩選流程圖
2.2.1 手術時間的比較
8 篇研究報道了手術時間[3,16-18,23-26]。異質性檢驗提示各研究間存在異質性(I2=98%,P<0.01),選用隨機效應模型進行合并,總體分析結果顯示:TA 組手術時間明顯短于SR 組,差異結果有統計學意義[MD=-50.81,95% CI,-59.08—-42.53,P<0.01]。亞組分析結果顯示:較手術切除相比,微波[MD=-53.34, 95% CI,-67.71—-38.98,P<0.01]和射頻[MD=-44.87,95% CI, -45.97—-43.77,P<0.01]組手術時間均明顯縮短,差異結果有統計學意義,如圖2。

表1 納入研究基本特征及質量學評分

圖2 手術時間比較的森林圖

圖3 術中出血量比較的森林圖

圖4 住院時間比較的森林圖
2.2.2 術中出血量的比較
5 篇 研 究 報 道 了 手 術 時 間[3,17-18,24,26]。異 質 性 檢 驗 提示各研究間存在異質性(I2=95%,P<0.01),選用隨機效應模型進行合并,總體分析結果顯示:TA 組的術中出血量明顯少于SR 組,差異結果有統計學意義[MD=-18.82,95% CI, -20.94—-16.71,P<0.01]。亞組分析結果顯示:與手術切除相 比,微 波[MD=-17.05,95% CI,-18.35—-15.74,P<0.01]和射頻[MD=-21.60,95% CI,-26.77—-16.42,P<0.01]組術中出血量均明顯減少,差異結果有統計學意義,如圖3。
2.2.3 住院時間的比較
8 篇研究報道了兩組住院時間[3,16-19,21,24,26]。異質性檢驗提示各研究間存在異質性(I2=98%,P<0.01),選用隨機效應模型進行合并,總體分析結果顯示:TA 組的住院時間明顯短于SR 組,差異結果有統計學意義[MD=-3.76,95% CI,-4.42—-3.10,P<0.01]。亞組分析結果顯示:微波[MD=-3.94,95% CI,-4.83—-3.05, P<0.01]和射頻[MD=-3.54,95% CI,-4.44—-2.63,P<0.01]組住院時間均明顯短于手術切除組,差異結果有統計學意義,如圖4。
2.2.4 術后并發癥的比較
8 篇 研 究 報 道 了 術 后 總 體 并 發 癥[3,16-18,20-22,26]。異 質 性檢驗提示各研究間不存在明顯異質性(I2=46%,P<0.01),選用固定效應模型進行合并,總體分析結果顯示:TA 組的術后總體并發癥發生率明顯少于SR 組,差異結果有統計學意義[OR=0.19,95% CI,0.15—0.24,P<0.01]。亞組分析結果顯示:較手術切除相比,微波[OR=0.25,95% CI,0.13—0.49,P<0.01]和射頻[OR=0.18,95% CI,0.13—0.23,P<0.01]組術后總體并發癥發生率均明顯較少,差異結果有統計學意義,如圖5。

圖5 術后總體并發癥比較的森林圖

圖6 術后聲音嘶啞比較的森林圖
7 篇研究報道了術 后聲音嘶啞發生率[16-17,19-21,25,27]。異質性檢驗提示各研究間不存在明顯異質性(I2=33%,P=0.17),選用固定效應模型進行合并,總體分析結果顯示:TA 組的術后聲音嘶發生率明顯少于SR 組,差異結果有統計學意義[OR=0.41,95% CI,0.20—0.84,P<0.05]。亞組分析結果顯示:較手術切除相比,微波[OR=0.16,95% CI,0.06—0.48,P<0.01]組術后聲音嘶啞發生率明顯較少,差異結果有統計學意義,而射頻組兩組比較無統計學意義,如圖6。
3 篇研究報道了術后頸部血腫發生率[17,19,21]。異質性檢驗提示各研究間不存在明顯異質性(I2=0%,P=0.79),選用固定效應模型進行合并,總體分析結果顯示:TA 組的術后頸部血腫發生率明顯少于SR 組,差異結果有統計學意義[OR=0.41,95% CI,0.20—0.84,P<0.05],如圖7。
3 篇研究報道了術后喉返神經損傷發生率[17,18,24]。異質性檢驗提示各研究間不存在明顯異質性(I2=0%,P=0.49),選用固定效應模型進行合并,總體分析結果顯示:對于術后喉返神經損傷發生率,兩組比較差異結果無統計學意義[OR=0.26,95% CI,0.18—0.39,P<0.01],如圖8。
5 篇研究報道了術后甲減發生率[17-18,21-22,24]。異質性檢驗提示各研究間存在明顯異質性(I2=72%,P=0.006),選用隨機效應模型進行合并,總體分析結果顯示:對于術后甲減發生率,兩組比較差異結果無統計學意義[OR=0.15,95% CI,0.02—1.02,P=0.05],如圖9。
6 篇研究報道了術后頸部疼痛發生率[16-18,20,22,24]。異質性檢驗提示各研究間存在明顯異質性(I2=89%,P<0.01),選用隨機效應模型進行合并,總體分析結果顯示:TA 組的術后頸部疼痛發生率明顯少于SR 組,差異結果有統計學意義[OR=0.08,95% CI,0.02—0.34,P<0.05]。亞 組 分 析 結 果 顯 示:較 手 術切 除 相 比,微 波[OR=0.06,95% CI,0.00—0.78,P<0.05] 和 射頻[OR=0.09,95% CI,0.01—0.87,P<0.05]組術后竟不知道疼痛發生率均明顯較少,差異結果有統計學意義,如圖10。
2.2.5 術后敏感性分析和發表偏倚評估
異質性檢驗分析結果提示在手術時間、術中出血、住院時間、術后甲減及頸部疼痛發生率比較上,各研究間存在明顯異質性,采用逐一排除單項研究的方法對結局指標進行敏感性分析。敏感性分析結果表明,在分析中,所考慮的任何參數或異質性水平的OR 或MD 的方向或統計意義均無變化。
對術后總體并發癥進行漏斗圖分析,結果顯示漏斗圖中8個點在漏斗圖兩側分布不完全對稱,提示可能存在發表偏倚,如圖11。

圖7 術后頸部血腫比較的森林圖

圖8 術后喉返神經損傷比較的森林圖

圖9 術后甲減比較的森林圖

圖10 術后頸部疼痛比較的森林圖

圖11 基于術后并發癥的漏斗圖
該研究通過對2688 例患者進行系統回顧和meta 分析,比較熱消融和常規甲狀腺切除術治療良性甲狀腺結節的效果和安全性,為臨床實踐提供了強有力的證據。本研究表明,與常規甲狀腺切除術相比,超聲引導下的熱消融術對良性甲狀腺結節的治療是有幫助的,主要體現在安全性、縮短住院時間等方面。
需要治療的良性甲狀腺結節患者的標準療法是常規甲狀腺切除術,但它并不總是最好的選擇。既往研究表明這種方法可能導致嚴重并發癥、美容問題及長時間住院和其他問題[28-30]。在甲狀腺良性疾病的治療過程中,患者是否應該必須經歷這些問題,目前仍存在爭議[31]。此外,一些患者由健康狀況不佳或者高齡,不適合做甲狀腺切除術。超聲引導下的熱消融可能是一種極具潛力的替代治療方法。雖然熱消融治療良性甲狀腺結節的療效已得到證實[32-33],然而熱消融是否相當于甚至優于常規甲狀腺切除術,目前仍不清楚。據我們所知,超聲引導下的熱消融與常規甲狀腺切除術對于良性甲狀腺結節在治療的安全性和有效性方面的差異,目前還沒有系統的綜述或meta 分析。因此,本研究的目的是采用系統評價的方法,綜合各中心臨床研究,分析評估熱消融術在良性甲狀腺結節治療上的效果及安全性。
本meta 分析結果顯示,熱消融術患者手術時間、術中出血量、住院時間及術后并發癥發生率指標均明顯優于手術切除組;主要是因熱消融術組操作簡短,無需開關切口,創傷小,因此手術時間短、術中出血量少,住院時間也相應縮短。同時患者的術后并發癥也較少,主要體現在較少的聲音嘶啞、頸部血腫、頸部疼痛發生率上,而對于其他并發癥的發生情況,未來還需要多中心,大樣本隨機對照研究來加以驗證。
雖然熱消融在很多方面優于常規甲狀腺切除術,但需要注意的是,熱消融前的病理結果是通過細針穿刺(FNA)或芯針活檢(CNB)獲得的,可能會產生假陰性或假陽性結果。因此在實時熱消融治療時應被至少兩種FNAs 或CNBs 確認為良性時,才應該進行熱消融治療。此外,對于一些位于胸骨后的良性甲狀腺結節,熱消融的效果往往不理想,應該首選常規甲狀腺切除術[34]。因此,在進行熱消融治療時,應進行全面的術前評估,包括可靠的術前診斷和熱消融的可行性評估只有當這兩個條件同時滿足時,熱燒蝕才是治療良性甲狀腺結節的首選。
本研究也存在以下局限性:①該只檢索了公開發表的中英文文獻,一些以非中英文發表的文獻未被納入,可能會削弱結果的穩定性;②在手術時間、術中出血、住院時間、術后并發癥發生率分析中發現了納入研究的異質性,因此使用了隨機效應模型,這可能削弱結果的證據;③分析結果可能會受小樣本量研究的影響;④漏斗圖結果提示可能存在發表偏倚。
綜上所述,當前證據顯示,在甲狀腺良性結節的治療中,熱消融術的有效性和安全性優于手術切除,未來還需要多中心大樣本隨機對照試驗來予以驗證。