蘇 濤,孫 航,吳傳新
1.重慶醫科大學附屬第二醫院肝膽外科,重慶 400010;2.重慶醫科大學附屬第二醫院病毒性肝炎研究所,重慶 400010
原發性肝癌是當今世界上常見的惡性腫瘤之一,其中肝細胞癌(Hepatocellular carcinoma,HCC)(以下簡稱肝癌)占比約75%~85%[1-2]。目前公認的肝癌手術切除首選適應證是肝臟儲備功能良好的中國肝癌分期(China liver cancer staging,CNLC)Ia 期、Ib 期和IIa 期肝癌[3]。由于早期肝癌常無特征性臨床表現,僅有程度輕微的癥狀甚至毫無癥狀,因此患者常常在日常體檢中意外發現肝癌,中晚期肝癌患者選擇外科治療的療效和生存獲益并不理想[4-5]。因此,大多數中晚期肝癌患者已經不適合選擇手術切除,而應該選擇局部治療和系統治療為主的非手術治療方式。肝動脈化療栓塞(Transcatheter arterial chemoembolization,TACE)廣泛應用于無手術適應癥的中晚期肝癌患者的治療,是我國肝癌指南推薦的非手術首選治療方式之一[3,6]。TACE 可將栓塞劑及化療藥物通過介入的方式高選擇性地注入腫瘤組織的供血動脈,阻斷腫瘤的動脈血供,進而使腫瘤壞死。但肝臟血供來源較多,局部栓塞很難阻斷腫瘤的所有血管。血管內皮生長因子(Vascular endothelial growth factor,VEGF)的過度表達刺激腫瘤形成新生血管,以及側支循環建立等因素也影響了TACE 的治療效果。目前TACE 的聯合治療方式已逐漸成為研究熱點,聯合治療也是未來腫瘤治療的一大發展趨勢[7]。索拉非尼是第一個靶向治療藥物,也是我國肝癌指診療指南推薦的一線系統治療方案[3]。索拉非尼作為一種多激酶抑制劑,作用于包括RAF 激酶、VEGF 受體等多個靶點,不僅能通過RAF介導的傳導通路抑制腫瘤細胞增殖,而且能抑制VEGF 減少新生血管形成[8]。目前已有多篇索拉非尼聯合TACE 治療肝癌的系統評價/Meta 分析發表,但其報告質量和方法學質量尚不清楚,同時報告的結局指標的證據等級也尚未評價。因此,本研究旨在通過系統評價再評價方法,評估索拉非尼聯合TACE 治療肝癌的有效性及安全性證據,以期為開展相關研究與進行臨床實踐提供更為綜合的證據。
(1)研究類型為基于隨機對照試驗(Randomized controlled trial,RCT)的系統評價/Meta 分析,以最大限度地減少因非隨機臨床研究中固有的選擇偏倚造成的潛在影響。(2)研究對象為確診肝癌的患者,不限種族、性別、年齡和腫瘤分期等。(3)干預措施為試驗組使用索拉非尼聯合TACE,對照組單用TACE 或使用TACE 加安慰劑。(4)納入的結局指標包括:①近期療效:客觀緩解率、疾病控制率;②遠期生存:總生存期、疾病進展時間、1 年生存率、2 年生存率等;③不良反應指標:手足綜合征、高血壓、腹瀉、皮疹、乏力、肝功能異常、脫發、惡心、嘔吐、厭食、腹痛、發熱、骨髓抑制等。
(1)數據重復發表。(2)研究對象、研究類型或干預措施不符。(3)包含非RCT 研究的系統評價/Meta 分析。(4)文獻數據不完整。(5)非中英文文獻。
檢索PubMed、Cochrane Library、Embase、CNKI、VIP、CBM 和萬方數據庫收集相關文獻。檢索時限均為建庫至2022 年1 月1 日。檢索詞有“索拉非尼”“肝動脈化療栓塞”“肝癌”“原發性肝癌”“肝細胞癌”“肝惡性腫瘤”“Meta 分析”“薈萃分析”“系統評價”“系統綜述”“Sorafenib”“Transcatheter Arterial Chemoembolization”“TACE”“Hepatocellular Carcinoma”“Liver Cancer”“Meta-Analysis”“Systematic Review”等。以CNKI 數據庫為例,詳細的檢索策略為:SU= ‘索拉非尼’and‘TACE’+‘肝動脈化療栓塞’and ‘肝癌’+‘原發性肝癌’+‘肝細胞癌’+‘肝惡性腫瘤’and ‘Meta 分析’+‘薈萃分析’+‘系統評價’+‘系統綜述’。
由兩人獨立進行篩選文獻、提取資料,并進行交叉核對結果,若有爭議,應請第三方協助判定。提取的資料主要包括:第一作者姓名、發表年限、文獻類型、納入的RCT 數量、樣本量、結局指標、基金支持、報告學和方法學質量評價所需信息等。
(1)報告質量評價。使用PRISMA 聲明[9]評價納入文獻的報告質量,共包括標題、摘要、引言、方法、結果、討論、資金7個部分27個條目,判斷作者是否對每一條目要求的內容報告的完整程度。完整報告、部分報告、未報告分別計1 分、0.5 分、0 分。評分≤15 分代表報告存在嚴重的信息缺失,評分>15 且≤21 分代表報告有一定缺失,評分>21分代表報告相對完全。(2)方法學質量評價。采用AMSTAR 2 量表[10]評價納入文獻的方法學質量,共包括16 個條目,其中條目2、4、7、9、11、13、15 為關鍵領域,根據各條目是否符合標準進行評價。AMSTAR 2 量表規定,>1 個關鍵條目存在缺陷時則系統評價的整體方法學質量評價為極低。(3)證據質量評價。使用GRADE工具[11]對納入系統評價中報告結局指標的證據質量進行評價。GRADE 規定基于RCT 的初始證據質量為高級,且主要考慮偏倚風險、間接性、不一致性、不精確性和發表偏倚5個方面的降級因素。最終的證據質量可以評價為高、中、低和極低級。
初檢共得到相關研究文獻61 篇,首先使用EndNote X9 軟件剔除重復研究25 篇,再閱讀標題和摘要進行初篩后去除15 篇,閱讀全文對剩余的21 篇[12-32]文獻進行復篩,排除包含非RCT的系統評價8篇[12-19]及數據不完整的文獻1 篇[20],最終納入系統評價/Meta 分析12 篇[21-32]。文獻篩選流程及結果,見圖1。

圖1 文獻篩選流程及結果
在納入12 篇文獻中,9 篇為中文,其余3 篇為英文,樣本量360~3 076 例,納入的RCT 數量為4~23 項,試驗組均使用索拉非尼聯合TACE,對照組均單用TACE。RCT的質量評價方面,2篇[28,31]文獻未報告具體的質量評價工具,4 篇[21-22,27,32]使用了Cochrane 手冊推薦的偏倚風險評估工具,7 篇[23-27,29-30]使用了Jadad 量表。基金支持方面,僅2篇提及了基金支持的相關信息[30,32]。納入文獻的基本特征,見表1。

表1 納入文獻的基本特征
使用PRISMA 聲明評價納入Meta 分析的報告質量,其詳細結果見表2。納入Meta 分析總分在19.0~25.0 分,平均得分為22.2 分。其中8 篇[21,25-28,30-32]報告相對完全(>21分),4篇[22-24,29]存在一定報告缺陷(>15分且≤21分)。

表2 文獻的質量評價情況分
運用AMSTAR 2 量表評價納入Meta 分析的方法學質量,其詳細結果見表3。在重點評價領域:所有文獻均在分析中運用了合理的統計學方法,在討論結果時考慮了納入研究的偏倚風險;在檢索策略方面均部分符合;均未提到研究方案的注冊及計劃書,且均未將全文閱讀階段中被排除研究的具體清單列出。2篇[28,31]文獻未報告具體的質量評價工具,6 篇[22-24,26,31-32]文獻未檢驗發表偏倚及討論其對結果的影響。綜上,12 篇文獻均在超過1 個關鍵領域存在缺陷,因此方法學質量均評價為極低,且缺陷較大的領域有條目2、3、7、10和16。

表3 文獻的方法學質量評價情況
使用GRADE 工具對12 篇文獻的119 個結局指標進行證據質量評價,其中15 個(12.61%)結局指標評價為中級,76 個(63.87%)評價為低級,28 個(23.53%)評價為極低,導致降級的主要因素為偏倚風險和發表偏倚。(1)近期療效。客觀緩解率有9 篇[21-24,26-28,30,32]文獻報告,其中7 篇[21-24,27-28,30]的結果顯示索拉非尼聯合TACE組比TACE 組更能顯著提高疾病的客觀緩解率。疾病控制率有9篇[22-28,30,32]文獻報告,7篇[22-25,27-28,30]的結果顯示試驗組比對照組更能顯著提高疾病控制率。(2)遠期生存。總生存期有7篇[21,26-31]文獻報告,其中3篇[21,28-29]的結果顯示試驗組比對照組更能延長患者的總生存期。疾病進展時間有6 篇[26-28,30-32]文獻報告,其中5 篇[26-28,30-31]的結果顯示試驗組比對照組更能延長患者的疾病進展時間。1 年生存率有7 篇[21-25,27,32]文獻報告,其中6 篇[21-25,27]的結果顯示試驗組比對照組更能增加患者的1年生存率。2年生存率有4篇[22-23,27,32]文獻報告,其中3篇[22-23,27]的結果顯示試驗組比對照組更能增加患者的2 年生存率。(3)不良反應。手足綜合征有9篇[21,24,26-32]文獻報告,高血壓有8篇[21,24,26-30,32]文獻報告,皮疹有6 篇[26,28-32]文獻報告,乏力有5篇[26,28,30-32]文獻報告,結果均顯示試驗組比對照組相關不良反應發生率更高。腹瀉有7 篇[21,26,28-32]文獻報告,其中6篇[26,28-32]結果顯示試驗組比對照組腹瀉發生率更高。肝功能異常有6 篇[21,26-28,30,32]文獻報告,其中2篇[28,32]結果顯示試驗組比對照組肝功能異常發生率更高。脫發有5 篇[26,28-30,32]文獻報告,其中2篇[26,28]結果顯示試驗組比對照組脫發發生率更高。惡心有5篇[26,28,30-32]文獻報告,其中1篇[28]結果顯示試驗組比對照組惡心發生率更低。腹痛有3篇[28,30,32]文獻報告,其中1篇[28]結果顯示試驗組比對照組腹痛發生率更低。發熱有4篇[21,26-27,30]文獻報告,嘔吐有3篇[21,30,32]文獻報告,厭食有3篇[26,30,32]文獻報告,骨髓抑制有2篇[21,27]文獻報告,結果均顯示兩組患者上述不良反應的發生率,差異無統計學意義(P>0.05)。(4)VEGF、AFP 水平。2 篇[24,30]文獻報告了VEGF 水平,結果均顯示試驗組比對照組更能降低VEGF 水平。1 篇[30]文獻報告了AFP 水平,結果顯示試驗組比對照組更能降低AFP水平。
作為QUOROM 指南的演變,PRISMA 聲明對于促進系統評價報告的完整性、提高其報告質量至關重要[34]。本研究使用PRISMA 聲明評價了12 篇索拉非尼聯合肝動脈化療栓塞治療肝癌的Meta分析,結果表明納入文獻均存在一定的報告缺陷。12 篇文獻均未描述方案注冊;8篇[22-23,27-32]文獻未給出詳細的檢索策略,4 篇[22,23,29,32]未明確報告研究的篩選過程,1 篇[25]未說明資料條目,2篇[28,31]文獻未描述單個研究的偏倚評估方法,5篇[22-24,31-32]未詳細評估可能存在的影響數據結果的偏倚,6 篇[22-26,29]未描述研究中的其他分析方法,10 篇[21-29,31]未描述資金支持情況。以上缺陷均會使文獻的報告質量降低,進而干擾對結果的評估。
AMSTAR 2量表是公認的評價系統評價/Meta分析方法學質量的工具[35]。本研究使用AMSTAR 2量表評價了納入的Meta 分析,結果顯示納入的12 篇文獻的方法學質量均為極低。在7 個關鍵領域,5 篇[21,25,27,29-30]文獻有2 項條目不符合,5 篇[23-24,26,28,32]有3 項條目不符合,2 篇[22,31]有4 項條目不符合。所有文獻均未提到研究方案的注冊及計劃書,均未列出全文閱讀階段中被排除研究的具體清單及排除理由,6 篇[22-24,26,31-32]文獻未檢驗發表偏倚及討論其對結果的影響。以上結果表明研究過程中缺乏一定規范性,進而影響了對結果的評估。
GRADE 工具是評價證據質量的一種全面、系統和明確的方法。本研究的GRADE 結果發現納入文獻的結局指標質量分級主要是低級(63.87%),導致降級的主要因素為偏倚風險和發表偏倚。12篇文獻均在偏倚風險方面有降級,具體表現在納入研究的選擇、隨機、盲法和分配等方面。部分文獻因為沒有對發表偏倚進行評估或文獻納入研究較少,導致可能存在發表偏倚風險。所有納入文獻均未描述方案注冊,降低了研究的透明度。綜合12篇文獻的結局指標及其證據質量可以得出,索拉非尼聯合TACE 比單獨使用TACE治療肝癌在提高客觀緩解率、疾病控制率、1年生存率、2 年生存率、延長疾病進展時間方面有一定優勢,證據級別大多為中低級。在不良反應方面,本研究發現索拉非尼聯合TACE會增加手足綜合征、高血壓、腹瀉、皮疹、乏力等不良反應的發生率,對于發熱、惡心、嘔吐、厭食、骨髓抑制等不良反應無明顯統計學差異,證據大多為低級。
綜上所述,本研究通過對索拉非尼聯合TACE 治療肝癌的系統評價/Meta 分析進行再評價,評估其報告質量、方法學質量和證據質量,并分析其結局指標,發現索拉非尼聯合TACE 治療肝癌比單獨使用TACE 在提高客觀緩解率、疾病控制率、1年生存率、2年生存率、延長疾病進展時間方面有一定優勢,但會增加手足綜合征、高血壓、腹瀉、皮疹、乏力等不良反應的發生率。由于納入文獻的報告質量、方法學質量和證據質量等級均不高,以上結論僅能提供參考,對臨床治療的指導作用有限,需要進一步的研究證實。因此,建議嚴謹仔細地進行臨床試驗研究,保證在研究的設計、實施和報告各方面的科學性。同時系統評價的相關分析應該嚴格遵守相關規范及流程:檢索時應擴大檢索范圍,減少選擇偏倚的影響;完善分析方法,運用更多的敏感性分析和亞組分析等方法,提高研究的一致性和精確性;詳細地描述研究的過程,公開資金來源和支持,減少發表偏倚風險。進而獲得高質量的循證醫學證據,更好地對臨床治療進行指導。