方國旭, 張清華, 黃永迎, 王建民, 劉景豐
1 福建醫科大學孟超肝膽醫院 a.肝膽胰外科, b.東南肝膽健康大數據研究所, 福州 350025;2 福建醫科大學 研究生院, 福州 350108; 3 福建省腫瘤醫院 a.流行病研究室, b.腫瘤醫學創新中心,c.肝膽胰腫瘤外科, 福州 350014
肝細胞癌(HCC)是世界范圍內最常見的消化道惡性腫瘤之一。根據國際癌癥研究機構的最新數據[1],每年約有841 080例新發病例和781 631例死亡病例,HCC在所有惡性腫瘤的發病率和死亡率中分別排名第7和第3。目前HCC的預后預測取決于組織病理學參數和腫瘤分期系統。然而,這種傳統的方法均不足以準確預測HCC患者的臨床結果。目前迫切需要改善肝癌患者的早期檢測和預后,以及幫助臨床醫生優化治療策略[2]。近年來,基因組學測序技術及生物信息學分析已經廣泛應用于不同類型的腫瘤研究,發揮越來越大的作用[3]。隨著研究的不斷深入,已經產生了多個生物信息數據庫。目前常見的公共數據庫有 The Cancer Genome Atlas(TCGA)數據庫和Gene Expression Omnibus(GEO)數據庫。生物信息數據庫為研究者們提供了大量的生物學數據[4-5]。研究者可以通過對肝癌組織和癌旁組織中的差異基因進行分析,篩選出與肝癌預后的相關特征基因,利用TCGA數據庫構建風險預測模型,利用GEO數據庫驗證模型的有效性。本文主要歸納總結基于免疫基因特征、代謝基因特征、鐵死亡基因特征、細胞自噬基因特征、m6A RNA甲基化調控因子構建的肝癌風險預測模型,為肝癌的早期檢測、預后和治療方案的優化提供新觀點。
腫瘤免疫及免疫治療是近年來腫瘤學及免疫學研究中受到極大關注的領域。腫瘤免疫治療,尤其是腫瘤微環境中免疫細胞的浸潤與免疫檢查點阻斷療法等,在腫瘤治療中取得了令人矚目的效果,為重新審視并發掘免疫系統在腫瘤發生發展中的作用提供了極好的機遇[6-7]。Chen等[8]鑒定出9個與肝癌預后相關的免疫相關基因對(immune-related gene pair,IRGP)。結合臨床特征和病理因素進行多因素分析,發現基于9個IRGP(CISH_vs_PIAS3、CISH_vs_HSPA14、SOCS2_vs_TYRO3、ACAP1_vs_CD180、MAP3K3_vs_ BTN3A3、TRIB3_vs_RORC、AGER_vs_TYRO3 、SDC4_vs_HSPD1、PLAUR_vs_CD8A)的風險評分是一個有效的獨立預后指標。9種IRGP的預后價值通過森林圖和nomogram列線圖進一步驗證,顯示其預測準確率優于腫瘤TNM分期和病理分級。Feng等[9]鑒定出17個與肝癌預后相關的IRGP。在TCGA隊列和國際癌癥基因組聯盟隊列中,患者根據IRGP特征分為高危組與低危組,低危組患者的總生存時間較高危患者長。在結合臨床特征和病理因素后,多因素分析顯示IRGP特征是一個肝癌預后的獨立危險因素。ROC曲線驗證了IRGP特征的準確性。基因集富集分析表明該特征與免疫生物學過程有關,不同風險患者的免疫微環境狀態存在差異。基于17個IRGP的特征可有效評估HCC的總生存期,并預測免疫檢查點治療反應和靶向藥物敏感性。Hu等[10]基于93個免疫相關基因(immune-related gene,IRG)對肝癌進行分子分型,一共得到5個亞組。這5組患者有不同的預后、免疫狀態和免疫檢查點的表達。隨后,在TCGA數據庫中,篩選出11個與預后相關的IRG(LCN2、S100A10、FABP6、PLXNA1、KITLG、OXTR、S100A1、CCL26、CMTM4、IL1RN、RARG),并利用國際癌癥基因組聯盟數據庫進行驗證,結果顯示,低危組與高危組患者免疫細胞浸潤水平存在差異。研究結果表明,基于IRG的HCC分類有助于解釋HCC的異質性,這可能有助于促進HCC的個體化精準治療。Huang等[11]在TCGA數據庫中采用單變量Cox回歸分析、LASSO回歸和多變量Cox回歸鑒定出5個IRG(EZH2、FTL、CFHR3、ISM2、CDK5)。基于5個IRG生成風險評分。根據風險評分的中位數進行分層,結果顯示,風險評分高的患者在1、2、3和5年后的總生存率(OS)較低,這一結果在建模組和驗證組中是一致的。此外,IRG與免疫細胞的浸潤情況相關。根據IRG和臨床特征構建的風險預測模型,能夠預測患者1、3和5年的OS,AUC高達0.8。這些結果表明,用于基于IRG的風險預測模型可用于監測治療策略的有效性和預后預測。Wang等[12]構建基于13個IRG(SPP1、STC2、HSPA8、IL15RA、BLNK、TRAF3、NOD2、GRB2、ACTG1、HDAC1、S100A9、PSMD1、EPO)的風險預測模型,研究顯示,高危組和低危組患者的OS差異與免疫浸潤、腫瘤免疫微環境和多種信號通路的相互作用有關。
越來越多的證據表明,能量代謝重編程在HCC的發生和發展中起重要作用,特別是有氧糖酵解。有氧糖酵解能迅速產生足夠的三磷酸腺苷,滿足腫瘤在缺氧條件下生長和增殖的能量需求,有氧糖酵解在腫瘤的增殖、生長、侵襲和治療中起著重要作用[13-14]。Chen等[15]鑒定出與肝癌預后相關的4個糖酵解相關基因(CDCA8、RAB5IF、SAP30和UCK2)。Wang等[16]鑒定出與肝癌預后相關的8個糖酵解相關基因(PAM、NUP155、GOT2、KDELR3、PKM、NSDHL、ENO1和SRD5A3)。Zhou等[17]鑒定出與肝癌預后相關的17個糖酵解相關基因對 (HMMR_PFKFB1、CHST1_GYS2、MERTK_GYS2、GPC1_GYS2、LDHA_GOT2、IDUA_GNPDA1、IDUA_ME2、IDUA_G6PD、IDUA_GPC1、MPI_GPC1、SDC2_LDHA、PRPS1_PLOD2、GALK1_IER3、MET_PLOD2、GUSB_IGFBP3、IL13RA1_IGFBP3和CYB5A_IGFBP3)。基于上述糖酵解相關基因,構建肝癌預后風險預測模型,KM曲線表明低風險組患者的OS比高危組患者OS更長。ROC曲線顯示了該模型具有較好的預測效果。通過單因素和多因素Cox分析,證明該風險評分是一個獨立的預后因素,與TNM臨床特征結合,能夠進一步提高模型的預測準確性。
脂肪酸合成、β-氧化和細胞脂質組成的改變有助于HCC的發生和發展[18]。Wang等[19]鑒定出3個具有肝癌預后價值的脂質代謝相關基因(ME1、MED10、MED22),并基于該基因計算每個肝癌患者的風險評分,結果顯示,高危組HCC患者的生存率明顯低于低危組患者,多因素Cox回歸分析顯示該風險評分是肝癌的獨立預后因素。此外,這一特征還能對HCC患者的預后提供高度準確的預測。研究結果闡述了脂質代謝和HCC之間的密切聯系,并促進基于代謝治療HCC的發展。
氨基酸作為中間代謝物影響脂類、谷胱甘肽、核苷酸、葡萄糖胺和多胺的生物合成,以及細胞增殖和三羧酸循環碳[20-22]。肝臟是蛋白質合成、降解和解毒的重要器官,也是氨基酸代謝的重要器官[23]。Zhao等[24]基于9個氨基酸代謝相關基因(B3GAT3、B4GALT2、CYB5R3、GNPDA1、GOT2、HEXB、HMGCS2、PLOD2和SEPHS1)構建肝癌預后風險預測模型,根據風險評分將患者分為高危組和低危組,結果顯示,低危組患者風險評分較低,生存時間較長。單因素和多因素Cox回歸證實該評分是HCC的獨立風險因素。ROC曲線顯示,該評分可預測HCC患者1、2、3和5年生存率的AUC分別為0.813、0.770、0.744、0.702 。
鐵死亡是一種新的鐵依賴細胞死亡形式,其特征是鐵過度積累和脂質過氧化,與其他眾所周知的細胞死亡在形態學、遺傳學和生化上均不同。由于肝臟易受氧化損傷,鐵過度積累是大多數肝臟疾病的主要特征。近年來,鐵死亡在肝臟疾病領域迅速受到關注[25]。Lian等[26]鑒定出10個鐵死亡相關基因(SLC7A11、G6PD、CISD1、CARS、SLC1A5、ACACA、ACSL3、NQO1、NFS1、GPX4),結果顯示,與低危組相比,高危組患者OS明顯降低。在多因素Cox回歸分析中,該評分是OS的獨立預測因子。AUC證實了該模型的預測能力。研究表明,鐵死亡特征基因可以用于HCC的預后預測,提示以鐵死亡特征基因為靶點可能是HCC的一種新的治療選擇。Wan等[27]在TCGA隊列中,從70個差異表達的基因(DEG)中鑒定出5個鐵死亡特征基因(G6PD、HMOX1、LOX、SLC7A11、STMN1),構建HCC風險預測模型,Kaplan-Meier 曲線生存分析顯示,低危組的OS顯著高于高危組。來自GSE14520隊列的數據證實了這一結果。KEGG和GO功能富集分析表明,風險組間的OS差異與免疫相關通路密切相關。進一步分析表明,腫瘤微環境可能是導致風險組間預后差異的原因。Chen等[28]基于2個鐵死亡相關mRNA(SLC1A5、SLC7A11)和8個鐵死亡相關長鏈非編碼RNA(lncRNA)(AC245297.3、MYLK-AS1、NRAV、SREBF2AS1、AL031985.3、ZFPM2-AS1、AC015908.3和MSC-AS1),并在此基礎上構建肝癌風險預測模型,訓練組和驗證組的AUC分別為0.830和0.806。決策曲線分析顯示,基于鐵死亡基因的風險評分的預測能力優于所有病理特征。多因素Cox回歸分析顯示,基于鐵死亡基因的風險評分是一個獨立的預后因素。通過Kaplan-Meier 曲線,可以明確區分低、高危患者的生存概率。Liang等[29]鑒定出3個與HCC預后相關的鐵死亡相關lncRNA(RHPN1-AS1、 MAPKAPK5AS1、PART1),結果顯示,與低風險組相比,高危組HCC患者的OS更短。這一特征可作為HCC預后的獨立預測因子,并在GEO隊列中得到了驗證。同時,鐵死亡相關lncRNA評分的預測準確性高于基于性別、年齡、年級、分期和病因等評分的工具。這一特征與免疫細胞浸潤(如巨噬細胞、髓樣樹突狀細胞和中性粒細胞等)和免疫檢查點(PD-1、CTLA-4和TIM-3)有關。Xu等[30]基于9個鐵死亡相關lncRNA (CTD-2033A16.3、CTD-2116N20.1、CTD-2510F5.4、DDX11-AS1、LINC00942、LINC01224、LINC01231、LINC01508和ZFPM2-AS1)構建肝癌的風險預測模型,基因集富集分析表明,這些lncRNA介導的信號通路可能通過干擾腫瘤壞死因子a/核因子κB、IL-2/信號轉導因子和轉錄激活因子5、細胞因子/細胞因子受體調控肝癌免疫微環境。Spearman相關分析表明,靜息記憶CD4+T淋巴細胞、卵泡輔助T淋巴細胞、調節性T淋巴細胞、M0巨噬細胞等浸潤性免疫細胞亞型在高危組和低風險組之間存在顯著差異。研究結果為肝癌中與鐵死亡相關的lncRNA提供了一個有前景的見解,并為患者的預后和免疫治療提供了一個個性化的預測工具。
細胞自噬是真核生物中進化保守的對細胞內物質進行周轉的重要過程。該過程中一些損壞的蛋白或細胞器被雙層膜結構的自噬小泡包裹后,送入溶酶體或液泡中進行降解并得以循環利用。在腫瘤中,自噬可能在腫瘤發生的早期階段發揮抑制作用。然而,越來越多的證據[31-32]表明,在已經形成的腫瘤中,自噬可以幫助應對細胞內環境壓力的變化,如缺氧、營養缺乏等惡習環境,從而促進腫瘤的存活。Huo等[33]在HCC患者中共發現62個差異表達的自噬相關基因(autophagy-related gene,ARG)。單因素和多因素回歸確定了5種與肝癌患者OS相關的ARG(HDAC1、RHEB、ATIC、SPNS1和SQSTM1)。重要的是,基于ARG的風險評分是肝癌預后的獨立風險因素。此外,預后風險模型的AUC為0.747,表明該模型在預測HCC預后方面具有較高的準確性。有趣的是,在HCC細胞系中,風險相關的ARG與化療藥物敏感性相關。Yang等[34]共鑒定出27個差異表達ARG,通過Cox回歸和LASSO回歸分析,鑒定出3種OS相關ARG (SQSTM1、HSPB8和BIRC5)。基于這3種ARG建立預后預測模型,在TCGA隊列和GEO驗證隊列中,風險評分高的HCC患者預后較差,風險評分曲線的AUC分別為0.756和0.672。此外,校正曲線和C指數表明,基于ARG的風險預測模型的預測能力較好,可能是預測HCC患者預后的一種有前景的工具。Cao等[35]鑒定出與細胞自噬相關的13個基因對(PRKCD/TP53、BAX/GABARAPL1、ATIC/PARP1、CDKN2A/ERBB2、BIRC6/FOXO1、BAK1/DAPK1、PINK1/RAB24、GDAC6/HGS、CX3CL1/HSPB8、DLC1/HSPB8、APOL1/EIF4EBP1、ARNT/HIF1A、CX3CL1/NPC1)。Kaplan-Meier曲線分析表明,高危組患者的OS明顯差于低危組,并發現自噬相關的風險評分與免疫細胞的浸潤有關。Wu等[36]篩選出78個差異表達的自噬相關lncRNA,并使用4個與肝癌預后相關lncRNA(LUCAT1、AC099850.3、ZFPM2-AS1和AC009005.1)建立預后模型,可作為HCC患者的獨立預后因素,并且1、3、5年生存率的預測效率高于其他臨床病理因素(AUC分別為0.764、0.738、0.717)。此外,生物信息學分析結果顯示,LUCAT1和ZFPM2-AS1可能分別通過HSA-Mir-495-3p/DLC1和HSA-Mir-515-5P/DAPK2軸影響HCC的自噬活性。 Yang等[37]篩選出7個自噬相關lncRNA(PRRT3-AS1、RP11-479G22.8、RP11-73M18.8、LINC01138、CTD-2510F5.4、CTC-297N7.9、RP11-324I22.4),Kaplan-Meier分析表明,風險評分低的患者預后明顯優于風險評分高的患者 ,該風險評分的預后預測準確度(AUC=0.786)顯著高于ALBI, Child-Pugh, AFP和AJCC_stage。
表觀遺傳是研究基因的核苷酸序列不發生改變的情況下,基因表達的可遺傳變化。甲基化修飾占所有RNA修飾的60%以上,而m6A是信使RNA、microRNA和長鏈非編碼RNA中最常見的內部修飾,在轉錄、加工和代謝中起著關鍵的調節作用。m6A修飾與腫瘤增殖、分化、腫瘤發生、增殖、侵襲和轉移有關,在惡性腫瘤中起癌基因或抑癌基因的作用[38]。Zhang等[39]基于13個 m6A RNA甲基化調控因子的表達水平,通過共識聚類分析,識別出兩個亞群(聚類1和2)。與聚類1相比,聚類2預后較差,且與較高的組織學分級和病理分期顯著相關。此外,聚類2在癌癥相關通路中顯著富集。研究人員進一步構建基于5個m6A RNA甲基化調控因子(ZC3H13、KIAA1429、METTL3、YTHDF1、YTHDF2)的肝癌預后風險預測模型,并在GEO數據集中得到成功驗證。最后,建立了基于年齡、性別、組織學分級、病理分期和風險評分的綜合預測模型,能夠提高模型的預測能力。Xu等[40]篩選出19個m6A調控因子,根據m6A調控因子的共識聚類,被分為2組(聚類1和聚類2)。研究發現m6A調控因子在聚類1中表達上調。與聚類2相比,聚類1與較高的程序性死亡配體1表達水平、較低的免疫評分、較差的預后和免疫細胞浸潤有關。基于單變量Cox和LASSO回歸分析,識別出5個m6A調控因子(WTAP、METTL3、HNRNPC、YTHDF1、YTHDF2),研究發現高危組與較高的程序性死亡配體1表達水平、較高的分級和較差的OS密切相關。在訓練數據集中,1、3、5年的AUC分別達到0.77、0.67和0.68。在驗證數據集中,1、3、5年的AUC分別為0.7、0.63和0.55。基因集富集分析顯示MTOR信號通路和WNT信號通路與聚類1和高危組相關。
綜上所述,研究表明m6A調控因子與HCC的腫瘤免疫微環境顯著相關。基于m6A調控因子的風險評分可以預測HCC患者的預后,為提高免疫治療療效提供新的治療靶點。
TCGA和GEO數據庫相關研究尚有一定的局限性。首先,這些研究僅僅是回顧性研究,缺乏前瞻性研究。第二,目前大多數研究基于免疫基因特征基因、代謝基因特征基因、鐵死亡基因特征基因、細胞自噬基因特征基因、m6A RNA甲基化調控因子等方面,還有很多在HCC中起重要作用的預后基因尚有待進一步挖掘。第三,目前篩選出的基因缺乏基礎實驗的進一步驗證。因此,有必要進一步探索更多的肝癌早期檢測分子標志物和影響肝癌預后的分子標志物,以提高早期肝癌檢測率和鑒別出肝癌預后高危人群;有必要進一步開展嚴格的前瞻性和多中心臨床試驗,驗證風險預測模型的準確性和有效性;有必要進一步通過基礎實驗對篩選出的分子標志物進行驗證,尋找肝癌的潛在治療靶點。目前,處于大數據快速發展的時代,對大數據進行挖掘和分析有助于探索重要的生物學規律。因此,生物信息學對于醫學和生物學的發展極其重要,在生物醫學領域中具有廣闊的應用前景。
利益沖突聲明:所有作者均聲明不存在利益沖突。
作者貢獻聲明:方國旭負責撰寫論文;張清華、黃永迎和王建民負責修改論文;劉景豐負責擬定寫作思路,指導撰寫文章并最后定稿。