劉川銘,李 謝,盧熙奎,曾點點,陳 潔
(1.大理大學藥學院,云南 大理 671000;2.大理大學公共衛生學院,云南 大理 671000;3.昆明市第三人民醫院藥學部,昆明 650041)
肝細胞癌(hepatocellular carcinoma,HCC)是原發性肝癌中最常見的一種類型,約占所有病例數的75%~85%,5年存活率僅為18%〔1〕。HCC早期無特異癥狀,患者就診時多處于中晚期,預后較差。甲胎蛋白、分泌型蛋白Dickkopf-1和高爾基體蛋白73等生物標志物對于HCC的診斷和預后并不理想〔2〕。T、N和M分期作為一種傳統的預后預測方法,由于其無法實現患者個體化的生存預測,故缺乏一定的準確性。因此,確立新的預后模型對于HCC患者來說是非常重要的。
細胞焦亡作為一種新的程序性細胞死亡方式,與腫瘤的發生、發展和抗腫瘤免疫功能的激活有關,由于其介導了白細胞介素(interleukin,IL)-1β和IL-18等可能促進癌癥進展的炎癥介質的釋放,因此有研究認為細胞焦亡具有促進腫瘤發生的作用〔3〕,且IL-1β可提高HCC中缺氧誘導因子1α的表達水平,誘導上皮間質轉化過程進而促進腫瘤轉移〔4〕。既往的研究〔5-6〕也顯示焦亡相關基因(pyroptosis-related genes,PRGs)可有效預測肺腺癌和卵巢癌等患者的預后情況。應樂倩等〔7〕的研究表明細胞焦亡與炎癥反應評分對預測HCC患者的預后具有較高的準確性,且預測預后的有效性不亞于現有的臨床病理指標。
本研究基于與HCC預后密切相關的PRGs構建了預后風險模型,該模型通過風險評分來預測和評估HCC的預后,為HCC患者的臨床診斷和治療指導提供個體化的模型,同時結合風險評估與臨床特征繪制列線圖以提高預測預后的效率。
1.1 材料
1.1.1 HCC患者數據的收集 在TCGA(https://portal.gdc.cancer.gov/)數據庫中下載肝癌患者的轉錄組數據和臨床數據,共獲得50例正常樣本和374例HCC樣本,臨床數據主要包括生存時間、生存狀態、年齡、性別、分級、stage分期以及T、N和M分期。
1.1.2 PRGs表達量數據的獲取 通過查閱相關文獻〔5,8-11〕以 及 在GeneCards(https://www.genecards.org/)數據庫中以“pyroptosis”作為關鍵詞進行檢索,收集到207個PRGs,利用“limma”軟件包提取得到192個PRGs的表達量數據。
1.2 方法
1.2.1 PRGs的差異分析 利用R語言“limma”軟件包中的“wilcox.test”篩選192個PRGs中具有顯著差異表達的焦亡相關基因(differential expression of pyroptosis-related genes,DEPRGs),篩選條件為|log2FC|>1,FDR<0.05。
1.2.2 DEPRGs的GO功能富集和KEGG信號通路分析 利用“org.Hs.eg.db”和“clusterProfiler”軟件包對DEPRGs進行GO功能富集分析。將DEPRGs上傳至DAVID(https://david.ncifcrf.gov/)數據庫進行KEGG信號通路分析,篩選P<0.01的條目。
1.2.3 HCC預后相關PRGs的確定 使用StrawberryPerl軟件將DEPRGs與臨床數據中的生存時間和生存狀態進行合并,通過R語言中的“survival”軟件包單因素COX分析出與HCC預后相關的PRGs,顯著性過濾條件為P<0.05。
1.2.4 預后風險模型的建立 采用R語言“survival”軟件包中的多因素COX分析進行優化,根據AIC值構建最優模型,獲得用于構建預后風險模型的基因,并得到相應的回歸系數(Coef)。根據風險基因的表達量和多因素COX分析得到的回歸系數,建立風險評分公式,風險評分=(風險基因1的表達量×Coef1)+(風險基因2的表達量×Coef2)+(…)+(風險基因n的表達量×Coefn)。
1.2.5 預后風險模型的評估 以風險評分的中位數作為截斷值,將患者分為高風險組和低風險組。采用K-M生存曲線評估高風險組和低風險組的生存率,繪制受試者操作特征曲線(receiver operator characteristic curve,ROC曲線),根據ROC曲線的曲線下面積(area under the curve,AUC)評估模型的預測價值。使用R語言對風險評分進行單因素和多因素的獨立預后分析,并通過“rms”軟件包繪制基于風險模型的列線圖預測肝癌患者未來幾年的生存概率。
1.2.6 統計分析 使用R語言和Perl語言包對數據進行分析處理及繪圖,基因表達量數據統一進行對數轉換,P<0.05為差異有統計學意義。
2.1 識別顯著DEPRGs篩選得到了58個DEPRGs,其中55個顯著上調,分別為GSDMD、GSDME、GSDMB、GSDMC、NLRP1、CASP8、PYCARD、DHX9、NLRP9、CASP3、APIP、KCNQ1OT1、TREM2、MALAT1、GJA1、VDR、AGER、UTS2、CTSV、KLF3-AS1、BSG、IL32、CDKN2B-AS1、SQSTM1、IRF3、ADORA2A、METTL3、PECAM1、TRIM31、MIR25、MRE11、PARP1、MKI67、IL36G、VIM、BIRC3、LY96、GLMN、IRGM、NOS2、TP63、POP1、ANXA2、TLR9、ASIC1、CGAS、GAS5、NOD1、PLCG1、BAK1、BAX、CHMP3、CHMP4C、CYCS、IL1A;3個顯著下調,分別為IL1B、IL1RN、IL6。
2.2 DEPRGs的GO功能富集和KEGG信號通路分析結果GO功能富集結果顯示,生物過程方面主要涉及細胞焦亡、脂多糖反應、正向調節IL-6的產生和對腫瘤壞死因子產生的正向調節等;細胞組成主要涉及膜筏、炎性復合體、膜微區;分子功能主要涉及IL-1受體結合、BH結構域結合、磷脂酰肌醇磷酸結合。見表1。KEGG信號通路富集分析主要涉及NOD樣受體信號傳導途徑、非酒精性脂肪性肝病、Toll樣受體信號傳導途徑、乙型肝炎、癌癥信號通路和腫瘤壞死因子信號通路等。見表2。
2.3 預后相關PRGs的篩選將58個DEPRGs的表達量數據與臨床數據中的生存時間和生存狀態進行合并,通過單因素COX分析過濾得到23個與HCC預后相關的PRGs。見表3。
2.4 PRGs預后風險模型的建立對23個預后PRGs進行多因素COX分析,確定其與HCC患者的預后顯著相關,最終獲得了8個可用來構建預后風險模型的基因,分別為DHX9、TREM2、CTSV、BSG、SQSTM1、PARP1、GLMN和NOD1。根據風險基因的表達量與多因素COX分析得到的回歸系數計算風險評分。見表4。風險評分=(DHX9的表達量×0.443)+(TREM2的 表 達 量×0.135)+(CTSV的 表 達 量×0.224)+(BSG的表達量×0.228)+(SQSTM1的表達量×0.274)+(PARP1的表達 量×(-0.314))+(GLMN的表達量×0.608)+(NOD1的表達量×(-0.534))。
2.5預后風險模型的驗證以風險評分的中位數作為截斷值將患者分為高風險組(n=185)和低風險組(n=185),采用K-M生存曲線對高風險組和低風險組患者的生存率進行分析,結果顯示高、低風險組患者的生存率差異有統計學意義(P<0.001)。見圖1A。風險曲線中患者的風險評分按升序排列,從左到右患者的風險值逐漸增大。見圖1B。患者的生存狀態則以散點圖的形式呈現,結合了風險評分、生存時間和生存狀態,隨著風險值的增大患者的病死例數增多,風險值減小時患者的病死例數下降。見圖1C。

圖1 預后模型的風險分析
在單因素的獨立預后分析中,風險評分與生存時間和生存狀態顯著相關(HR=1.411,P<0.001)。多因素的獨立預后分析也顯示風險評分與生存時間和生存狀態顯著相關(HR=1.352,P<0.001),其他的臨床數據并不是獨立的預后因子(P>0.05)。見表5。此外,ROC曲線結果顯示,相較于其他臨床數據,風險評分的AUC最高(0.802),表明風險評分的預測價值高于其他臨床數據。見表6。因此,風險評分在預測肝癌的臨床預后方面具有可靠性,可作為獨立預后因子。本研究通過將風險評分與年齡、性別及T、N和M分期等臨床數據相結合,構建了用于預測肝癌患者1、3、5年生存率的列線圖。見圖2。

圖2 肝癌患者預后的列線圖

表5 風險評分的預后預測價值

表6 ROC曲線中各變量的AUC值
HCC是臨床最常見的惡性腫瘤之一,盡管免疫療法和靶向療法等新的治療方法對其治療效果已有所提高,但患者5年的生存率仍然低于20%,許多患者確診時疾病已進入晚期,患者的預后相對較差。生物信息學分析在闡明眾多差異表達基因的作用機制以及評估HCC發生發展的復雜性方面具有重要意義,目前生物信息學分析已被證明在許多腫瘤的診斷、治療和預后中都發揮著越來越重要的作用〔12〕。本研究利用單因素和多因素COX分析確定了8個與HCC預后顯著相關的PRGs,即BSG、CTSV、DHX9、GLMN、NOD1、PARP1、SQSTM1和TREM2基因。
BSG作為一種免疫球蛋白超家族的跨膜糖蛋白,又稱CD147或EMMPRIN,可參與免疫反應的調節,在活化的淋巴細胞中強烈表達。BSG在大多數人類惡性腫瘤中過度表達,腫瘤細胞中的BSG活性被認為是由腫瘤相關的與半乳糖凝集素-3、透明質酸和單羧酸轉運蛋白4等具有結合活性的多糖過度表達而增強〔13-14〕。BSG在腫瘤中的過度表達通常被認為是一個不利的預后標志〔13,15〕,其可促進腫瘤細胞產生基質金屬蛋白酶、血管內皮生長因子以及透明質酸,進而促進這些細胞的遷移、增殖和血管生成〔16-17〕。Xu等〔18〕的研究結果顯示,CD147可通過促進腸上皮細胞中核因子κB(nuclear factor-κB,NF-κB)p65的磷酸化,增強腸上皮細胞中IL-1β與IL-18的表達和分泌,進而誘導腸上皮細胞的細胞焦亡。此外,有報道〔19〕HCC中組織蛋白酶L2(又稱CTSV)的mRNA和蛋白水平均有所增加,蛋白酶L2的表達升高與HCC的不良預后相關。Leng等〔20〕的研究發現,高遷移率族蛋白B1(high mobility group protein B1,HMGB1)可增加膜穿孔蛋白D氨基末端的表達,沉默組織蛋白酶V可逆轉HMGB1誘導的細胞焦亡;HMGB1可增加溶酶體的通透性,而沉默組織蛋白酶V可減弱HMGB1誘導的含半胱氨酸的天冬氨酸蛋白水解酶-1(cysteinyl aspartate specific proteinase-1,Caspase-1)激活。
DEAH盒解旋酶9(DEAH-box helicase 9,DHX9)是一種依賴三磷酸核苷酸的RNA解旋酶,屬于DExD/H-Box超家族Ⅱ類解旋酶,它的過度表達與腫瘤細胞的增殖、轉移及患者的預后密切相關。Shi等〔21〕檢測了DHX9在肝癌組織中的表達及其在細胞中的功能,并進一步分析了DHX9與HCC患者預后的相關性,研究結果提示DHX9可能是一個促進肝癌細胞增殖、侵襲和轉移的癌基因。此外,DHX9還可能在DNA介導的先天性免疫反應中發揮重要作用,DHX9通過其DUF1605結構域識別CpG-BDNA,并作為傳感器激活Ⅰ型干擾素反應,將信號傳遞給免疫系統〔22〕。有研究〔23〕通過整合多個基因表達隊列開發了一個基于免疫相關基因的肝癌預后標志,并通過獨立隊列和實驗驗證了該模型的穩定性和可靠性,該團隊發現GLMN在腫瘤組織中的蛋白質和mRNA表達水平相較于癌旁組織顯著增加,且在GSE6764和GSE14520隊列中的差異表達結果也顯示GLMN在腫瘤中高表達。此外,Suzuki等〔24〕的研究發現GLMN-cIAPs軸控制著炎性小體的激活,而IpaH7.8-GLMN-cIAPs軸則是志賀氏菌促進巨噬細胞焦亡并引起嚴重炎癥的獨特機制。
核苷酸結合寡聚化結構域(nucleotide-binding oligomerization domain,NOD)1作為NOD樣受體亞家族NLRC中的主要代表與TLR、RIG樣受體和C型凝集素家族共同構成了先天病原體模式識別系統。焦亡是Caspase-1依賴性炎癥細胞死亡的一種形式,也可發生在吞噬細胞中,作為炎性小體激活的結果。NLR的家族成員是炎癥體激活的核心成分,可作為與Caspase-1前體進行蛋白相互作用的平臺。Guo等〔25〕的研究結果亦顯示吳茱萸堿對肝癌細胞的抑制作用可能是通過抑制NOD1信號通路來實現的。研究發現聚(ADP-核糖)聚合酶1(poly(ADP-ribose)polymerase 1,PARP1)可激活NF-κB轉錄因子,該轉錄因子激活參與炎癥和癌細胞存活的相關基因的轉錄,PARP1還通過激活細胞外調節蛋白激酶和c-Jun N-末端激酶信號通路來促進腫瘤的形成和轉移〔26〕。在卵巢癌、肝細胞癌、結直腸癌和白血病等惡性腫瘤中,PARP1的mRNA、蛋白質和酶活性水平都有所升高〔27-29〕。劉梅等〔30〕的研究發現PARP1作為碘化鉀誘導的高表達蛋白可參與調控NF-κB轉錄因子的活性,并促進炎癥性細胞焦亡的發生。
Ichimura等〔31〕的研究發現p62S351位點的磷酸化顯著增加了其在選擇性自噬過程中與Keap1的結合親和力,磷酸化p62的聚集持續激活了核因子E2相關因子2(nuclear factor erythroid 2-related factor,Nrf2)信號通路,將促進肝細胞癌的發展。此外,SQSTM1基因的過度表達或異常聚集和磷酸化可導致葡萄糖和谷氨酰胺的代謝紊亂,并通過持續激活Nrf2促進丙型肝炎病毒陽性HCC的腫瘤發展〔32〕。在肝臟中,髓樣細胞觸發受體2(triggering receptor expresses on myeloid cells-2,TREM2)表達于非實質細胞,如肝竇內皮細胞、Kupffer細胞和肝星狀細胞〔33〕。TREM2在巨噬細胞和中性粒細胞中也有表達,可被募集到炎癥部位與常駐免疫細胞一起參與先天免疫調節。有研究通過單細胞RNA測序在人和小鼠纖維化的肝臟中發現了一個與瘢痕相關的巨噬細胞亞群,該亞群由TREM2+和CD9+識別,它們通過TNFRSF12A、PDGFR和NOTCH信號通路與內皮細胞和間充質細胞一起促進肝臟的纖維化〔34〕。此外,在一項以HepG2細胞和HCC模型動物為實驗對象的研究中,TREM2通過誘導PI3K/AKT信號通路進一步調節腫瘤細胞的生物學行為〔35〕。
綜上所述,本研究建立了一個基于8個焦亡相關基因的預后風險評分模型,單因素和多因素COX分析表明該預后模型計算的風險值可作為HCC患者的獨立預后因素,在ROC曲線中該模型風險評分的AUC值(0.802)為最高,表明其預測價值要明顯優于其他臨床數據,此外又構建了可用于預測結局事件發生風險的列線圖以提高預測預后的效率。在后續的研究中,將通過體外的細胞分子生物學實驗作進一步的驗證。