吳燕如 趙婉彬 于俊巖
肝癌是一種常見的惡性腫瘤,在全球癌癥中發病率居第6 位,死亡率居第3 位[1]。肝細胞癌(Hepatocellular carcinoma,HCC)作為肝癌的主要組織學類型,占肝癌診斷和死亡的絕大多數[2]。近年來HCC 的診斷和治療雖取得了許多進展,但患者的生存率仍然很低[3]。因此,尋找HCC 的生物標志物幫助指導個體化預后和治療至關重要。
銅死亡(Cuprotosis)是2022 年3 月由Tsvetkov等[4]提出的一種新型細胞死亡方式,由銅離子與三羧酸循環脂化組分的直接結合所介導。這一結合導致脂酰化蛋白聚集和鐵硫簇蛋白丟失,進而導致蛋白質毒性應激,最終誘導細胞死亡,為腫瘤治療提供了新思路。
長鏈非編碼RNA(long non-coding RNA,lncRNA)是一種長度>200 個核苷酸且一般不具備蛋白編碼能力的 RNA 分子。lncRNA 在表觀遺傳修飾、轉錄及轉錄后水平調節基因表達[5]。研究顯示,lncRNA在HCC 的發生發展中起著至關重要的作用[6]。但銅死亡相關lncRNA 在HCC 中的作用尚不清楚。本研究基于癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數據庫,通過Cox 回歸和LASSO 分析構建銅死亡相關lncRNA 預后風險模型并對其預測效能進行評估。
1.1 數據下載與處理從TCGA 數據庫(https://portal.gdc.cancer.gov/)下載HCC 轉錄組、基因突變和相應的臨床信息數據并整理,根據人類基因注釋文件提取lncRNA。
1.2 銅死亡相關lncRNA 的篩選通過文獻檢索獲得19 個銅死亡相關基因[4,7~9],采用Pearson 相關性分析篩選銅死亡相關lncRNA(Pearson 相關系數>0.4,P<0.001)。
1.3 構建預后風險模型及評估采用 R 軟件“caret”包將樣本按1:1 分為訓練集和驗證集。在訓練集中采用Cox 回歸分析和LASSO 回歸構建預后風險模型。風險評分公式如下:
β 表示回歸系數,Exp 表示lncRNA 表達水平,n 為參與模型構建的lncRNA 數量。根據風險評分的中位值,將訓練集和驗證集患者分為高、低風險組,采用R 軟件“survival”包繪制Kaplan-Meier 生存曲線,“survival ROC”包繪制受試者工作特征曲線(Receiver operating characteristic curve,ROC),計算曲線下面積(Area under curve,AUC)。使用R 軟件“scatterplot3d”包繪制主成分分析(Principal component analysis,PCA)圖評估高、低風險組之間的潛在差異。
1.4 構建列線圖將臨床病理特征與風險評分納入單因素和多因素Cox 回歸分析,評估影響HCC 患者預后的獨立因素。使用R 軟件構建列線圖,預測和分析HCC 患者1、3、5 年生存率。校正曲線用于檢驗列線圖的準確性。
1.5 功能富集分析采用 R 軟件“ limma”包,以|log2FC|>1,FDR<0.05 為標準,篩選高、低風險組差異表達基因并繪制熱圖。使用“clusterProfiler”包進行基因本體論(Gene ontology,GO)富集分析和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路分析?;趩螛颖净蚣患治觯╯ingle sample gene set enrichment analysis,ssGSEA)對免疫細胞的浸潤及功能進行評估。
1.6 計算腫瘤突變負荷(Tumor mutational burden,TMB)評分使用R 軟件“maftools”包對基因突變數據進行分析繪制瀑布圖。“ limma”、“ggpubr”包用于繪制高、低風險組小提琴圖。根據中位截斷值將HCC 患者分為高、低TMB 組,使用“survival”包繪制生存曲線。
1.7 統計學分析采用R 軟件4.2.1 進行Pearson 相關性分析、Cox 回歸、LASSO 回歸、Kaplan-Meier曲線分析。計數資料采用χ2檢驗,計量資料采用Wilcoxon 秩和檢驗。P<0.05 為差異有統計學意義。
2.1 銅死亡相關lncRNA 的鑒定從374 例HCC 組織樣本和50 例正常肝臟組織樣本RNA 測序數據中提取出16 773 個lncRNA,通過共表達分析獲取381 個銅死亡相關lncRNA,見圖1。

圖1 銅死亡相關基因與銅死亡相關lncRNA ?;鶊D
2.2 構建銅死亡相關lncRNA 預后風險模型及評估將370 例有完整信息的樣本分為訓練集(185 例)和驗證集(185 例),χ2檢驗結果顯示兩組間一般資料比較,差異無統計學意義(P>0.05),見表1。在訓練集中行單因素Cox 回歸分析獲得41 個顯著影響預后的銅死亡相關lncRNA(圖2A),納入LASSO 回歸篩選出16 個lncRNA(圖2B),多 因素Cox 回歸分析進一步確定7 個基因構建風險模型,其中AC105020.1、CHASERR 是HCC 患者預后保護因素,FOXD2-AS1、MIR4435-2HG、NRAV、RNF216P1、SNHG3 是預后危險因素。根據風險評分中位值將訓練集和驗證集患者分為高、低風險組,生存相關圖形(圖3)顯示高風險組HCC 患者的預后較低風險組差(P<0.05)。ROC 曲線結果顯示訓練集(圖4A)1、3、5 年的AUC 值分別為0.819、0.822、0.814,驗證集(圖4B)AUC 值為0.737、0.651、0.659。整個測試集中風險評分的AUC 值最高,提示風險模型較臨床病理特征可更好地預測HCC 患者預后(圖4C)。PCA 圖顯示所有基因(圖4D)、銅死亡相關基因(圖4E)、銅死亡相關lncRNA 的表達(圖4F)均未能區分出高、低風險組的差異。HCC患者根據參與模型構建的7 個銅死亡相關lncRNA的表達情況被分為兩個不同的集群(圖4G)。

表1 訓練集和驗證集HCC 患者的臨床特征[n(%)]

圖2 7 個銅死亡相關lncRNA 的篩選

圖3 訓練集和驗證集高、低風險組生存相關圖形

圖4 ROC 曲線及PCA 圖
2.3 篩選HCC 患者預后獨立危險因素單因素和多因素Cox 回歸分析(圖5A、圖5B)結果顯示,風險評分和病理分期為影響HCC 患者預后的獨立危險因素(P<0.05)。結合臨床病理特征和風險評分建立列線圖(圖5C)預測HCC 患者1、3、5 年的生存率。校正曲線(圖5D)證實了預后模型的預測能力。

圖5 風險模型驗證
2.4 GO 富集分析、KEGG 信號通路分析及免疫功能分析對高、低風險組基因表達進行分析,篩選出482 個差異表達基因。GO 富集分析結果顯示,差異表達基因主要涉及細胞器裂變、核分裂、有絲分裂等生物學過程,主要富集的細胞成分包括染色體、紡錘體、凝聚染色體,分子功能主要富集在微管結合、血紅素結合、四吡咯結合(圖6A)。KEGG 信號通路分析結果顯示差異表達基因主要參與細胞周期、細胞衰老、卵母細胞減數分裂等通路(圖6B)。免疫功能分析(圖6C)結果顯示,樹突狀細胞、巨噬細胞、肥大細胞、調節性T 細胞、Ⅱ型干擾素和MHC Ⅰ類在高、低風險組中差異有統計學意義,表明銅死亡可能與腫瘤免疫有關。

圖6 功能富集分析
2.5 評估高、低風險組TMB 整理HCC 患者基因突變數據,計算TMB 評分。圖7A 所示高風險組突變負荷比低風險組高。瀑布圖(圖7B、圖7C)結果顯示高、低風險組突變率分別為85.95%、76.14%,突變頻率最高的基因分別為TP53、CTNNB1。高、低TMB 組生存曲線結果顯示高TMB 組患者生存率低(圖7D)。聯合生存分析結果顯示TMB 和風險評分對HCC 患者生存期有顯著影響(圖7E)。

圖7 TMB 分析
銅死亡是新發現的一種程序性細胞死亡方式,參與腫瘤的發生和進展。lncRNA 可在癌癥發展過程中調節細胞增殖、凋亡、侵襲、轉移及代謝,參與重塑腫瘤微環境[10]。目前很少有研究探索銅死亡相關lncRNA 在HCC 中的作用。
本研究中,首先我們通過共表達分析得到與銅死亡相關的lncRNA,并進行單因素和多因素 Cox回歸分析及LASSO 回歸分析,建立了銅死亡相關lncRNA 預后風險模型。然后,通過生存分析、ROC曲線、PCA 圖評估了該模型的準確性,結果顯示高風險組患者具有更差的預后,該模型可以有效預測HCC 患者1、3、5 年生存率,AUC 值均大于0.65。PCA 圖直觀地顯示了高、低風險組之間的差異。隨后,采用單因素和多因素Cox 回歸分析進一步探討了臨床病理特征和風險評分對HCC 預后的影響,結果顯示風險評分、病理分期是HCC 的獨立預后因素。另外,利用列線圖構建個體化預后預測模型,校準曲線顯示實際和預測的生存期高度一致?;谏鲜鼋Y果,我們認為本研究中構建的預后風險模型是HCC 患者有效的預后指標。此外,為了探索差異表達基因的潛在作用機制,我們進行了功能富集分析。GO 和KEGG 分析表明,這些差異基因主要富集在細胞周期、細胞衰老中。免疫功能分析結果顯示,在高、低風險組中樹突狀細胞、巨噬細胞、肥大細胞、調節性T 細胞、Ⅱ型干擾素和MHC Ⅰ類差異有統計學意義,表明銅死亡可能與腫瘤免疫有關。最后,通過對基因突變數據進行分析發現高風險組TMB 高于低風險組,提示免疫治療可能對HCC 高風險組患者更有益。
納入模型的7 個lncRNA 中大部分已被證實與HCC 的進展相關。文獻報道,FOXD2-AS1 通過調控miR-206/MAP3K1 軸、miR-185/AKT 軸從而促進HCC 的進展[11,12]。MIR4435-2HG 可以上調B3GNT5、miRNA-487a 的表達進而誘導肝癌的發生[13,14]。NRAV 通過靶向miR-199a-3p 調控CISD2 進而激活Wnt/β-catenin 信號通路,從而導致肝癌細胞增殖和侵襲[15]。SNHG3 過表達可以促進HCC 的增殖、遷移和上皮-間質轉化,通過miR-326/SMAD3/ZEB1軸促進肝細胞腫瘤的進展[16]。我們的研究結果顯示,FOXD2-AS1、MIR4435-2HG、NRAV、SNHG3在高風險組中高表達,與HCC 患者生存狀態差有關,這與以往研究結果一致。另有文獻報道,CHASERR 的缺失使CHD2 mRNA 和蛋白質水平大幅增加,進而通過抑制高表達基因下游的啟動子導致轉錄干擾,影響小鼠存活時間[17]。本研究中CHASERR 作為低風險基因,有利于HCC 患者預后,其作用機制有待進一步研究。
綜上,本研究構建了一個包含7 個銅死亡相關lncRNA 的預后模型,具有良好的預測效能,Cox 回歸分析結果顯示,風險評分與病理分期是HCC 患者預后的獨立危險因素,為HCC 患者個體化治療提供參考。本研究有一定的局限性,該風險模型是基于公開數據庫創建的,且在同一個數據庫中進行驗證,缺乏新的臨床樣本和數據,需在臨床試驗中進一步驗證。