陳偉男 李建春 劉陽 張艷明 張海宇
原發性肝癌是起源于肝臟上皮或間葉組織的消化系統常見惡性腫瘤,具有高發病率和病死率[1]。近年來,靶向治療和免疫治療等獲得突破性進展[2]并成為研究熱點[3]。本研究將通過分析現有肝細胞肝癌測序數據,進一步分析該腫瘤異質性,發現其可能存在的不同亞型以及亞型的腫瘤演進機制,為肝細胞肝癌新的診療方法和治療策略的開發提供理論支持。
1.1 數據下載及整理 肝細胞肝癌樣本來自TCGA 數據庫(https://portal.gdc.cancer.gov/),包含肝細胞肝癌的mRNA 表達數據和拷貝數變異數據。該數據庫包含374 例肝細胞肝癌樣本mRNA 表達數據和378 例肝細胞肝癌樣本拷貝數變異數據。所納入所有數據均符合TCGA 的出版指南。采用R 軟件(v 4.0.0)中DESeq2包對mRNA 表達數據進行歸一化分析,基于中位數絕對偏差(MAD)選擇前3000 個可變性最高的編碼基因納入后續分析。
1.2 數據分析(1)肝細胞肝癌樣本數據聚類分析:采用R 軟件中NMF 包對肝細胞肝癌樣本進行無監督聚類。使用默認參數的隨機選取值,開始循環計算50次,以確定最佳等級參數,然后使用最佳等級參數循環計算300 次以獲得最終的NMF 聚類分組方案。隨后采用主成分分析(principal component analysis,PCA)降維,提取NMF 分組信息對樣本進行標記,評估聚類分組結果的一致性。(2)免疫成分分析:采用R 軟件中GSEABase 包,對樣本進行肝細胞肝癌mRNA 數據行ssGSEA 分析,分析腫瘤樣品的免疫成分,計算每個樣本每種免疫細胞的構成。使用R 軟件中ESTIMATE 包默認參數從表達矩陣中評估免疫評分和腫瘤純度。(3)篩選DEG 構建PPI 網絡:采用R 軟件中的limma 包篩選差異表達基因,通過t檢驗分析NMF1 和NMF2 兩組間的基因表達,以│log FC │≥2 和P<0.01 為篩選標準。使用R 軟件中的ggplot2 包繪制差異表達基因火山圖。VENN 網站(http://bioinformatics.psb.ugent.be/webtools/Venn/)繪制維恩圖。采用STRING(https://string-db.org/)平臺分析差異基因的蛋白信息。將蛋白互作網絡導圖cytoscape 軟件(v 3.6.1),采用cytoHubba 插件計算差異基因之間連通性權重得分,選定得分最高的基因為核心基因,且采用MOCODE 插件篩選首要模塊。(4)生物學功能分析:將差異表達基因上傳至DAVID 數據庫(https://david.ncifcrf.gov/)進行生物學功能注釋分析。采用GO(gene ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)分析將差異表達基因富集于基因功能、細胞成分以及生物學過程和信號通路等。(5)拷貝數變異分析:采用GenePattern 平臺(https://cloud.genepattern.org/gp/pages/index.jsf)的GISTIC 分析模塊分析肝細胞肝癌樣品的拷貝數變異情況。參考基因組設置為人類hg38(human genome38)版本。每個探針標記位點的擴增或缺失G-score 評分情況,反映該位點的變異深度和頻率[4]。
1.3 統計學方法 采用R 軟件。符合正態分布的計量資料以()表示,兩組間比較采用t檢驗;多組間比較采用單因素方差分析(ANOVA);計數資料采用秩和檢驗。Benjamini-Hochberg 分析用于多次檢驗后的校正。P<0.05 為差異有統計學意義。
2.1 肝細胞肝癌分子亞型的劃分 將肝細胞肝癌患者mRNA 數據通過NMF 聚類分析,可將患者明顯分為兩個不同亞組NMF1組和NMF2組(見圖1A)。隨后PCA分析將不同亞組患者樣本信息標記著色,觀察其在空間分布狀態,可見兩個亞組有明顯分界(見圖1B)。

圖1 肝細胞肝癌分子亞型劃分
2.2 不同亞型免疫成分的分析 與NMF2組比較,NMF1組免疫評分更高而腫瘤純度更低,CON組免疫評分最高,差異有統計學意義(P<0.05)(見圖2A、2C、表1)。在HLA 相關基因及免疫檢查點基因(CD274、BTLA、ICOS、IDO1、LAG-3 和TIM-3)的表達水平在三組間也顯著不同,CON組表達水平最高,而NMF2組最低,差異有統計學意義(P<0.05)(見圖2B、2D,表1)。NMF1組和NMF2組免疫細胞組成也不同,尤其幼稚B 細胞、M0 巨噬細胞、M2 巨噬細胞和單核細胞等(見圖2E)。免疫評分及浸潤情況與腫瘤純度為負相關。

圖2 A.ssGSEA免疫評分熱圖;B.HLA相關基因表達水平對比;C.免疫評分及腫瘤純度對比;D.免疫檢查點基因表達量對比;E.免疫細胞浸潤對比

表1 免疫相關評分及基因表達
2.3 差異表達基因的篩選以及蛋白網絡的構建 本研究分別篩選所有肝細胞肝癌樣本、NMF1組樣本、NMF2組樣本與正常CON組樣本間的差異表達基因。并通過VEEN 分析,篩選其共同差異表達基因和特征性差異表達基因(見圖3A)。共發現810 個基因始終在肝細胞肝癌樣本中差異表達,包括FAM83D、TRIP13、ANLN、GTSE1、CDCA3 等;有768 個基因僅在NMF1組中差異表達,包括SERPINC1、AHSG、APOA1、AFP、IGFBP1 等;有283 個基因僅在NMF2組中差異表達,包括IL6、IL10、CXCL8、CCL2、CXCL1 等(見圖3B、表2)。通過STING 數據庫構建不同分組差異表達基因的相互作用網絡,并根據基因權重篩選出各分組核心基因見圖3C。

圖3 A.各組差異表達基因火山圖;B.VEEN圖;C.各組PPI網絡,分別為全部樣本中810個差異表達基因網絡、NMF1中768個特征差異表達基因網絡、NMF2中283個特征差異表達基因網絡

表2 PPI網絡權重前10的基因
2.4 生物學功能注釋 對肝細胞肝癌始終差異表達基因、NMF1組特征差異表達基因和NMF2組特征差異表達基因進行GO 和KEGG 生物信息注釋分析。結果發現,肝細胞肝癌始終在細胞分裂、有絲分裂核分裂、染色體端粒、細胞周期和P53 信號通路等發生異常改變。NMF1組主要為代謝通路、藥物代謝、碳代謝、氨基酸代謝和PPAR 信號通路等發生改變;NMF2組的改變主要在細胞因子受體相互作用、NOD 樣受體信號通路、蛋白消化和吸收等(見圖4A-C)。NMF1組NMF2組成分改變存在區別,表明兩組腫瘤異質性明顯。通過不同分組差異表達基因的相互作用網絡分析,篩選出其首要模塊,并對模塊基因行功能通路富集分析,結果顯示肝細胞肝癌首要模塊基因富集于有絲分裂和分裂、細胞分裂和姐妹染色單體凝聚;NMF1 首要模塊基因富集于細胞外空隙、胞外區和外泌體;NMF2 首要模塊與信號轉導、趨化因子調節信號通路和趨化因子活化相關(見表3)。

圖4 A~C.各組差異表達基因GOKEGG富集的生物學功能;D~E.肝細胞肝癌拷貝數變異情況

表3 差異表達基因PPI模塊功能通路富集
2.5 拷貝數變異分析 通過GISTIC 分析肝細胞肝癌患者中的拷貝數變異情況。共發現108966 個CNV 缺失和114190 個CNV 擴增,發生拷貝數顯著改變的基因有2042 個,其中NMF1組有35 個特征差異表達基因,包 括PEBP4、DIRAS1、KISS1R、LEF1-AS1、RHCE等;NMF2組有20 個特征差異表達基因,包括DUSP5、VWA2、TLX1、ZFPM2-AS1、EFNA5(見 圖4D-E、表4)。NMF1組和NMF2組共有的拷貝數變異位點有20p13、5q11.2、17q21.2、1p13.3 和1p36.1 等。NMF1組與NMF2組拷貝數變異位點比較,NMF1組特征性拷貝數變異較明顯的位點為4q13.2,NMF2組特征性拷貝數變異較明顯的位點為1p31.1、3q29、6p21.32、8p11.22和17p11.2(見圖5)。

圖5 A~B.NMF1組肝細胞肝癌患者拷貝數變異情況;C~D.NMF2組患者肝細胞肝癌拷貝數變異情況

表4 受拷貝數變異顯著影響的DEG
本研究通過分析肝細胞肝癌的mRNA 測序數據探究肝細胞肝癌內部的異質性,并根據對不同分組差異表達基因生物學功能富集分析,探討肝細胞肝癌分子機制。研究結果表明,肝細胞肝癌始終在細胞分裂、有絲分裂核分裂、染色體端粒、細胞周期和P53 信號通路等顯著異常改變。端粒是染色體末端上的DNA 蛋白質復合體,呈現為G-四倍體,在腫瘤的發生中發揮重要作用[5]。細胞由于端粒酶活化而獲得無限增殖能力已在包括肝細胞肝癌的多種癌癥中被證實,其機制是端粒維持端粒在細胞分裂過程中長度的穩定性實現的[6]。
肝細胞肝癌患者mRNA 數據通過NMF 聚類分析,可分為NMF1 和NMF2 兩個亞型,其中NMF1組功能信號通路改變主要為代謝通路、藥物代謝、碳代謝、氨基酸代謝和PPAR 信號通路等;NMF2組的功能信號通路改變主要在細胞因子受體相互作用、NOD 樣受體信號通路、蛋白消化和吸收等。癌癥的演進和代謝關系密切,細胞代謝改變是癌癥發生導致的結果也可反作用促進癌癥進展[7]。NOD 樣受體在固有免疫應答中具有重要意義,尤其在監測細胞內微環境、調節免疫和清除病原體方面[8]。WANG 等發現NOD2 和NLRX1 基因的表達水平與肝細胞肝癌預后顯著相關[9],提示NOD 樣受體通路可作為NMF2 型肝細胞肝癌患者預后評價。
本研究通過分析NMF1 和NMF2 型肝細胞肝癌,發現NMF1 型肝細胞肝癌相較于NMF2 型免疫評分更高,免疫浸潤水平更高,腫瘤純度更低。此外,NMF1 型在免疫評分和免疫細胞組成上更接近于正常肝細胞。然而,差異表達分析和拷貝數變異結果表明,NMF2 型肝細胞肝癌差異表達基因少,且傾向更少CNV 發生,基因組更穩定。綜上所述,NMF1 型肝細胞肝癌腫瘤純度低、免疫評分高、免疫浸潤水平高且惡性程度低,可能對免疫治療反應性更好。