趙鈺珊,冀夢蝶,董昱誠,郭 鑫,宋博淵,陳 陽
(中國醫學科學院基礎醫學研究所 北京協和醫學院基礎學院 生物化學與分子生物學系醫學分子生物學國家重點實驗室, 北京 100005)
肝癌是一種具有高致死率的侵襲性惡性腫瘤,是世界多地區癌相關死亡的主要原因之一[1]。據中國癌癥中心數據顯示,肝癌占中國2015年新發惡性腫瘤的9.4%,中國肝癌患者的生存期在23個月左右,是嚴重影響中國國民健康的惡性腫瘤之一[2]。
肝細胞癌是中國原發性肝癌中最常見的一類[3]。隨著測序成本的降低和對肝細胞癌研究的逐漸深入,越來越多的肝細胞癌公共數據可供使用,為基于生物信息學方法開展肝細胞癌發病機制與診治靶點研究建立基礎。近期已有研究使用TCGA數據庫中的公共數據對肝細胞癌中特定基因的預后進行詳細分析[4],也有研究通過多組學數據分析肝細胞癌的分子驅動因素和潛在生物標志物[5]。然而,對于肝細胞癌發生發展過程中表觀遺傳調控改變的機制仍有待深入研究。
Zeste 同源蛋白2 增強子(enhancer of zeste homolog 2,EZH2)基因編碼一種組蛋白賴氨酸N-甲基轉移酶,主要參與組蛋白甲基化,與多種腫瘤的發生發展密切相關[6]。因此,本研究首先基于TCGA公共數據分析了EZH2基因表達與肝細胞癌進展及預后之間的關系;隨后,在細胞水平檢測了EZH2抑制劑對癌細胞活性和增殖的影響;之后,分析了TCGA肝細胞癌公共數據中EZH2高表達組和低表達組之間的差異表達基因;最后,結合表觀遺傳數據和生物學實驗研究了EZH2介導基因組表觀遺傳改變、影響下游基因表達的機制。
1.1.1 肝細胞癌相關公共數據收集:從TCGA數據庫(https://portal.gdc.cancer.gov/)中下載肝細胞癌樣本數據374例,包括轉錄物組信息和臨床信息。所需肝細胞癌細胞系HepG2 RNA-seq數據來源:ENCOD(https://portal.gdc.cancer.gov/)數據號ENCFF008CDN和ENCFF816EIE。所需肝細胞癌細胞系HepG2的ChIP-seq數據來源均為ENCODE,EZH2ChIP-seq數據號:ENCFF559YWA;H3K27me3 ChIP-seq 數據號:ENCFF893XHX;H3K4me3 ChIP-seq 數據號:ENCFF500VAH;H3K27ac ChIP-seq 數號:ENCFF764VYK;EZH2ChIP-seq narrowPeak bed數據號:ENCFF521AKL。
1.1.2 細胞系:人肝細胞癌細胞系HepG2(中國醫學科學院基礎醫學研究所細胞資源中心)。
1.1.3 試劑及試劑盒:EZH2抑制劑GSK343(Selleck公司);CellTiter-Glo?發光法細胞活力檢測試劑盒(Promega公司,G7570);所需引物由生工生物工程(上海)股份有限公司合成。
1.2.1 臨床特征統計、基因表達與預后分析:將從 TCGA數據庫中下載的肝細胞癌樣本數據根據其性別、年齡和分期等臨床特征進行分類統計,用K-W檢驗分析EZH2基因表達與肝細胞癌不同腫瘤分期之間的關系。根據EZH2基因的中位表達值,將數據庫中的肝細胞癌臨床樣本分為EZH2高表達組(n=187)和EZH2低表達組(n=187),用Log Rank檢驗分析EZH2高表達組和EZH2低表達組與預后之間的關系。
1.2.2 差異表達基因篩選和功能分析:用Limma生物信息軟件[7],比較EZH2高表達和EZH2低表達組之間的差異表達基因。當差異表達基因同時滿足P<0.05且log2(FC)的絕對值>1 時,定義為EZH2高表達組和EZH2低表達組之間的差異表達基因,同時選取差異表達最顯著的前20個上調基因和前20個下調基因制成熱圖。用Clusterprofiler生物信息軟件分析得到GO功能富集KEGG通路[8]。
1.2.3 細胞活性和細胞增殖能力檢測:常規培養肝細胞癌細胞系HepG2,實驗組加入EZH2抑制劑GSK343(10 μmol/L),空白對照組加入0.9% NaCl,每組重復3次。用三磷酸腺苷檢測法(ATP法)檢測加入GSK343后12、24、36、48 h的細胞活性,每組重復3次。用結晶紫染色法檢測加入GSK343后48 h的細胞系增殖情況,每組重復3次。
1.2.4EZH2基因相關的表觀遺傳特征分析:從ENCODE數據庫中下載肝細胞癌細胞系HepG2的EZH2ChIP-seq數據,從narrow Peak bed文件中獲得EZH2在基因組上的結合位置,其中有1 431個編碼基因的轉錄起始位點(transcription start site,TSS)上下游5 kb存在EZH2的信號峰。之后進一步分析這1 431個編碼基因是否在EZH2高表達組和EZH2低表達組之間存在基因差異表達。用deepTools軟件[9]可視化EZH2和組蛋白修飾的TSS共定位情況。用python軟件包trackC工具分析與EZH2相關的表達下調基因ADRA1A的表觀遺傳特征。
1.2.5 實時熒光定量PCR分析基因表達:為驗證EZH2是否影響下游靶基因ADRA1A的表達,在肝細胞癌細胞系HepG2中加入EZH2抑制劑后,用Trizol法提取細胞總RNA,反轉錄獲得cDNA,用RT-qPCR檢測EZH2及其下游靶基因ADRA1A的表達,每組重復3次,RT-qPCR引物見表1。

表1 實時熒光定量PCR引物序列Table 1 Primer sequences of real-time quantitative PCR
本研究使用生物信息學方法分析發現在TCGA數據庫的肝細胞癌臨床樣本中,EZH2基因表達量在1~3期逐漸升高(P<0.05),在4期中表達量相對降低(圖1A)。依據EZH2的基因表達量將TCGA數據庫的肝細胞癌臨床樣本分組為EZH2高表達組和低表達組(表2)。生存分析發現EZH2基因高表達組患者的生存期顯著低于EZH2低表達組(P<0.05)(圖1B)。

表2 TCGA數據庫中374個肝細胞癌患者臨床特征

A.EZH2 gene expression levels in different stages of hepatocellular carcinoma(P<0.05); B.prognostic correlation of EZH2 expression in different stages of hepatocellular carcinoma patients,*P<0.05 compared with EZH2-Low; C.detection of cell activity in normal control group and inhibitor group,*P<0.05 compared with violet staining of cells in normal control group and inhibitor group(×60,scale bar=1 mm)
在生物實驗驗證中,使用EZH2抑制劑GSK343(10 μmol/L)處理肝細胞癌細胞系HepG2。藥物處理36 h后抑制劑組的細胞活性顯著低于對照組(P<0.05)(圖1C)。結晶紫實驗表明,藥物處理48 h后實驗組的HepG2細胞數量降低(圖1D)。
使用生物信息學分析方法,將TCGA樣本中EZH2高表達組與低表達組相比,從中篩選出1 848個顯著差異表達基因,其中1 721個基因表達上調,127個基因表達下調(圖2A)。熱圖中顯示了差異表達最顯著的前20個上調基因和前20個下調基因的表達(圖2B)。對這些基因的功能富集分析發現,它們主要富集在應答外源刺激、細胞周期調控等功能和信號通路上(圖2C~D)。
使用ENCODE公共數據和生物信息學分析方法,本研究發現在全基因組水平EZH2有2 979個信號位于1 431個TSS的上下游5 kb內。在全基因組水平隨機選取1 431個TSS上下游5 kb內沒有EZH2結合,但H3K27ac、H3K4me3、H3K27me3三者中至少有一個信號的TSS區域,與EZH2結合的TSS進行表觀遺傳修飾特征對比分析,發現有EZH2結合的TSS附近富集H3K27me3信號,同時缺少H3K27ac信號(圖3A);上下游5 kb沒有EZH2結合的TSS附近H3K27me3信號顯著降低(圖3B)。
通過生物信息學分析,本研究進一步發現在上述1 431個有EZH2結合在轉錄起始位點附近的基因中,有163個基因也同時在TCGA樣本的EZH2高表達組和EZH2低表達組之間差異表達。其中在基因ADRA1A的TSS附近存在顯著的EZH2結合信號和較高的H3K27me3信號(圖4A)。

A.differential gene expression volcano plot between EZH2 high expression group and EZH2 low expression group (P< 0.05, log2 (FC)>1); B.the heatmap shows the top 20 EZH2 differentially associated up-regulated genes and the top 20 down-regulated genes, with red indicating high expression group and green indicating low expression group; C.GO functional analysis of differentially expressed genes; D.analysis of differentially expressed genes KEGG signaling pathway
通過生物實驗,本研究發現使用EZH2抑制劑GSK343處理HepG2細胞48 h后,EZH2的mRNA水平與對照組相比沒有顯著變化,但ADRA1A的mRNA水平與對照組相比顯著上升(P<0.05)(圖4B~C)。
EZH2作為組蛋白甲基轉移酶,可以通過組蛋白甲基化的表觀遺傳修飾影響染色質結構,抑制下游靶基因表達[10],調節肝臟代謝和肝纖維化,調控肝細胞癌發病過程,在肝細胞癌的發生發展過程中發揮重要的作用[11]。本研究通過生物信息學分析發現EZH2在肝細胞癌1~3期中異常高表達,生物學實驗結果也表明EZH2抑制劑GSK343可以在體外抑制HepG2的細胞活性和細胞增殖。上述結果有助于為肝細胞癌靶向治療提供一定實驗依據。
本研究通過生物信息學分析發現EZH2可以介導基因轉錄起始位點附近組蛋白H3K27me3修飾增加,從而發揮表觀遺傳調控作用,影響下游基因表達。同時,近期也有研究表明ADRA1A基因轉錄起始位點的高甲基化會促進肝細胞癌的發生,是肝細胞癌診斷過程中的潛在生物標志物[12]。因此, 在后續研究中將進一步探討EZH如何通過介導組蛋白H3K27me3修飾,影響ADRA1A基因轉錄起始位點的DNA甲基化。

A.histone modification ±5 kb of the TSS of 1 431 genes with EZH2 binding sites; B.histone modification ±5 kb of the TSS of 1431 genes without EZH2 binding sites

A.ChIP-seq and RNA-seq signal of ADRA1A gene; B.EZH2 mRNA expression levels in normal control(NC) and inhibitor GSK343 groups; C.ADRA1A mRNA expression levels in normal control(NC) and inhibitor GSK343 groups; *P<0.05 compared with NC group
綜上所述, 本研究結合肝細胞癌公共多組學數據分析和生物實驗,發現了EZH2基因表達水平可以為肝細胞癌病程進展和預后判斷提供一定依據;EZH2能夠通過特異的表觀遺傳調控機制影響下游基因表達,研究結果為進一步篩選肝細胞癌生物標志物、開發治療方法提供了一定實驗依據。