張 峰,劉亞軍,謝建明,孫 嘯,劉宏德
(生物電子學國家重點實驗室(東南大學),南京 210096)
Hi-C的干細胞染色質多重相互作用特征分析
張 峰,劉亞軍,謝建明,孫 嘯,劉宏德*
(生物電子學國家重點實驗室(東南大學),南京 210096)
染色質高級結構是基因轉錄調節的重要因素,染色質多重相互作用是高級結構中的一種,是多個(≥3)染色質片段在空間上相互接觸而形成的緊湊結構。為了解染色質多重相互作用這類高級結構的特征及其在干細胞中分化中起到的作用,通過對Hi-C數據進行相關分析并計算基因的FPKM表達量,研究了染色質多重相互作用。分析發現:多重相互作用約占所有作用的30%,包含近70%的基因;此類作用區域的高表達基因多于低表達基因;且與組蛋白乙酰化相關性高。在分化過程中,多重作用位點數目和比例減少;位于多重作用區域的基因的表達略有降低;組蛋白乙酰化(H3K27ac 和H3K23ac)在多重作用區域的減弱,而組蛋白甲基化(H3K4me3和H3K27me3)傾向于增強。結果表明,染色質多重相互作用是一種廣泛存在的染色質高級結構,在干細胞分化中有重要作用,此類結構多具有H3K27ac修飾,調節基因的表達。總之,染色質多重相互作用是一種重要的基因轉錄調節因素,在細胞分化中具有調控作用。
染色質多重相互作用;Hi-C;基因表達;組蛋白修飾
真核生物染色質會通過核小體與DNA鏈的多重纏繞折疊形成緊密的三維高級結構[1-2],這種結構在基因表達中遠程調節的物理實現上起到了關鍵作用[3-5]。胚胎干細胞(ES cells)是早期胚胎的原始細胞,具有分化為三胚層各種細胞[6]的潛在能力。在干細胞分化過程中,細胞核內染色質的三維結構會發生相應的構象變化[7]。在哺乳動物[8]中通過表達某一基因能夠激活其他成體細胞特征性基因,致使細胞命運發生改變,而染色質三維結構變化可對這一過程進行調控。研究干細胞與其衍生細胞的染色質結構差異可以更深地了解這種調控關系。
利用Hi-C技術[9],研究者可以高通量地獲得染色質高級結構中相互作用的DNA片段。通過檢測這些DNA片段在染色質上的分布,可以繪制染色質相互作用圖譜[10],此圖譜展示了染色質上各位點間的相互作用情況。然而,除了存在單個位點僅與單個位點作用的情況外,還存在單個位點與多個位點作用以及多個位點與多個位點相互作用的情況(圖1), 本文將這種位點稱為染色質多重相互作用位點(chromosome multiple interaction sites,CMI sites)。這些位點可能涉及某些復雜的生物學過程,甚至是其中的關鍵節點。
如果將CMI位點所涵蓋的范圍稱之為CMI區域,那么染色質上其他區域則可稱為非CMI區域。比較不同細胞系中這兩種區域內的表觀遺傳修飾富集情況、基因數目及其表達情況可以粗略的反映出CMI位點與細胞分化調控的關聯性。目前,尚未見此類分析,本文通過分析Hi-C數據,系統分析了染色質多重相互作用的特征以及在細胞分化中的變化。

圖1 CMI位點示意Fig.1 An illustration of CMI site (red oval)
注:細胞中染色質(線條)通過DNA位點的接觸來相互作用,包括發生在兩個DNA片段間的作用(綠色橢圓),和發生在多個DNA片段間的作用(紅色橢圓)。
1.1 數據
本文利用文獻[11]提供的Hi-C Reads回帖后的數據,包括人類ES細胞系以及中內胚層細胞(ME cells)、間充質干細胞(MS cells)、神經祖細胞(NP cells)、滋養層細胞(TR cells)等4種ES衍生細胞系,獲取存在多次相互作用的位點。同時,結合mRNA和人類參考基因組數據,以及組蛋白甲基化與乙酰化、CTCF、DNA甲基化(DNA Meth)、DNaseI高敏感位點(DHS)等表觀遺傳信息,本文進行了進一步的分析。所有數據的GEO登錄號為 GSE52457。
1.2 方法
首先統計各細胞系中相同位置Hi-C Reads的出現頻率,頻率超過2就意味著此位點在Hi-C數據中重復出現,即視為CMI位點。然后進一步統計CMI位點數目與其作用頻率,可得到CMI位點在所有Hi-C位點中的比例以及同一作用頻率位點的數目。最后,通過匯總CMI位點在染色質中的位置信息,計算CMI區域所涵蓋的范圍(以bp為單位)。通過將CMI位點匹配到人類基因組上,計算與CMI區域有接觸的基因數目。
結合RNA-Seq數據,進一步計算各基因的FPKM值,從而反映基因的表達水平。本文取整個細胞系中FPKM值的中位數為標準,來判定某個基因是否高表達,FPKM值高于中位數的基因被認為是高表達的基因,FPKM值低于中位數的基因則被認為是低表達的基因。
以多個分辨率(10~100 kbp,步長為10 kbp)計算CMI區域和所有相互作用區域上表觀遺傳修飾reads數目,即兩區域中表觀遺傳修飾發生頻率的總和,兩者之間的比率作為CMI區域發生表觀遺傳修飾的相對概率。然后,計算各個CMI位點的Hi-C作用頻率以及染色質各位點上組蛋白修飾的頻率,對染色質上非CMI位點以及未發生組蛋白修飾位點的作用頻率記為0,進而對兩組數據進行相關(皮爾森相關系數) ,并在不同分辨率下求平均相關性系數,以此反映CMI頻率與組蛋白修飾頻率的相關性強弱。
對比ES細胞系與其4種衍生細胞系的CMI位點數目、CMI區域相關基因數目及表達量、CMI區域相關表觀遺傳修飾數目、CMI與組蛋白乙酰化與甲基化的相關性系數,從而比較細胞分化過程中人類ES細胞與其分化后細胞的差異。
2.1 染色質多重相互作用(CMI)的數目及分布
CMI位點的統計結果表明其占所有相互作用位點數目的近30% (圖2(a)),單點作用頻率最高達500次,所有CMI位點遍布整個染色質。可以看出CMI位點在所有染色質相互作用中占據了一定的重要性。其中ES細胞系的所有相互作用位點總數以及CMI位點數均明顯多于其他4種衍生細胞系(見表1)。同時,不同作用頻率的CMI位點的出現次數也會隨著作用頻率的增加而衰減,且ES細胞具有更多的復雜相互作用(圖2(b))。這說明CMI會隨著細胞分化而變化,但總體分布的趨勢相對保守。

圖2 CMI位點數目與頻率Fig.2 The frequency and count of CMI sites

細胞系胚胎干細胞中內胚層細胞間充質干細胞神經祖細胞滋養層細胞CMI位點數目1373768110519216844452272786277199033所有位點數目4632068038547004297684562378973328868083
2.2 染色質多重相互作用區域的基因表達分析
通過統計所有CMI位點及Hi-C位點占據的染色質區域,本文發現CMI區域約占所有相互作用區域的15%,但是與人類基因的匹配結果顯示其與近70%的基因有接觸。這表明CMI可能參與了許多復雜的生物學過程。
值得注意的是,通過計算各個細胞系中不同區域的基因平均FPKM表達量,發現CMI區域中基因表達量明顯高于非CMI區域(圖3(a))。進一步計算高表達與低表達基因數目在兩區域中的比例,發現CMI區域的高表達基因明顯多于低表達基因,而非CMI區域的高表達基因則明顯少于低表達基因,并且,CMI區域高表達基因顯著的多于非CMI區域(圖3(b))。可以推測,與CMI區域相關聯的基因傾向于高表達,與非CMI區域相關聯的基因傾向于低表達,但是這種傾向性隨著細胞分化有減弱的趨勢。上述結果說明,在干細胞中,有更多的CMI形成,且隨分化而逐漸減弱,暗示CMI是干細胞的標識性結構。

圖3 CMI區域基因表達情況Fig.3 Gene expression in CMI regions
2.3 染色質多重相互作用區域的表觀遺傳修飾
通過比較CMI區域與所有染色質相互作用區域表觀遺傳修飾發生的頻率,發現僅占染色質相互作用區域15%的CMI區域發生表觀遺傳修飾的相對概率能達到30%~60%,表明表觀遺傳修飾在CMI區域存在富集現象。但是ES細胞系中CMI區域發生表觀遺傳修飾的相對概率明顯大于其他4種衍生細胞系(圖4(a)),這表明干細胞分化可能會導致這種富集效應減弱。為了進一步研究CMI區域與表觀遺傳修飾之間的關系,將CMI位點的相互作用頻率與表觀遺傳修飾的發生頻率進行相關性分析,發現CMI的作用頻率與某些表觀遺傳修飾發生頻率具有較強相關性(相關性系數介于0.6~0.8之間),也有一些具有弱相關性(相關性系數介于0.4~0.6之間),不同細胞系之間的頻率相關性(以下簡稱相關性)具有顯著差異(圖4(b))。
ES細胞系中CMI整體與組蛋白乙酰化的相關性較強,而與組蛋白甲基化的相關性較弱,比如與H3K23ac、H3K4ac、H2BK120ac的相關性均大于0.6,而與組蛋白甲基化相關性最大僅0.5,與其他組蛋白甲基化更是幾乎不相關(相關性系數低于0.4);Me細胞系與H3K4甲基化的相關性相比于ES細胞系顯著增加,與其他乙酰化相關性均有下降,與組蛋白乙酰化相關性明顯增強;MS細胞系與組蛋白修飾的相關性整體明顯下降;NP細胞系與組蛋白甲基化的相關性顯著上升,同時與組蛋白乙酰化相關性顯著增強;TR細胞系與組蛋白乙酰化的相關性急劇減弱,整體變化比較復雜。如果H3K27ac是增強子的重要標志,那么該結果表明此類Enhancer在空間上可能和多個染色質的區域靠近并調控相關基因[12-13]。
總體來看,隨著分化過程中CMI區域在所有相互作用區域中表觀遺傳修飾的占比減少,雖然4種ES衍生細胞系與組蛋白乙酰化的相關性相對于ES細胞系趨于弱化,但是與組蛋白甲基化的相關性趨于強化,其中強化最明顯的是與H3K4me3的相關性。可以推測,干細胞分化過程中與組蛋白乙酰化相關的CMI位點趨于減少,而與組蛋白甲基化相關的CMI位點趨于增多,從而共同維護了染色質相互作用中CMI位點與非CMI位點以及區域范圍大小的動態平衡。H3K4me3和H3K27me3的雙重修飾是分化基因的重要標志[14-15],本文結果表明分化中這兩種甲基化修飾在CMI區域中增強(圖4(b)),這說明分化過程中H3K4me3和H3K27me3的雙重修飾可能憑借多重作用結構,一次調控多個區域的基因轉錄。

圖4 各細胞系中CMI區域的表觀遺傳修飾情況Fig.4 Epigenetic modifications in CMI regions of cell lines
本文基于Hi-C數據,系統分析了一類特殊的染色質高級結構——染色質多重相互作用的特征。結果表明:染色質多重相互作用在所有染色質高級結構中占有較高的比例(約30%),而且此類結構關聯的基因占所有基因的70%。染色質多重相互作用富集組蛋白修飾,具有高乙酰化的特征,位于此類區域的高表達基因比例較大。在干細胞分化期間,染色質多重相互作用數量和比例有變小的趨勢,H3K27ac的修飾有減弱的趨勢,而甲基化卻有增加的趨勢(H3K4me3和H3K27me)。推測這些修飾可能憑借多重作用結構,一次調控多個區域的基因轉錄。總之,染色質多重相互作用在干細胞分化過程中動態變化,具有重要的基因轉錄調節作用。
References)
[1]HU Ming, DENG Ke, QIN Zhaohui, et al. Understanding spatial organizations of chromosomes via statistical analysis of Hi-C data[J]. Quantitative Biology, 2013, 1(2):156-174. DOI: 10.1007/s40484-013-0016-0.
[2]MIELE A, DEKKER J. Long-range chromosomal interactions and gene regulation[J]. Molecular BioSystems, 2008, 4(11):1046-1057. DOI: 10.1039/b803580f.
[3]GORKIN D U, LEUNG D, REN Bing. The 3D genome in transcriptional regulation and pluripotency[J]. Cell Stem Cell, 2014, 14(6):762-775. DOI: 10.1016/j.stem.2014.05.017.
[4]LI Guoliang, RUAN Xiaoan, AUERBACH R K, et al. Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation[J]. Cell, 2012, 148(1/2):84-98. DOI: 10.1016/j.cell.2011.12.014.
[5]HANDOKO L, XU Han, LI Guoliang, et al. CTCF-mediated functional chromatin interactome in pluripotent cells[J]. Nature Genetics, 2011, 43(7):630-638. DOI: 10.1038/ng.857.
[6]THOMSON J A, ITSKOVITZ-ELDOR J, SHAPIRO S S, et al. Embryonic stem cell lines derived from human blastocysts[J]. Science, 1998, 282(5391):1145-1147.
[7]JOFFE B, LEONHARDT H, SOLOVEI I. Differentiation and large scale spatial organization of the genome[J]. Current Opinion in Genetics & Development, 2010, 20(5):562-569. DOI: 10.1016/j.gde.2010.05.009.
[8]DAVIS R L, WEINTRAUB H, LASSAR A B. Expression of a single transfected cDNA converts fibroblasts to myoblasts[J]. Cell, 1987, 51(6):987-1000. DOI: 10.1016/0092-8674(87)90585-X.
[9]LIEBERMAN-AIDEN E, van BERKUM N L, WILLIAMS L, et al. Comprehensive mapping of long-range interactions reveals folding principles of the Human genome[J].Science, 2009, 326(5950):289-293. DOI: 10.1126/science.1181369.
[10]DEKKER J, MARTI-RENOM M A, MIRNY L A. Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data[J]. Nature Reviews Genetics, 2013, 14(6):390-403. DOI: 10.1038/nrg3454.
[11]DIXON J R, JUNG I, SELVARAJ S, et al. Chromatin architecture reorganization during stem cell differentiation[J]. Nature, 2015, 518(7539):331-336. DOI: 10.1038/nature14222.
[12]ZHU Yun, SUN Lin, CHEN Zhao, et al. Predicting enhancer transcription and activity from chromatin modifications[J]. Nucleic Acids Research, 2013, 41(22):10032-10043. DOI: 10.1093/nar/gkt826.
[13]CREYGHTON M P, CHENG A W, WELSTEAD G G, et al. Histone H3K27ac separates active from poised enhancers and predicts developmental state[J]. Proceedings of the National Academy of Sciences of the United States of America, 2010, 107(50):21931-21936. DOI: 10.1073/pnas.1016071107.
[14]BOGLIOTTI Y S, ROSS P J. Mechanisms of histone H3 lysine 27 trimethylation remodeling during early mammalian development[J]. Epigenetics, 2012, 7(9):976-981. DOI: 10.4161/epi.21615.
[15]LIU Xiaoyu, WANG Chenfei, LIU Wenqiang, et al. Distinct features of H3K4me3 and H3K27me3 chromatin domains in pre-implantation embryos[J]. Nature, 2016, 537(7621):558-562. DOI: 10.1038/nature19362.
CharacteristicanalysisofchromosomemultipleinteractionsinstemcellbasedonHi-C
ZHANG Feng, LIU Yajun, XIE Jianming, SUN Xiao, LIU Hongde*
(StateKeyLaboratoryofBioelectronics(SoutheastUniversity),Nanjing210096,China)
Higher-order chromatin structure is an important factor for transcriptional regulation. Chromatin multiple interaction (CMI) is a kind of compact high-level structure in which more than three chromatin fragments spatially interconnect together. In order to understand the characteristic of the CMI and its change in stem cell differentiation, the CMI was investigated by both correlation analysis of Hi-C data and gene expression (FPKM). The results show that CMI sites occur in 30% of Hi-C reads, covering nearly 70% of human genes, in which the highly expressed genes are more than those with low expression. Meanwhile, the CMI is highly correlated with histone acetylation. During stem cell differentiation, the number and the proportion of CMI sites decrease,and the expression slightly decreases in the CMI regions. The histone acetylation (H3K27ac and H3K23ac) is weakened in the CMI regions, whereas histone methylation (H3K4me3 and H3K27me3) tends to increase. These results suggest that the CMI is widely distributed,mostly modified with histone H3K27ac and plays a role in differentiation and gene regulation. In conclusion, chromatin multiple interaction is kind of important transcriptional regulator and contributes to cell differentiation regulation.
Chromosome multiple interaction (CMI); Hi-C; Gene expression; Histone modification
R737.9
A
1672-5565(2017)03-137-05
10.3969/j.issn.1672-5565.201701008
2017-01-22;
2017-05-02.
國家自然科學基金(31371339);國家重點基礎研究發展計劃(973計劃)(2012CB316501).
張峰,男,碩士研究生,研究方向:生物信息學;E-mail: zf564js@163.com.
*通信作者:劉宏德,男,副教授,研究方向:生物信息學;E-mail: 101100344@seu.edu.cn.