陳 娜,劉 聞,秦 銳,于欣鑫,顧為望,高 飛*
(1. 中國農業科學院深圳農業基因組研究所,廣東 深圳 518116; 2. 南方醫科大學實驗動物中心,廣州 510515; 3. 東莞松山湖明珠實驗動物科技有限公司,廣東 東莞 523808)
與嚙齒類小型實驗動物相比,豬在解剖生理學、血液生化值、疾病發生和器官發育等方面具有與人類更加相似的特點,且無靈長類實驗動物可能存在的倫理問題,因此成為人體生長發育和疾病發生等研究的優良實驗模型。小型豬與人體重相似,具有體型小便于實驗操作、飼養成本低的優點,在生物醫藥領域有著更加廣闊的應用前景[1]。特別小型豬在疾病動物模型制作、新藥安全性評價、異種器官移植等領域應用更廣,已成為生物醫學研究中重要的實驗動物[2]。
基因組(genome)是分子生物學研究的基礎,基因組學(genomics)的研究對生物醫學模型的持續開發具有重要意義。2012年,豬基因組測序協會發布第一個完整測序的家豬基因組,其大小約為2.6 G[3]。比較基因組學研究結果顯示家豬基因組與人類基因組在序列和染色體結構上具有極高的同源性,其基因集注釋已經比較完整,最新的參考基因注釋集包括30173個基因[4]。另外一方面,對基因組的染色質結構、表觀遺傳修飾、轉錄因子結合等等功能注釋與序列注釋具有同等的重要性,這些注釋可以將基因組序列與物種外在的生物學特性有效的對應起來。表觀遺傳學(epigenetics)包括DNA甲基化、組蛋白修飾、染色質重塑及非編碼RNA調控等研究內容。表觀遺傳信息的變化對包括人在內的哺乳動物基因組有廣泛而重要的調控效應,如轉錄抑制、基因組印記、細胞凋亡、染色體滅活等[5]。目前,針對人類基因組的功能注釋已經廣泛開展并獲得了重要成果。1998年,歐盟啟動了人類“表觀基因組學計劃”和“基因組的表觀遺傳可塑性”研究計劃,旨在解析人類DNA甲基化模式,并闡明其建立和維持的機制。而美國則發起并主導了人類及小鼠基因組大百科全書計劃(ENCODE和mENCODE),提供最為全面的基因組功能注釋[6-7]。針對其他哺乳動物基因組的注釋還相對缺少,較為知名的有FANNG項目,旨在構建飼養動物的基因組功能元件注釋圖譜,但目前獲得的數據和成果有限[8]。
目前一些主要物種的基因組功能注釋信息定期更新,如人、小鼠、斑馬魚等,而豬的基因組功能注釋相對滯后,且不同類型的豬基因組有所差別。西藏小型豬目前尚缺乏完善的表觀基因組注釋數據,限制其作為生物醫學模型的廣泛應用。本研究采用染色質免疫共沉淀(chromatin immunoprecipitation,ChIP)結合高通量測序技術,完成了西藏小型豬四種組織的組蛋白修飾譜,并進行了深入的基因組表觀遺傳修飾譜鑒定及不同組織間的比較分析。本研究的數據結果將為西藏小型豬作為生物醫學模型的應用奠定基礎。
普通級西藏小型豬2頭(3月齡,雄性,非同胎),體重(3.0 ±0.3) kg,于東莞松山湖明珠實驗動物科技有限公司購買并進行組織取樣[SCXK(粵)2017-0030][SYXK(粵)2017-0123]。飼養和實驗過程中遵循了實驗動物使用的3R原則。本研究經東莞松山湖明珠實驗動物科技有限公司實驗動物管理和使用委員會批準實施[IACUC決議編號S-20170611-01]。
組蛋白修飾抗體購自艾博抗(Abcam)上海貿易有限公司。微量移液器和離心管購自艾本德(Eppendorf)中國有限公司;PCR擴增儀購自德國耶拿分析儀器股份公司(型號:Analytikjena Easycycler);高通量測序平臺為Illumina Hiseq X Ten(PE150)。
1.3.1 組織取樣
實驗動物安樂死前采集靜脈血液(≥60 mL)于肝素鈉抗凝管中制備血液樣品;安樂死后分離出肝器官、回腸腸段、背最長肌等(≥20 g),分別分離成小塊組織(≥1 g)于凍存管中,液氮速凍后置于干冰箱內冷凍保存。
1.3.2 染色質免疫共沉淀實驗
用上述組織樣品進行染色質免疫共沉淀實驗,選擇6種組蛋白修飾抗體:H3K4me3、H3K9me3、H3K9ac、H3K27me3、H3K27ac、H3K36me3,經甲醛固定、細胞核提取、染色質破碎、免疫沉淀、解交聯等步驟,收集特異性捕獲的DNA片段。將DNA片段超聲打斷為150~200 bp片段后補齊末端、加測序接頭并進行PCR擴增,構建文庫用于上機測序。
1.3.3 ChIP-Seq及其數據處理
文庫質量檢測合格后,經Illumina高通量測序平臺測序,下機后的原始數據使用軟件Trimmomatic(Version 0.30)進行過濾,得到的clean reads數據使用BWA軟件比對到家豬參考基因組(Sscrofa11.1)上,使用MACS(Version 1.4.2)軟件統計reads在基因組的富集情況,并結合家豬基因組注釋信息,統計reads富集區間在基因組各區域的分布情況。
利用Illumina測序平臺對西藏小型豬四個組織的ChIP樣本進行雙端測序,經統計,原始數據過濾后每個樣品的Q30均大于95%,GC含量分布曲線接近正態分布,說明堿基質量穩定、序列組成均一,能保證后續分析的正常進行。
基因啟動子區含有轉錄必需的關鍵調控元件,在功能基因的表達與調控方面起著重要作用。為了從全基因組水平上展示四種不同組織各種組蛋白修飾類型的特征,我們選取了基因啟動子區域并統計在這一區域內的組蛋白修飾值。定義每個基因的轉錄起始位點(transcription start site, TSS)上、下游各2000 bp為啟動子區域,并將其平均分為400個bin,每個bin的長度為10 bp。組蛋白修飾標準化值的計算參考基因表達量RPKM的計算,具體公式如下:
式中ni為落在此區域內的reads數,n為測序深度,li為區域長度,每個bin的組蛋白修飾水平為全部基因在此區域內組蛋白修飾值的平均值。根據計算結果繪制了TSS附近區域組蛋白修飾的分布圖(圖1),橫坐標為距離TSS的位置,縱坐標為標準化后的組蛋白修飾值。
從圖中可以看出,不同組蛋白修飾在基因啟動子區域中分布的位置不同,各組蛋白修飾的分布規律大致可以分為兩類,第一類如H3K4me3(圖1 A),H3K9ac(圖1B)和H3K27ac(圖1D),組蛋白修飾信號富集于TSS兩側,并在距離TSS較近的下游位置出現一個寬度較窄的明顯的峰值;另一類如H3K9me3(圖1C),H3K27me3(圖1E)和H3K36me3(圖1F),組蛋白修飾值較低且在整個啟動子區域內分布較為平均,在TSS位點處出現明顯的下降,在-1500 bp處有一個不明顯的小峰,整體呈現出中間低兩邊高的寬峰形狀。這與文獻中報導的人類及其他哺乳類動物基因組的組蛋白修飾特征相似[9]。組蛋白修飾峰值分布位置的不同顯示了其具有的不同基因轉錄調控功能和特征。

注:A:組蛋白修飾H3K4me3在TSS附近的分布;B:組蛋白修飾H3K9ac在TSS附近的分布;C:組蛋白修飾H3K9me3在TSS附近的分布;D:組蛋白修飾H3K27ac在TSS附近的分布;E:組蛋白修飾H3K27me3在TSS附近的分布;F:組蛋白修飾H3K36me3在TSS附近的分布。圖1 TSS附近組蛋白修飾的分布Note. A, Histone modification H3K4me3 near transcription start sites. B, Histone modification H3K9ac near transcription start sites. C, Histone modification H3K9me3 near transcription start sites. D, Histone modification H3K27ac near transcription start sites. E, Histone modification H3K27me3 near transcription start sites. F, Histone modification H3K36me3 near transcription start sites.Figure 1 Histone modifications near the transcription start sites
為了進一步探討組蛋白修飾的結合位點特征及組織特異性,理解組蛋白修飾對基因調控的機制,我們結合了物種的基因組注釋信息,對組蛋白修飾富集區間在整個基因組范圍內的分布特征進行了分析。首先利用MACS軟件進行組蛋白修飾的富集區間分析,得到每種組蛋白在基因組不同位置、不同數量的富集區間,然后將富集區間的信息與基因組注釋信息結合,得到富集區間在基因組六個功能區域內的分布情況。如圖2所示,橫坐標表示不同的組蛋白修飾類型,縱坐標表示富集區間在各個區域內所占的百分比。可以看到四種組織中組蛋白修飾分布有一定的相似性,所有類型的修飾在基因間區(intergenic region)和內含子(intron)區的分布比例均高于其他功能區,特別是H3K9me3;而同一組蛋白位點的乙酰化修飾H3K9ac在不同組織中的分布模式差異很大,具有組織特異性,在血液和肌肉組織中基因間區所占比例較大,而在肝和回腸組織中各功能區分布比例較為平均;H3K4me3在各組織的分布模式相似,且啟動子區所占的比例高于其他修飾類型。組蛋白修飾在各組織間的不同,造成特異性基因的表達發生改變,影響了細胞分化、組織形成等過程。

圖2 全基因組六個功能區域的組蛋白修飾分布Figure 2 Distribution of histone modifications in six functional regions of the genome
為探究組蛋白的不同修飾對組織差異性的影響,我們對在4種組織間啟動子區組蛋白修飾有顯著差異的基因進行了統計。圖3顯示了各類組蛋白修飾對應的差異基因的重疊情況,可以看出各類修飾實際影響的基因存在差異,對于每種修飾約有半數差異基因與其他修飾沒有交叉,為此種修飾類型特有,如H3K9ac。接著我們將差異基因名稱輸入到DAVID數據庫(https://david.ncifcrf.gov/tools.jsp)中進行了GO(gene ontology)功能分析,結果顯示,盡管組織特異性組蛋白修飾所覆蓋的功能通路比較廣泛,但幾乎都參與了RNA聚合酶II啟動子的轉錄調控。轉錄的正、負調控及轉錄抑制、轉錄激活的差異導致了不同組織之間多種基因的表達差異。

圖3 組蛋白差異修飾基因的重疊Figure 3 Overlapping of the differential histone modification genes
西藏小型豬原產于我國藏區高原,是體型較小的實驗用豬種之一,2004年由南方醫科大學實驗動物中心將其從西藏林芝地區引進廣東省,并完成了風土馴化及實驗動物化培育。免疫學、遺傳學和病原組織學等方面的研究表明,西藏小型豬具有獨特的免疫指標和種質資源特性,其血液生理生化指標與普通豬差異較大,與人類水平接近,是一種優良的人類疾病實驗動物模型[10]。包括組蛋白修飾在內的生物表觀遺傳學修飾能夠激活或抑制基因轉錄,調節基因表達,已成為遺傳學研究的一個重要分支,與DNA序列水平上的變化同樣重要,特定位點的組蛋白修飾已經成為腫瘤檢查標志物[11]。目前對西藏小型豬開展的研究主要圍繞相關動物模型、藥物實驗及轉基因克隆豬等方面,但是對其基因組功能及表觀組注釋的研究還是空白。本研究從全基因組水平初步解析了西藏小型豬組蛋白修飾的特征,各種組蛋白修飾在啟動子區的分布模式有所差別,這與此前在的報道結果一致[12-13]。此前對于組蛋白各位點修飾的功能研究表明,轉錄起始位點的H3K4me3、H3K9ac和H3K27ac修飾有利于激活基因轉錄,活性轉錄基因的gene body區富集H3K36me3,而基因的轉錄抑制與H3K9me3和H3K27me3有關[14-15]。對其基因組的注釋解析將有利于西藏小型豬在轉基因克隆發育等方面的研究和應用。
組蛋白修飾通過改變染色質結構,影響轉錄因子與靶基因各種順式作用元件之間的親和性,發揮調控基因轉錄調控的作用,正確識別它們的富集部位對理解發育和細胞功能至關重要。啟動子是關鍵的基因功能元件之一,啟動子區域范圍廣泛,包含核心啟動子區域和調控區域。核心啟動子區域通常位于轉錄起始點上游2000 bp以內,負責基因基礎水平的轉錄,調控區域能夠對不同環境因素或信號傳導作出應答,調節相應的基因表達[16]。本研究選取了轉錄起始位點上下游各2000 bp的區域作為啟動子區域,統計此區域內組蛋白修飾密度并進行標準化,結果表明組蛋白修飾在啟動子區的富集模式主要有寬峰和窄峰兩種,寬峰覆蓋整個啟動子區且無明顯峰值,窄峰在轉錄起始位點附近有明顯的富集高峰。組蛋白修飾信號的富集模式的不同,,決定了其轉錄調控功能的差異。這幾種組蛋白修飾類型的具體作用方式,后續可結合基因表達數據展開深入探究。
此外,本研究發現有大量的組蛋白修飾富集區間落在了基因間區和內含子區,意味著同人類和小鼠基因組一樣,小型豬基因組存在著大量未鑒定的轉錄本和新基因。因此,本研究的數據結果將為后續西藏小型豬的基于基因發掘、轉錄調控的生物醫學模型研究奠定重要基礎。