劉逸南 劉奕清 楊靜 修成奎 王雪 胡艷紅 吳丹 吳燁 雷燕
(中國中醫科學院醫學實驗中心 北京市中醫藥防治重大疾病基礎研究重點實驗室,北京 100700)
根據全球人口預測分析,預計到2025年,全球60歲以上人口將達到12億左右,到2050年老年人口將增至20億〔1,2〕。而80歲或80歲以上的人口估計從目前的1.37億到2050年將增加到4.25億。老齡人口的迅速增長提高了心腦血管疾病、高血壓及阿爾茨海默病等疾病及其并發癥的發病率,給全球的醫療資源帶來巨大負擔〔3~5〕。因此,探索衰老的機制對于延緩人口老齡化有重要意義。2013年,López-Otín等〔6〕提出了9個代表衰老共同特征的初步特征:①基因組不穩定;②端粒消耗;③表觀遺傳改變;④蛋白質停滯狀態的喪失;⑤營養感知失調;⑥線粒體功能障礙;⑦細胞衰老;⑧干細胞衰竭;⑨細胞通訊改變。這些年齡依賴性的變化會影響人體維持穩態的能力,其中就包括免疫系統。研究表明,老年人的免疫系統與年輕人相比有所不同,由于骨髓造血干細胞數量和功能的下降,影響了T細胞與B細胞的生長,其數量會隨著年齡的增長而顯著減少〔7~9〕。免疫系統的改變使老年人更容易感染傳染病,而且還會導致許多退行性疾病,特別是神經退行性病變、癌癥、心血管和自身免疫性疾病〔10〕。盡管近幾年對于免疫系統的衰老已經取得了一定的成果,但是對于探索其發生機制還需要對分子調控機制進行深入研究。本研究旨在通過生物信息學分析研究衰老小鼠與青年小鼠B細胞的基因差異,以期為衰老機制研究及臨床開發抗衰老藥物提供依據和新思路。
1.1數據來源 通過NCBI提供的GEO數據庫檢索并下載數據集GSE72224,該試驗來自Illumina MouseWG-6 v2.0 expression beadchip GPL6887平臺。
1.2研究方法 通過NCBI的GEOR2平臺對GSE72224進行初步分析,并將結果下載整理成Excel格式,并進行差異基因分析。使用Origin2019b軟件(9.6.5.169)對數據進行可視化分析。使用WebGestalt(WEB-based GEne SeT AnaLysis Toolkit,http://www.webgestalt.org/)對差異表達基因進行GO功能富集分析和KEGG通路分析。同時使用R語言3.5.3對結果進行可視化展現。使用STRING(https://string-db.org)在線分析工具構建差異表達基因的蛋白質互作網絡。之后使用Cytoscape3.6.1(http://cytoscape.org/download_old_versions.html)軟件將蛋白質互相網絡進行可視化分析,采用cytoHubba及MOCDE插件篩選出關鍵基因及關鍵模塊。并將關鍵模塊的基因進行GO功能富集和KEGG通路分析。
2.1差異基因的篩選 通過來源于GEOR2平臺的6~8周齡青年小鼠(n=11)及超過17月齡的老年小鼠(n=6)共計17個樣本的B細胞進行分析,共獲得26 509個差異基因,對總體差異基因的數據進行火山圖繪制,見圖1。按照P<0.01,|log2差異倍數(FC)|>1條件進行篩選,可獲得87個差異基因。其中包括66個下調基因及21個上調基因。通過對樣本數據Z-score方法進行歸一化,將差異最顯著的前30個基因進行聚類熱圖分析,見圖2。兩組樣本中部分基因的表達有明顯差異。

圖1 差異表達基因的火山圖

圖2 青年小鼠和老年小鼠B細胞中前30個差異表達基因的聚類熱圖
2.2差異表達基因的GO功能富集和KEGG通路分析 在WebGestalt數據庫輸入差異基因,從生物過程、細胞成分和分子功能3個方面對差異基因進行GO富集分析。基于BH算法,錯誤發現率(FDR)<0.05對87個差異表達基因進行分析發現,只有生物過程和細胞成分兩個方面的分析具有統計學差異。其中,生物過程主要富集于B細胞、淋巴細胞及白細胞的活化、調節和增殖、肽基氨基酸修飾與核小體組裝等方面,見圖3。分子成分主要富集于內質網、內質網腔、細胞表面、染色質、核染色質、核小體、DNA包裝復雜及染色體部分等方面,見圖4。將上述 87個基因進行KEGG信號通路分析,以BH法對結果進行統計學分析,發現只有內質網的蛋白質加工通路具有統計學顯著性。有內質網凝集素(Erlec)1、內質網核心信號(Ern)1、熱休克蛋白(Hsp)1a、內質網α-甘露糖苷酶(Man1b)1、蛋白二硫化物異構酶(Pdi)A4、Lin-12抑制子/增強子(Sel1l)此6個通路相關基因。

圖3 GO功能富集分析的氣泡圖:生物過程

圖4 GO功能富集分析的氣泡:細胞成分
2.3構建蛋白質相互作用(PPI)網絡篩選關鍵基因 使用STRING在線分析工具構建差異表達基因的PPI,下載表格數據,使用Cytoscape軟件將PPI網絡進行可視化分析,見圖5。根據各點的連接值,采用cytoHubba插件,按照node degree>5篩選出H2A組蛋白家族成員(H2af)x,Zeste基因增強子人類同源物(Ezh)2,Pdia4,H2B組蛋白家族成員b(Hist2h2bb),白細胞介素(IL)-10,Sel1l,Dnajb9,泛素樣含PHD和環指域(Uhrf)1此8個關鍵基因。

圖5 差異表達基因的PPI
2.4差異表達基因的模塊分析 使用Cytoscape中的MCODE插件對PPI進行模塊分析,最終獲得圖6兩組模塊,并將關鍵模塊的基因進行富集分析。GO功能富集分析結果如表1所示,對模塊1的分析發現,僅有細胞成分的差異具有統計學差異。模塊2在生物進程、細胞成分及分子功能方面均有明顯差異。KEGG分析發現,僅有模塊2在內質網蛋白加工通路具有統計學差異,FDR<0.05。

表1 模塊1與模塊2的GO富集功能分析

圖6 模塊1(左)與模塊2(右)的PPI
衰老與免疫功能的普遍降低有關,如何在自然衰老過程中保持免疫系統功能的完整性是目前國內外學者關注的問題〔11,12〕。
本研究發現,獲取的差異基因與B細胞活化、內質網及內質網蛋白加工通路等有關。B細胞活化是通過B細胞受體識別抗原,導致B細胞增殖和分化,而活化的B細胞可以分化形成能夠產生抗體和IL-10、IL-17、IL-35和腫瘤壞死因子(TNF)-α等炎性因子的血漿細胞或提供長期預防繼發性感染的記憶細胞〔13~15〕。Strindhall等〔16〕提出循環B細胞的減少是機體衰老的一個典型特征。Bulati等〔17〕研究發現隨著B細胞的增殖減少,其分化為漿細胞和記憶細胞的能力減弱,使得人體的免疫功能減弱。不僅如此,B細胞與內質網也密切相關。Yang等〔18〕研究發現,內質網內的E3泛素連接酶對于B細胞的分化有調控作用。細胞內蛋白質質量控制組分丟失而引起機體蛋白質穩定網絡的崩潰也是衰老的特征之一〔19,20〕。內質網是真核細胞的膜性管狀網絡,在鈣穩態、脂質和蛋白質生物合成中發揮重要作用〔21〕。內質網內蛋白質量控制失調導致的蛋白聚集是細胞衰老的表現之一〔22,23〕。Matai等〔24〕通過研究飲食控制對秀麗隱桿線蟲壽命的影響,進一步證實了內質網激素能夠調控蛋白停滯,進而延長壽命。本文結果表明,細胞成分差異及內質網的蛋白質調控與衰老有巨大關聯,值得深入研究。
H2afx(或H2AX)是H2A組蛋白家族的成員之一,是檢測和反映DNA雙鏈斷裂的基礎〔25〕,也是基因不穩定的公認標記〔26〕。Wang等〔27〕通過對小鼠的肺、脾、皮膚、肝和腸道上皮等組織及細胞的H2afx表達進行免疫組化,發現其標記強度與年齡增加有關。Ezh2是多梳抑制復合物2的一個成員,已被證明可以調節DNA甲基化〔28〕。Mozhui等〔29〕研究發現Ezh2是形成衰老表觀基因組的蛋白質機制的一部分。Pdia4是最大的蛋白質二硫異構酶家族成員,具有氧化還原酶和陪同活性,其在體內可啟動凝血并促進血栓形成引起一系列級聯反應,與慢性阻塞性肺疾病及腎纖維化等多種慢性疾病有關〔30,31〕。除此之外,Linden等〔32〕研究發現位于內質網中的Pdia4負責蛋白質折疊,其表達隨著內質網應激反應的增強而增加。Hist2h2bb在食管鱗癌上皮與正常食管相比有表達差異〔33〕。IL-10是白細胞產生的多效調節細胞因子〔34〕。Rousset等〔35〕研究發現,IL-10能夠激活B細胞,促進其生存和增殖,促進類切換和抗體分泌。Sel1l是未展開蛋白反應/內質網相關降解途徑的一個組成部分〔36〕。Ji等〔37〕研究發現,B細胞前體中Sel1l-Hrd1復合體的缺失會導致大前B細胞向小前B細胞轉變過程中嚴重的發育障礙。Dnajb9是DNAJ蛋白家族的一個成員,是一種內質網常駐蛋白〔38〕。Lee等〔39〕研究發現,Dnajb9能夠抑制小鼠原發性成纖維細胞的衰老。Uhrf1是一種多功能的表觀遺傳調控因子,它將DNA甲基化與組蛋白甲基化、泛素化和乙酰化等多個組蛋白翻譯后修飾相結合〔40〕。Chen等〔41〕研究發現,Uhrf1能夠調節B細胞的增殖和親和力成熟,進而控制機體內病毒感染。
綜上,生物信息學研究表明老年小鼠及青年小鼠B細胞的差異表達基因主要與B細胞活化及內質網等有關。并且定義了H2afx、Ezh2、Pdia4、Hist2h2bb、IL-10、Sel1l、Dnajb9、Uhrf1此8個為關鍵基因,主要參與了B細胞發育、DNA甲基化和內質網的蛋白質調控等過程,為進一步探索衰老與免疫系統的影響機制提供了新思路。但是有關基因的上下游作用點,還需深入研究。