劉奕清,雷 燕,楊 靜,修成奎,王 雪,胡艷紅,于博文,劉逸南,王佳麗,吳 丹,吳 燁
目前人口老齡化已成為全球廣泛關注的問題,截至2018年底,我國65歲及以上人數接近1.67億人,占總人口的11.9%[1],由年齡增長帶來的退行性疾病如心血管疾病、骨質疏松、阿爾茨海默病等逐漸成為重大的社會健康問題[2]。眾所周知,衰老是急慢性心血管疾病發生的主要危險因素[3],且疾病的發生率隨年齡的增長呈指數上升:因心臟病致死人數占65~74歲總死亡人數的40%以上,占85歲以上總死亡人數的60%[4]。因此,探究衰老對心臟的影響及其作用機制對預防心血管疾病的發生,提高老年人群的生活質量具有非常重要的意義。目前,心臟衰老的分子調節機制主要包括線粒體功能障礙、端粒縮短、神經體液調節以及自噬下調等[5-6],但因心臟衰老涉及一系列復雜的生理過程變化,所以仍需對心臟衰老分子調控機制進行深入探究。
基因芯片作為凝結生命科學與信息科學研究成果的重要技術,已經成為大規模提取和探索生物分子信息的強有力手段。隨著芯片技術的發展與普及,與疾病相關的基因表達數據儲存在各大公共數據庫中,海量差異基因可以輕易獲得[7]。本研究從基因表達數據庫(Gene Expression Omnibus, GEO)中獲取數據集GSE12480,利用生物信息學方法篩選年輕小鼠和年長小鼠心室中的差異基因,然后對差異基因進行基因本體(gene ontology,GO)功能富集分析和京都基因與基因組百科全書(kyoto encyclopedia of genes andgenomes, KEGG)信號通路分析,并且構建蛋白質相互作用網絡獲得關鍵基因。使用關聯性圖譜(Connectivity map, CMap)篩選具有潛在治療作用的小分子藥物,為心臟衰老的早期診斷及發病機制提供重要的依據。通過以上分析,為進一步研究小鼠心臟衰老的分子機制提供新的思路。
1.1 數據來源 通過GEO數據庫下載小鼠心室總RNA表達譜數據集GSE12480,其實驗平臺為基于Affymetrix的GPL1261平臺。GSE12480數據集包括20個樣本,均取自于小鼠的心室RNA,其中包括10只年輕(4~6個月)和10只年長(25~28個月)小鼠樣本。
1.2 差異表達基因的篩選 通過使用R語言(3.5.3, www.r-project.org)的limma包篩選出數據集GSE12480中年輕小鼠和年長小鼠的差異表達基因,篩選標準為|log2FC|>1,FDR(false discovery rate)<0.01。對差異表達基因進行聚類分析,并繪制熱圖將結果可視化。
1.3 差異表達基因的GO功能富集和KEGG通路分析 使用DAVID(https://david.ncifcrf.gov/)在線分析工具,對差異表達基因進行GO功能富集分析和KEGG通路分析。其中GO功能富集分析主要從生物過程(biological process,BP)、細胞組分(cellular component, CC)和分子功能(molecular function, MF)這3個方面進行分析。同時使用R語言對GO功能富集和KEGG通路分析的結果進行可視化。
1.4 構建蛋白質相互作用網絡篩選關鍵基因 使用STRING(https://string-db.org)在線分析工具構建差異表達基因的蛋白質相互作用網絡。之后使用Cytoscape(http://cytoscape.org/download_old_versions.html)軟件將蛋白質相互作用網絡進行可視化分析,采用CytoHubba插件以節點自由度(Degree)>50篩選出關鍵基因。
1.5 差異表達基因的模塊分析 使用Cytoscape中的MCODE插件對蛋白質相互作用網絡進行模塊分析,以MCODE分數>10且基因數>20為標準篩選出關鍵模塊,并將關鍵模塊的基因進行GO功能富集和KEGG通路分析。
1.6 關聯圖分析 CMap(http://www.broad.mit.edu/cmap)收集了1 309種化合物,含有7 000多個基因表達譜,揭示了疾病、基因和藥物之間的聯系,可用來發掘潛在治療疾病的藥物[8]。將差異表達基因上傳到CMap數據庫,篩選出關聯系數評分(Score)負相關居前5位的小分子化合物[9]。
2.1 差異表達基因的篩選結果 使用R語言limma包對年輕小鼠和年長小鼠心室基因進行差異表達分析,共篩選出471個差異表達基因,包括437個在年長小鼠中上調的基因和34個在年長小鼠中下調的基因(見圖1)。同時將差異最顯著的前50個基因進行聚類熱圖分析,可視化差異表達基因在不同樣本中的表達見圖2。

圖1 差異表達基因的火山圖(紅點和綠點分別表示在年長老鼠心室中表達水平上調的基因和下調的基因)

圖2 年輕小鼠心室和年長小鼠心室中居前50個差異表達基因的聚類熱圖
2.2 差異表達基因的GO功能富集和KEGG通路分析結果 使用DAVID數據庫對471個差異表達基因進行GO富集分析和KEGG通路分析,并且使用R語言將每個分析結果的前10位進行可視化(見圖3)。從GO分析結果可以看出,在生物學過程的分析中(見圖3A),差異表達基因主要富集于細胞黏附(cell adhesion)、炎癥反應(inflammatory response)、細胞外基質組織(extracellular matrix organization)和血管生成的正調控(positive regulation of angiogenesis)等生物學過程。在細胞組分的分析中(見圖3B),差異表達基因主要富集于細胞外空間(extracellular space)、細胞外泌體(extracellular exosome)和蛋白質細胞外基質(proteinaceous extracellular matrix)等。在分子功能的分析中(見圖3C),樞紐模塊基因主要富集于蛋白質結合(protein binding)、蛋白質均二聚活性(protein homodimerization activity)、鈣離子結合(calcium ion binding)和肝素結合(heparin binding)等功能。從KEGG信號通路分析結果可以看出(見圖3D),差異表達基因主要富集于PI3K-Akt信號通路(PI3K-Akt signaling pathway)、局灶性粘連(focal adhesion)和趨化因子信號通路(chemokine signaling pathway)等信號通路。

圖3 差異表達基因的GO功能富集分析和KEGG通路分析(A為生物過程;B為細胞組分;C為分子功能;D為KEGG通路)
2.3 差異表達基因的蛋白質相互作用網絡分析 將471個差異表達基因輸入STRING在線分析工具,分析其蛋白質之間的相互作用關系。然后將獲得的數據導入Cytoscape軟件,形成可視化蛋白質相互作用網絡,并利用插件CytoHubba,以Degree>50為標準篩選出5個關鍵基因(見圖4),分別是纖維連接蛋白基因(fibronectin1,Fn1)、蛋白酪氨酸磷酸酶受體C(Ptprc)、基質金屬蛋白酶組織抑制因子-1(tissue inhibitor of matrix metalloproteinases-1, TIMP-1)、胰島素一號增長因子(insulin-like growth factors 1,Igf1)、內皮細胞表面Ⅷ因子抗原(vonWillebrand factor,VwF)。

圖4 差異表達基因的蛋白質相互作用網絡分析
2.4 差異表達基因的模塊分析結果 使用Cytoscape中的MCODE插件以MCODE分數>10且基因數>20為標準分析出了2個重要的模塊(見圖5)。對兩個模塊中的基因進行GO功能富集和KEGG通路分析發現,模塊1主要與補體和凝血級聯、局灶性粘連、P53信號通路和PI3K-Akt信號通路相關(見圖5A),模塊2主要與趨化因子信號通路、細胞因子與細胞因子受體的相互作用和TNF信號通路相關(見圖5B)。

圖5 差異表達基因蛋白質相互作用網絡的模塊分析(A為模塊1;B為模塊2)
2.5 潛在治療藥物的篩選 CMap中的Score值處于-1~1,正值表示該藥物對疾病有促進作用,負值表示該藥物對疾病有抑制作用,絕對值越大則表明相關性越大。處理后的差異基因映射到CMap數據庫,篩選出關聯強度居前5位的負相關小分子化合物,這些化合物對心臟衰老基因表達有抑制作用,Score負相關排名居前5位的小分子化合物見表1。

表1 位居前5位的具有潛在治療心臟衰老的小分子藥物
高齡已經被認為是心血管疾病如冠心病、中風、周圍血管疾病和心力衰竭的主要危險因素[10],探究衰老對心臟的影響及其作用機制至關重要[11-12]。生物信息學綜合運用計算機科學和生物學等工具,闡明和理解海量數據背后的生物學意義,作為一門新興的交叉學科,如今已被廣泛應用于生命科學領域中[13]。
本研究從GEO數據庫中獲取年輕小鼠和年長小鼠心室總RNA表達譜數據集GSE12480,利用生物信息學方法分析年輕小鼠和年長小鼠心室中表達具有顯著差異的基因,共篩選出471個差異基因,包括437個在年長小鼠中上調的基因和34個在年長小鼠中下調的基因。同時對差異基因進行了GO功能富集分析和KEGG通路分析,并且通過構建蛋白質相互作用網絡對差異基因所編碼蛋白質間的調控網絡進行了可視化分析,從而定義了Fn1、Ptprc、Timp1、lgf1、Vwf這5個關鍵基因。
通過對差異表達基因進行GO功能富集和KEGG通路分析,表明這些差異表達基因主要參與PI3K/Akt信號通路、局灶性粘連和趨化因子信號通路等作用。PI3K/Akt信號通路是細胞內作用廣泛的一條通路[14],參與衰老心肌細胞凋亡、使核轉錄因子-κB(NF-κB)恢復轉錄活性、激活Bcl-2,從而起到抗衰老心肌細胞凋亡的作用[15]。PI3K主要通過激活Akt發揮促細胞存活和對抗凋亡的作用,Akt信號激活后可以抑制多種促凋亡因子[16]。有研究表明熱量限制是通過激活PI3K/Akt途徑,并部分改善心臟胰島素敏感性來防止衰老引起的心肌收縮力下降[17]。Hao等[18]對新西蘭大白兔進行研究,發現心臟收縮劑能夠通過PI3K-Akt信號通路,對慢性心力衰竭治療產生積極影響。細胞與纖維連接蛋白的局灶性粘連與血管僵硬有關[19]。研究表明對趨化因子的調控作用可以有效調節細胞衰老和相關心血管疾病[20-22]。本研究對篩選出來的差異表達基因的兩個重要模塊進行GO功能富集和KEGG信號通路分析,結果表明模塊1主要與局灶性粘連和PI3K-Akt信號通路相關,模塊2主要與趨化因子信號通路相關,證明這些信號通路與衰老的發生發展具有較高的相關性,值得進一步研究。
為了進一步分析與衰老相關度較高的關鍵基因,本研究通過蛋白質相互作用網絡定義了Fn1、Ptprc、Timp1、lgf1、Vwf這5個關鍵基因。Fn1是細胞外基質的重要成分,能夠促進心內膜分化[23],研究表明人主動脈內皮細胞在接近復制性衰老時變成四倍體,從四倍體內皮細胞的整體基因表達分析顯示Fn1的基因表達增加[24]。Ptprc是類風濕性關節炎的遺傳生物標志,曲衛玲等[25]研究發現,由生地、人參、茯苓和蜂蜜組成的瓊玉膏,可糾正Ptprc蛋白的異常表達量,調節NF-κB通路,從而延緩衰老。Timp-1是Timp家族中的一員,Timp是一個多基因家族的編碼蛋白,是基質金屬蛋白酶活性的特異性抑制劑,基質金屬蛋白酶活性與高血壓、動脈粥樣硬化和主動脈瘤等各種血管疾病有關[26]。Vigetti等[27]通過人主動脈平滑肌(AoSMC)連續傳代的體外衰老模型,發現TIMP-1和TIMP-2在老年AoSMCs中的表達和活性升高,從而支持了老年細胞基質金屬蛋白酶-2(MMP-2)活化受到抑制的假說。Igf-1被稱作“促生長因子”,是一種在分子結構上與胰島素類似的多肽蛋白物質,在舒張血管、促進細胞有絲分裂、促進細胞分化與創傷修復中起重要作用。從嚙齒動物到人類,Igf-1信號通路已成為衰老過程的主要調節劑[28]。隨著年齡的增長,脂肪組織中血管功能的改變會影響線粒體保護激素(如Igf-1)的合成與分泌[29]。VwF是第Ⅷ因子(factor Ⅷ, FⅧ)的載體蛋白,與動靜脈血栓形成和出血性疾病的風險相關[30]。Atiq等[31]研究發現老年1型血管性血友病病人與VwF和FⅧ水平升高之間存在關聯。
本研究通過CMap篩選了治療心臟衰老的潛在小分子化合物,白屈菜堿存在于罌粟科植物白屈菜中,有罌粟堿樣生物活性,具有抗腫瘤、抗菌、抗病毒等作用,白屈菜提取物和主要生物堿能夠對hERG鉀通道和犬心臟動作電位產生影響[32]。阿爾茨海默病與衰老有高度相關性[33],STOCK1N-35696在Md.Rezanur的研究中被確定為治療阿爾茨海默病的新型潛在治療劑[34]。白屈菜堿、STOCK1N-35696等可能成為治療心臟衰老的新藥物。
綜上所述,本研究通過生物信息學方法研究表明差異表達基因主要參與PI3K/Akt信號通路、局灶性粘連和趨化因子信號通路等作用,并篩選出Fn1、Ptprc、Timp1、lgf1、Vwf這5個關鍵基因。白屈菜堿、STOCK1N-35696等可能成為治療心臟衰老的新藥物,為進一步探索心臟衰老的作用機制提供了新思路,但仍需進一步的實驗來證實差異表達基因和小分子藥物的功能。