仲紅艷,唐珊,趙飛飛,王大新
肺動脈高壓是一種嚴重的致命性疾病,其可能是特發性的,也可能是先天性心臟病、自身免疫病、感染等疾病的最終結果[1],不管病因為何,病理特征都是肺血管重構,隨后右心室重構,如果無有效治療措施,最終可致右心衰竭和死亡[2]。據估計,全球目前約1%的人口患有肺動脈高壓,在65歲以上的人群中,這一比例高達10%[3],且在女性中更為流行,男女比例約為1:4[4]。隨著規范的臨床診療,患者5年生存率已提高到50%~60%[5]。但由于肺動脈高壓分子機制尚不清楚,目前的治療方案通常側重于緩解癥狀,而不是干預疾病進展。最近幾年,隨著基因測序技術的發展,產生了大量的基因信息,肺動脈高壓作為常見重大疾病之一,其基因芯片數據的發展已成為研究新趨勢和熱點。因此,本研究利用信使RNA(mRNA)和微小RNA(microRNA)表達譜數據集來識別肺動脈高壓發生的關鍵基因和重要通路,并構建microRNA-mRNA網絡,從基因層面分析肺動脈高壓發生的潛在分子機制,為探索肺動脈高壓治療提供一些新思路。
從美國國立生物中心的基因表達數據庫(Gene Expression Omnibus,GEO)(www.ncbi.nlm.nih.gov/geo)中獲取2個mRNA表達譜數據集GSE113439、GSE117261和1個microRNA表達譜數據集GSE67597,樣本均來源于人肺組織,各個數據集的特征見表1。

表1 各數據集特征
用R軟件中的“sva”包去除2個mRNA數據集批間差后通過“limma”包進行差異表達分析,最后以P<0.05和|log2FC | >0.5(“FC”表示差異表達倍數)為閾值篩選出mRNA數據集中的差異表達基因,另外,用GEO2R在線分析工具處理microRNA數據集,以P<0.05和|log2FC | >1為閾值篩選出差異表達的microRNA。
通過DAVID 6.8在線數據庫對差異基因進行基因本體論(Gene Ontology, GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析,且GO和KEGG各項以P<0.05為篩選條件。STRING在線數據庫構建蛋白之間相互作用可視化網絡圖(PPI),TargetScan在線數據庫預測差異microRNA靶基因,Cytoscape 3.6.1軟件獲取關鍵基因、關鍵模塊和構建microRNA-mRNA網絡。
mRNA數據集(GSE113439和GSE117261)共包含73個肺動脈高壓樣本和36個正常肺組織樣本。通過R軟件的“sva”包去除批間差(圖1),用“limma”包進行差異表達分析,并以P<0.05和|log2FC |>0.5為篩選條件,發現與正常肺組織相比,肺動脈高壓患者肺組織中有226個基因存在差異表達,其中141個為上調基因,85個為下調基因,對這些差異基因做聚類分析,見火山圖(圖2)。另外,microRNA數據集(GSE67597)中包含7個肺動脈高壓樣本和8個正常肺組織樣本。利用GEO2R在線分析工具從microRNA表達譜數據集中獲得29個差異表達microRNA,其中17個表達上調,12個表達下調。

圖2 226個差異基因的火山圖
226個差異基因GO分析包含生物學過程、細胞定位、分子功能三部分。這些基因涉及的生物學過程主要有炎癥反應、細胞趨化、細胞增殖、黏附等;基因主要位于細胞外基質、細胞外間隙、質膜等;分子功能主要是肝素結合、整合素結合、碳水化合物結合、轉運活性、趨化活性等。KEGG富集結果顯示這些基因主要參與造血細胞系、性別、錐蟲病、葡萄球菌感染等方面的信號通路。

表2 226個差異基因生物學過程的GO分析結果

表3 226個差異基因細胞定位的GO分析結果

表4 226個差異基因分子功能的GO分析結果

表5 226個差異基因KEGG富集分析結果
將226個差異基因導入STRING在線數據庫構建PPI網絡,利用Cytoscape 3.6.1軟件中的cytoHubba插件對 PPI 網絡圖中的基因用Degree算法進行篩選。如圖3所示,圓圈顏色越深,代表其度值(degree)越大,本研究以度值排名前十的基因作為關鍵基因,分別為HGF(degree=23)、KIT(degree=24)、VCAM1(degree=29)、CXCL12(degree=30)、ITGAM(degree=47)、FPR1(degree=26)、CXCL9(degree=24)、CXCR1(degree=24)、TLR8(degree=35)、CXCR2(degree=23)。應用Cytoscape 3.6.1中的MCODE插件發現PPI網絡圖中有一個顯著簇集的模塊(圖4),圖4B模塊中包括12個基因,66個邊。將模塊基因進行GO和KEGG分析,發現其生物過程涉及細胞趨化、炎癥反應、免疫反應、血管內皮生長因子的產生、血管生成,模塊基因主要位于高密度脂蛋白粒子、細胞外間隙,KEGG通路涉及趨化因子信號通路、受體相互作用、金黃色葡萄球菌感染、補體系統。

圖3 226個差異基因的PPI網絡
由于microRNA可促進其靶mRNA降解或抑制翻譯,在轉錄后水平調控基因表達,所以用TargetScan數據庫分開預測上調和下調的差異microRNA靶基因,并分開與差異基因取交集。結果顯示,17個表達上調的microRNA預測靶基因11 404個,與前述85個表達下調的差異基因取交集后得到37個下調差異靶基因,如圖5A所示。12個表達下調的microRNA預測靶基因13 679個,與前述141個表達上調的差異基因取交集后得到106個上調差異靶基因,如圖6A所示。將這143個差異靶基因做GO和KEGG分析,發現其主要參與炎癥反應、細胞趨化等生物學過程,涉及的通路主要是趨化因子信號通路、Rap1信號通路等。利用Cytoscape 3.6.1軟件構建差異microRNA-mRNA網絡圖,如圖5B、6B所示,網絡中共有22個microRNA,用degree算法篩選,將度值排名前五的microRNA定為關鍵microRNA,分別為 hsa-miR-656(degree=52)、hsa-miR-4693-5p(degree=41)、hsa-miR-1253(degree=39)、hsamiR-4704(degree=37)和hsa-miR-302f(degree=34)。DAVID 6.8在線分析這5個關鍵microRNA對應的差異靶基因,發現其主要參與細胞增殖、血管生成、炎癥反應等過程,涉及的通路主要是腎素-血管緊張素系統、造血細胞系、磷脂酰肌醇-3-激酶/蛋白激酶 B(PI3K/Akt)、Ras相關蛋白 1(Rap1) 信號通路等。

圖5 上調差異microRNA-mRNA網絡

圖6 下調差異microRNA-mRNA網絡
肺動脈高壓是進展性難治性疾病,現有治療方法不能完全逆轉病理重塑,且尚未完全清楚發病機制,因此與肺動脈高壓相關的重要基因和通路有待進一步發現。本研究分析mRNA和microRNA表達譜,分別獲得226個差異基因(141個上調,85個下調)和29個差異microRNA(17個上調,12個下調),這說明肺動脈高壓發病機制復雜,是多個基因相互作用的結果。為進一步了解這些基因在肺動脈高壓中的作用,本研究對差異基因、PPI網絡中顯著簇集的模塊基因、microRNA-mRNA網絡中差異靶基因分別進行GO和KEGG富集分析,發現生物過程主要涉及細胞增殖、細胞趨化、炎癥反應,這與已有研究報道一致,肺血管平滑肌細胞異常增殖,導致內膜增厚、血管順應性喪失,使血管腔變窄,阻礙血液流動,肺動脈壓升高。有研究表明趨化因子水平與肺血流動力學、右心室功能相關,趨化因子也參與肺血管重構過程,如促進細胞增殖、遷移等[6]。炎癥研究也越來越受青睞,有報道肺動脈周圍有大量炎性細胞浸潤,炎性細胞可釋放各種細胞因子和趨化因子,導致內皮細胞凋亡,平滑肌細胞增殖,促進肺血管重構,且肺動脈高壓患者免疫力低下,炎癥容易誘發肺動脈高壓加重[7],所以靶向抗炎可能是治療肺動脈高壓新方向[8-10]。
根據PPI網絡中度值大小識別出HGF、KIT、VCAM1、CXCL12、ITGAM、FPR1、CXCL9、CXCR1、TLR8、CXCR2這10個關鍵基因。HGF具有刺激肺血管內皮細胞增殖、促進新生血管形成作用[11],利用基因轉染HGF干預肺動脈高壓動物模型,發現HGF能降低肺動脈壓力從而改善肺動脈高壓[12]。KIT編碼的一種Ⅲ型受體酪氨酸激酶,與其受體結合后磷酸化,參與調節細胞增殖、凋亡、趨化和細胞分化[13],KIT突變有嚴重的致癌作用,如胃腸道間質瘤、黑色素瘤、急性髓細胞白血病等[14]。VCAM1編碼由促炎細胞因子誘導的黏附分子,有研究報道系統性硬化癥合并肺動脈高壓(lSSc-PAH)中VCAM1升高[15],但不能作為lSSc-PAH特異性診斷標志物[16]。CXCL9、CXCL12屬于趨化因子中CXC亞家族,研究表明CXCL9與心臟重構相關[17],血中CXCL12水平升高與特發性肺動脈高壓患者右心室功能障礙有關[18],利用CXCL12中和作用可減輕肺部巨噬細胞浸潤,從而改善大鼠肺動脈高壓[19]。CXCR屬于趨化因子受體家族,趨化因子受體和配體結合發揮重要生物學功能,例如CXCL8是CXCR1和CXCR2的共同配體,靶向過表達CXCL8受體(即CXCR1和CXCR2)的肺動脈內皮細胞,可通過阻斷炎癥細胞聚集而減輕肺動脈高壓[20]。CXCL12是CXCR4的特異性配體,CXCL12-CXCR4軸參與多種組織的病理過程,缺乏CXCL12或CXCR4的小鼠不能存活,而且有神經、血管、心臟方面的發育缺陷[21]。ITGAM基因編碼CD11b,與系統性紅斑狼瘡易感性有關,調節白細胞活化、遷移、黏附[22]。FPR1對血管系統的動態可塑性有重要意義[23],抑制FPR1能減輕肺部炎癥和缺氧再灌注心肌損傷[24]。TLR8屬于Toll樣受體家族,TLR8激動劑有顯著的抗腫瘤效應[25]。綜上,HGF、VCAM1等6個關鍵基因已報道與肺動脈高壓發生發展相關,KIT、ITGAM、FPR1、TLR8這4個關鍵基因目前在肺動脈高壓中尚無具體研究,但也可能是潛在治療靶點,需進一步研究。
microRNA是一種小的非編碼RNA,研究發現microRNA失調與肺動脈高壓的嚴重程度和預后相關,本研究從microRNA-mRNA網絡中識別出hsamiR-656、hsa-miR-4693-5p、hsa-miR-1253、hsamiR-4704和hsa-miR-302f這5個關鍵microRNA。一項薈萃分析報道miR-656與多種癌癥預后相關[26],研究發現長鏈非編碼RNA NORAD通過吸附miR-656促進非小細胞肺癌的發生發展[27]。miR-1253通過靶向WNT5A抑制非小細胞肺癌細胞增殖和轉移,可能是治療非小細胞肺癌的治療靶點[28]。另外,KIT、VCAM1和CXCL9這三個關鍵基因是miR-4693-5p靶基因,CXCL9、CXCL12和VCAM1也分別是miR-1253、miR-4704和miR-302f的靶基因。雖然目前尚無這5個關鍵microRNA在肺動脈高壓中的具體研究,但其GO分析提示可能參與發病機制,這為以后的研究提供一些參考。
本研究尚有不足之處,首先,這些在肺動脈高壓組中差異表達的基因,尤其是關鍵基因和關鍵microRNA,需要通過細胞實驗和臨床樣本進一步驗證。其次,這些差異表達基因和差異 microRNA分別是從不同患者肺組織樣本中篩選,所以結果會因樣本的不同而影響。總之,本研究結果除了揭示肺動脈高壓發生發展過程中涉及的關鍵基因和通路及以生物信息學方法驗證已有研究,也為探索新的治療策略提供了一定的理論依據。
利益沖突:所有作者均聲明不存在利益沖突