楊子云,蔣婷婷,葛春光,賈曉東,劉清發 ,王 琪 ,彭蘭博,蘭 菲,齊 軍
(1.聊城市人民醫院 呼吸內科,山東 聊城 252000;2.聊城市職業技術學院,山東 聊城 252000;3.聊城市人民醫院 轉化醫學實驗室,山東 聊城 252000;4.聊城市人民醫院 內分泌科,山東 聊城 252000;5.聊城市人民醫院 病案信息科,山東 聊城 252000)
肺動脈高壓(PAH-Pulmonary Arterial Hypertension)是一種罕見、致命的心血管疾病[1,12-13],其預后較差,嚴重降低了患者的生存質量。肺動脈高壓是由遺傳、環境等多種病因共同作用導致的[12-13]。PAH臨床特征主要是內皮功能障礙、血管細胞增殖、代謝紊亂和肺小動脈炎癥等,肺動脈壓升高和血管阻力增加,通常導致右心衰竭,嚴重者導致死亡[6-9]。PAH的血流動力學診斷標準mPAP≥ 25 mmHg,同時肺小動脈楔壓(Pulmonary Artery Wedge Pressure,PAWP)≤15 mmHg 及肺血管阻力 >3 Wood單位[14-15]。
肺動脈高壓的發病機制較為復雜,目前尚不清楚,研究指出PAH涉及細胞功能異常、離子通道等多個生物過程,肺血管平滑肌細胞、內皮細胞、成纖維細胞及血小板等多個種類細胞異常參與其形成及進展,多種血管活性物質功能失衡促進其發生[6,8,14-15]。近年來已經發現PAH與Notch3、BMPR2、PTEN、ALK1等基因參與的信號通絡和調節機制密切相關。但由于目前肺動脈高壓樣本較難獲取,相關研究數據樣本量較小,其疾病機理尚未闡述清楚。
炎癥細胞侵潤是肺動脈高壓血管重塑的典型特質,這提示PAH可能與人體免疫機制相關[9]。新型冠狀病毒肺炎(Corona Virus Disease 2019(COVID-19))是一種急性感染性肺炎,在全球范圍內流行,其病原體是新型冠狀病毒,之前未在人類中發現[2-5],具有較強的傳染性。有研究指出COVID-19會通過多種機制影響患者的心血管系統,同時具有心血管疾病的患者為新型冠狀病毒易感人群[16]。肺動脈高壓作為心血管疾病的一種,其進展較快,如果患者一旦合并肺部感染,會加快疾病進程,使病情惡化,故COVID-19感染會加重PAH患者病情,為其治療提出更多挑戰。
為了更深入的探索PAH的發病機制,挖掘新型冠狀病毒感染對PAH患者的影響機制,合并了多個PAH表達譜數據,并構建了PAH差異基因和冠狀病毒相關免疫基因的互作網絡,從而從系統生物學角度探索新型冠狀病毒對PAH致病機理的影響,挖掘潛在的基因靶點,為肺動脈高壓的研究和治療提供新思路。
表達譜數據來自Gene Expression Omnibus(GEO-https://www.ncbi.nlm.nih.gov/geo/),編號分別為GSE113439,GSE117261,GSE131793,GSE17400。使用R包GEOquery下載相應數據集,并獲取對應的芯片注釋信息。本次實驗共獲得PAH表型及其對照數據129例,其中PAH數據81例,對照數據41例。蛋白質互作網絡數據采用STRING[17]數據庫的最新版本(V11.0),本次不考慮互作關系的方向,網絡節點對應為gene symbol,統計得到網絡中共包括16 073個基因,共500 111對互作關系。
本次實驗合并了3套關于PAH的數據,為了去除批次效應,提高后續分析數據的質量,使用R包sva[18]的經驗貝葉斯模型ComBat對合并的數據進行去除批次效應,然后使用芯片平臺注釋文件解析為Gene Symbol表達數據,相同基因不同探針的表達數據使用均值進行合并,表達譜數據進行標準化。
使用GSEA[19]軟件(V4.0.3)對較正后的表達譜數據進行功能富集分析,并使用limma[20]包,對表達數據進行差異基因篩選,錯誤發現率(False Discovery Rate, FDR)設定為FDR<0.01。
從蛋白質互作網絡中提取出肺動脈高壓差異表達基因相關的網絡做為PAH功能相關網絡,為了能抓取和冠狀病毒毒性因子相關的基因互作關系,從PAH功能網絡中提取出與其功能直接相關基因構成的網絡,此背景網絡作為研究肺動脈高壓和新冠狀病毒互作網絡的基礎背景。
有研究指出SARS-CoV-2的序列與SARS-CoV-1的序列具有較高的一致性[21],本研究通過全長的參考序列其核心蛋白質的序列一致性來進行驗證。本次使用的數據包括SARS-CoV-2參考序列(NC_045512.2),SARS-CoV-1(NC_004718.3),MERS-COV(NC_019843.3),多序列比對使用Mega[22]和MAFFT[23](https://www.ebi.ac.uk/Tools/msa/mafft/)。
研究指出,SARS-CoV-2與SARS-CoV-1具有較高得基因組相似度,而且都通過ACE2基因影響人類的免疫基礎功能[24]。所以本次使用GSE17400數據集,提取其主要的差異功能基因,然后注釋其相關的功能通絡。通絡中主要的因子即為SARS-CoV-1病毒與人免疫互作的功能因子。這些功能因子作為新型冠狀病毒侵入人體后的免疫因子。
從GSEA MsigDB數據中提取與SARS-CoV-1病毒因子及免疫相關的基因集合,然后從背景網絡中挖掘二者互作的核心功能節點。使用軟件Cytoscape V3.6.0對構建的網絡進行可視化,網絡模塊分析采用cytoHubba[25]。
為了探索PAH發病機理,闡述其致病機理,文中使用經過校正的表達譜數據進行KEGG、BioCarta、PID、Reactome通路富集分析,并進行GO Biological Processes功能注釋。篩選P<0.01,|NES|>1的顯著通路,結果顯示,血管平滑肌細胞、成纖細胞等細胞異常通路與PAH的進展密切相關;此外轉化生長因子-β信號通路、Wnt信號傳導途徑等信號轉導通路也與PAH密切相關。細胞增值、T/B細胞參與的免疫反應,炎癥反應等重要生物過程也與PAH緊密相關。篩選的部分顯著通路,主要包括FOXP3 TARGETS IN THYMUS,TGFBETA1 IL6 IL23A CD4 TCELL,IFNA STIM STAT4 KO EFFECTOR CD8 TCELL,NFKB INHIBITOR TREATED HCMV INF MONOCYTE等通路(見圖1),這些通路涉及細胞信號調控,固有免疫反應,機體對外界刺激反應等重要的免疫生物學過程,這提示PAH的過程與機體免疫密切關聯。

圖1 肺動脈高壓功能相關部分顯著通路及生物過程
使用R的limma包中的貝葉斯方法對處理后的數據進行差異表達基因篩選,顯著性P<0.01,通過篩選共得到179個差異表達基因,為了更好的闡述差異表達基因相關的功能機制以及相互作用,從STRING蛋白質互作網絡中提取了差異表達基因相關的功能網絡,共提取出與差異基因直接相關的18 087個基因,共138 807條互作關系對,這些互作關系對是肺動脈高壓功能進展密切相關的,是肺動脈高壓致病機理潛在的分子基礎。
通過全長參考基因組序列的比對,發現與MERS-COV相比較,SARS-CoV-2的序列與SARS-CoV-1具有更高的相似性。為了驗證是否在蛋白質水平也存在類似的結論,整理出了全長參考基因組的結構蛋白質序列,然后進行多序列比對,結果發現SARS-CoV-2和SARS-CoV-1的M、N和E蛋白具有90%以上的遺傳相似性,而S蛋白的遺傳相似性略有降低,達77.54%。通過基因組序列和結構蛋白序列比對,發現SARS-CoV-2與SARS-CoV-1具有更高的相似性(見圖2)。

圖2 SARS-CoV-2與SARS-CoV-1、MERS-COV序列及結構蛋白相似性比較
SARS-CoV-1與SARS-CoV-2的平均序列相似性高達70%,SARS-CoV-1是通過與人的ACE2蛋白互作結合進入人體的[26]。新型冠狀病毒S-蛋白中與人體ACE2蛋白結合的關鍵氨基酸有部分改變,但依舊維持了SARS-CoV-1的S-蛋白與ACE2蛋白互作的結構構象,所以COVID-19很可能通過ACE2蛋白影響人體的免疫反應[27]。有研究指出ACE2的表達主要與先天及后天免疫應答相關,與B細胞相關的免疫調節及相關細胞因子、IL8、IL16等密切相關[1,9]。為了弄清SARS-CoV在感染人后對體內對生化過程的影響,我們使用GSE17400數據集的SARS-CoV-1感染12 h、24 h、48 h后的表達數據,分析其進展相關功能機制。發現SARS-CoV-1在侵入宿主后會激活機體的免疫反應,相關功能主要有病毒反應、病毒復制機制調控,同時還會影響細胞周期控制、細胞分化等重要生物過程。顯著GO注釋結果(見圖3)。

圖3 SARS-CoV-1侵染人體差異基因GO功能富集顯著生物過程
上述注釋結果表明PAH差異表達基因與免疫應答相關通路密切相關,為了深入研究其具體的互作情況,整理出二者分別對應的基因列表,并進行統計,PAH差異表達基因112個,MSigDB中免疫應答相關基因2 916個,二者交集基因共328個(見圖4a)。PAH與正常組對比分析發現ACE2表達差異不顯著(P=0.053),但GSE17400數據分析發現,感染前后,及感染后12 h、24 h、48 h,ACE2表達差異顯著(見圖4b,4c)。為了探索病毒入侵宿主后,相關差異表達基因情況,統計GSE17400數據集的表達差異基因,并分別與PAH差異表達基因和免疫應答相關基因進行分析,共有4個基因同時參與三類生物學過程,具體情況。4個基因分別為ITGAM,SHMT2,PLAC8,CCR1。從統計結果來看,三者的交集相對較小,不利于深入探索COVID-19對PAH的影響機制,接下來我們通過蛋白質互作網絡的形式進一步擴展核心基因,并從系統學的角度闡述其可能的發病和進展機理。

圖4 PAH和免疫相關基因以及SARS-CoV-1差異表達基因的分析
為了探索PAH的疾病進展與新型冠狀病毒感染后的機體反應重要過程,從Molecular Signatures Database(v7.1)的GO生物過程中提取與機體免疫相關的生物過程,并綜合免疫細胞因子、T/B細胞介導的免疫反應等過程的重要基因,與PAH的差異基因相關互作網絡進行網絡分析。本次構建的互作網絡包含2 364個基因,共22 720條互作關系對。使用Cytoscape的cytoHubba插件進行網絡分析,因為聚類系數代表了網絡群體中“關系”重要的程度,故本次選擇聚類系數較高的30個基因,作為互作網絡中關鍵基因,進行后續核心功能解釋和分析。
從網絡的統計特性可以得到,提取的核心網絡滿足無尺度特性,少數調控基因在網絡中起關鍵的調控作用。重要的基因如VCAM1,HBB,IL1R2,RNASE2,ITGAM,FGR等。在GeneCard數據庫中查詢相關基因的主要功能可知,這些基因參與信號調控,細胞免疫反應等重要生物學過程,在機體響應外界刺激,啟動自身免疫及炎癥等反應中起到重要的調控作用。核心網絡(見圖5)。

圖5 肺動脈高壓差異基因與冠狀病毒感染后免疫基因蛋白質互作網絡顯著模塊
肺動脈高壓發病機制復雜,是由環境因素、遺傳因素等多種病因共同作用而導致的肺血管阻力增加,病理改變的一類致死性較高的心血管疾病。PAH的預后較差,嚴重影響患者的生存質量。近幾年,隨著靶向用藥的不斷更新和普及,肺動脈高壓的一年生存期提高了10%~20%,改善較為顯著,但整體而言,其治療效果仍不容樂觀,究其原因是PAH的致病機理尚未研究清楚,這主要是因為PAH組織樣本較難獲取,樣本量較小,全基因組范圍內的研究較少等導致的。本研究合并了來自GEO數據庫的三個同一平臺的表達數據,深度挖掘PAH致病相關基因及信號通路。研究發現轉化生長因子-β信號通路、血管平滑肌細胞、成纖細胞、細胞增殖及分化以及T細胞或B細胞介導的免疫反應與PAH的致病和發展緊密相關。
轉錄生長因子-β信號通路在炎癥反應、細胞分化、固有免疫等生物過程中起到關鍵的作用,BMPR2基因編碼BMPR-II,是骨形態發生蛋白配體的細胞表面受體,在與配體結合時,TGF-β II型受體磷酸化I型受體,導致調節SMAD的受體的磷酸化并被激活,然后與coSMAD復合并轉移到細胞核以激活特定的轉錄程序[28]。CAV1作為細胞膜內的一種支架蛋白與CAV2形成穩定的復合物,并驅動caveolae的形成,CAV1參與T細胞受體介導的T細胞活化信號通路。KCNK3基因是編碼鉀通道蛋白超家族的成員,其編碼的蛋白質是一個向外整流的通道,對細胞外pH值的變化較為敏感,并受到細胞外酸化的抑制。CAV1、KCNK3等基因變異是肺動脈高壓相關的重要遺傳因素。
炎癥細胞浸潤是肺動脈高壓患者血管重塑異常的一個顯著特征,這表明免疫效應細胞參與PAH的進展。通路富集分析發現PAH的進展與T/B細胞參與的免疫過成,固有免疫相關過程。SARS-CoV-2感染人體后,會引起發熱、乏力、干咳呼吸困難等癥狀,這對PAH患者而言無疑是雪上加霜,所以探索PAH的免疫相關機制與人體內免疫過程,可能提示有效的基因靶點,從而有效的緩解和治療PAH的癥狀。通過蛋白質互作網絡研究發現HBB、ITGAX、VCAM1、CLEC7A、TLR8等基因在網絡中發揮了重要的調控作用。
HBB參與固有免疫和紅細胞吸收二氧化碳釋放氧氣等重要調控通路,參與氧氣從肺部運輸到周圍組織的重要功能[29];此外還有研究指出HBB還參與疼痛和炎癥反應等相關生物過程。ITGAX基因編碼整合素αX鏈蛋白,該蛋白與β2鏈(ITGB2)結合形成白細胞特異性整合素,αXβ2復合物與αMβ2整合素在中性粒細胞和單核細胞與受刺激內皮細胞粘附功能相關。VCAM1在細胞識別過程中很發揮重要作用,同時在白細胞與內皮細胞粘附中起關鍵作用,與白細胞上的整合素α-4/β-1(ITGA4/ITGB1)相互作用,介導粘附和信號轉導。另外VCAM1基因在免疫應答和白細胞遷移到炎癥部位中起重要作用。
這些基因在肺動脈高壓的發病及進展中起關鍵作用,并且這些基因在SARS-CoV-2侵染人體后的相關免疫中也發揮這重要的生物功能,這可能提示以這些基因為靶點,可能發現新的治療藥物,這對PAH機理研究和治療有重要意義。
通過PAH表達譜數據,深入探索了PAH相關的遺傳機制,同時通過蛋白互作網絡,研究了冠狀病毒感染相關的免疫相關基因與PAH致病機理相關基因的互作關系,發現了一些潛在的基因靶點,這對PAH遺傳研究和挖掘靶向藥物研究提供了新的研究思路。
1)互作網絡研究結果發現HBB、ITGAX、VCAM1、CLEC7A、TLR8等基因在PAH與機體免疫調控中發揮了重要作用,這可能是PAH合并冠狀病毒感染患者的治療提供了候選靶點。
2)轉化生長因子-β信號通路、T/B細胞介導的免疫通路等調控通路在PAH的發生和發展中發揮了重要的作用。