蔡 睿 王維鐵
(吉林大學臨床醫學院,長春130021)
2017年中國疾病負擔研究報告顯示缺血性心臟病是我國排名第二位的導致人群壽命損失的疾病,死亡率大約為123.9/10萬,占總死亡人數的16.7%[1]。目前經皮冠狀動脈介入(percutaneous coronary intervention,PCI)是治療缺血性心臟病的一種主要手段,但是PCI術后支架內再狹窄(instent restenosis,ISR)成為了影響遠期生存率的一種主要并發癥[2]。有研究指出,新生內膜增生是ISR發生的主要病理改變[3],但針對支架內新生內膜增生治療并未達到預期的效果[4]。因此ISR分子發病機制及基因靶向治療需要繼續探索。本研究通過基因測序及高通量生物信息學分析的方法對PCI術后ISR的機制進行研究,以期尋找到ISR發病的核心基因及分子通路,為后續的血清學診療標志物及藥物治療靶點提供理論依據。
1.1 基因測序對象與分組 GEO數據庫搜索與PCI術后ISR相關的基因測序結果,選取GSE46560為研究對象(11例印度人樣本)。其中6例PCI術后ISR患者作為研究組,5例PCI術后支架內未狹窄的患者作為對照組。其中研究組男性5例,女性1例,平均年齡為(60.33±16.10)歲。對照組男性4例,女性1例,平均年齡為(60.40±10.53)歲。Trizol法提取全部患者空腹外周血RNA,然后檢測RNA的質量和純度,其中純度的檢測標準為1.8≤260/280≤2.1。將符合標準的RNA進行基因測序,測序結果詳見GEO數 據 庫(GSE46560,https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE46560)。
1.2 高通量生物信息分析方法 對基因測序的原始數據采用R語言及limma數據包進行均一化校準,刪除差異表達量過大或者過小的基因。其后應用GEO2R計算模塊篩選差異基因。對篩選的差異基因應用GraphPad Prism 7繪制火山圖進行可視化處理,其后應用基因熱圖在TBtools軟件進行聚類分析。將全部差異基因應用DAVID在線軟件進行基因符號轉換及KEGG信號通路的預測。全部差異表達基因符號輸入蛋白互作網絡(PPI)在線分析軟件,進行基因互作關系預測,并將預測結果輸入Cyto‐scape軟件進行可視化處理。對全部差異基因間的互作關系進一步生物信息學分析,應用cytohubba軟件(Cytoscape內置應用)預測核心發病基因,對排名前10位的發病基因再次進行聚類分析,根據Degree評分篩選出分數最高的基因。
1.3 統計學方法 所有原始數據用R語言軟件進行分析。差異基因篩選標準位差異倍數≥2以及P<0.05為差異有統計學意義。KEGG信號通路富集基因最少為2且P<0.05。PPI篩選標準為基因間聯系>0.4。
2.1 基因測序原始數據矯正 對總共49395個編碼基因進行檢測,原始數據結果均一性較差(圖1A)。隨后應用R語言及limma包進行數據均一化處理,篩除離散度較大的數據,校準后的數據均一性較好(圖1B)。

圖1 基因芯片原始數據分析Fig.1 Analysis of microarray raw data
2.2 GEO2R篩選均一化處理后的數據 其中差異上調表達的基因96個,差異下調表達的基因184個,對全部基因進行可視化后的火山圖見圖2A。將差異表達的基因進行聚類分析,結果顯示差異基因數據源間具有相似性(圖2B)。

圖2 差異基因聚類分析Fig.2 Cluster analysis of differential genes
2.3 差異表達基因信號通路分析 為了方便差異基因的生物信息學分析,使用DAVID在線數據庫將全部差異基因成功轉換為基因符號。將280個差異表達的基因符號進行KEGG信號通路聚類分析,發現hsa04142:溶酶體為富集程度最高的信號通路(圖2C、表1)。
表1 KEGG信號通路聚類分析(±s,n=280)Tab.1 Clustering analysis of KEGG signaling pathway(±s,n=280)

表1 KEGG信號通路聚類分析(±s,n=280)Tab.1 Clustering analysis of KEGG signaling pathway(±s,n=280)
Term hsa04142:Lysosome hsa05152:Tuberculosis hsa04145:Phagosome hsa04380:Osteoclast differentiation hsa05322:Systemic lupus erythematosus hsa04650:Natural killer cell mediated cytotoxicity Count 9109887%0.0230.0250.0230.0200.0200.018P value 0.00360.01120.01260.01900.02100.0410 Genes LAMP2,CLTA,CTSZ,LAPTM4A,AP1G1,CTSC,ATP6V0D1,ATP6V0B,AP3B1 BID,LAMP2,IL10RB,TLR1,PPP3R1,HLA-DPB1,FCGR3A,ATP6V0D1,FCGR3B,ATP6V0B LAMP2,NCF2,TUBB2A,ATP6V1B2,HLA-DPB1,FCGR3A,ATP6V0D1,FCGR3B,ATP6V0B IL1R1,LILRA2,NCF2,LILRA5,PPP3R1,FCGR3A,SIRPA,FCGR3B HLA-DPB1,FCGR3A,HIST1H3F,FCGR3B,HIST1H3G,H2AFB3,H2AFB2,H2AFB1 BID,CD48,TNFRSF10B,PPP3R1,PAK1,FCGR3A,FCGR3B
2.4 核心發病基因預測 將280個差異表達的基因輸入STRING在線軟件進行PPI互作網絡分析,結果顯示共有262個基因之間具有相互聯系,聯系線為344條,平 均 評 分 為2.63,PPI富 集P值 為9.84e?05。將PPI互作關系信息應用Cytoscape進行可視化處理。進一步計算全部PPI信息數據后,cy‐tohubba顯示排名前10為的發病基因為HCK(14分)、STAT5A(11分)、CAT(11分)、CXCR1(10分)、ARRB2(10分)、CD300A(10分)、MCM2(9分)、OPRL1(9分)、TLR1(9分)、PINK1(8分),見圖3A。對10個發病基因進行聚類分析后顯示差異基因數據源間具有相似性(圖3B)。綜上分析,HCK為PCI術后ISR發病核心基因。

圖3 核心發病基因預測Fig.3 Prediction of hub genes
PCI已經成為治療缺血性心臟病的一種主要手段[2]。臨床實踐證明藥物洗脫支架(DES)能夠明顯減少裸金屬支架的ISR發生率[5],因此DES被迅速和廣泛地應用于PCI治療。然而DES晚期ISR仍然是一個嚴重的問題,其發生率約為3%~20%[6]。ISR的發生與支架類型、位置、患者合并癥及病變復雜性(即病變長度、血管大小和分叉病變)等均相關[7]。其主要由侵襲性內膜增生和新動脈粥樣硬化形成引起[3]。有研究針對內膜增生進行干預,但結果不令人滿意。因此對于ISR形成的分子機制及相關信號通路仍需進一步探索。
二代測序的迅猛發展使得基因測序變得廉價、便捷,但二代測序過程中也會產生許多離散度較大的數據,如何能夠識別無用的數據,迅速鎖定核心發病基因是目前測序后研究的重點[8-9]。而生物信息學通過計算機軟件分析及計算可以實現大數據矯正及核心發病基因、核心發病通路的鎖定。本研究通過對ISR患者及PCI術后支架內未狹窄的患者進行基因測序發現,原始數據離散度較大。分析原因可能與入組患者年齡偏大,機體各臟器衰老有關,因此會出現許多與冠心病及ISR不相關的基因數據。此種情況一方面可以從基因校準前看出,另一方面,即使進行了基因數據均一化處理,聚類出溶酶體相關信號通路可能是ISR發病過程中的關鍵信號通路,但仍然會出現一些與冠心病無明顯關聯的基因及信號通路的富集。因此在應用R語言對數據進行矯正后,進一步對全部差異表達的基因進行PPI網絡分析,再次剔除18個可能和ISR無關的差異表達的基因。應用cytohubba從基因間的拓撲結構、基因點間的互作關系、關系的密切聯系等多維度進行計算后,最終鎖定HCK為ISR的核心發病基因。
HCK在調節先天免疫反應、吞噬、細胞存活和增殖、細胞黏附和遷移方面發揮重要作用[10]。此外HCK也被描述為巨噬細胞吞噬功能的關鍵調節因子[11]。雖然目前ISR具體的發病機制不明,但是HCK參與的免疫、吞噬、炎癥及細胞增殖和遷移似乎都能造成新生內膜的形成。其中HCK已被證明是中性粒細胞趨化因子信號的負調節因子,其低表達可促進局部炎癥反應的形成,進而激活內皮細胞增殖信號,很有可能導致支架內局部炎癥反應的過度激活,進而導致內皮增殖引起ISR[12]。而HCK的形成過程似乎也和溶酶體密切相關,從而參與細胞吞噬過程。在巨噬細胞吞噬體的成熟過程中,位于囊泡結構上的HCK在晚期內質體蛋白Lamp-1的作用下被募集到吞噬體膜上,通過對包含HCK的囊泡進行膜蛋白的檢測發現其陽性表達CD63而陰性表達M6PR,提示HCK存在于溶酶體囊泡中,并介導溶酶體的吞噬作用[13]。而溶酶體相關通路是本文通過KEGG篩選出的對差異表達基因富集最為明顯的信號通路,其在冠狀動脈粥樣斑塊的形成過程中起關鍵作用。既往研究指出冠心病和溶酶體酸脂酶活力低下有關,此酶是將膽固醇酯和甘油三酯水解成游離膽固醇、甘油和游離脂肪酸的關鍵溶酶體酶,可防止脂質在各種組織和細胞中積聚[14]。而酶體酶又可通過降解IL-1、IL-8、TNF-α來調控炎癥以及免疫反應[15]。
綜上,本文通過對ISR患者基因測序及生物信息學分析,鎖定HCK為PCI術后ISR發生的關鍵基因,而溶酶體介導的相關通路為ISR發病過程中關鍵的信號通路改變。這是首次通過生物信息學分析的方法推測出來的ISR核心發病基因和關鍵信號通路,針對HCK及溶酶體通路的干預可能成為未來ISR的基因靶向治療及血清學診斷標志物。