朱虹穎, 王建波
外周動脈疾病(peripheral arterial disease,PAD)一般是指外周動脈,特別是下肢動脈進行性狹窄和阻塞,影響周圍組織供血,糖尿病、高血壓是PAD 的主要影響因素[1-3]。 為解決這種血管狹窄及閉塞,以球囊擴張和支架植入為主的血管介入是常見的治療手段[4-5]。 但介入治療后,通常會帶來血管內再狹窄的問題。Tsujimura 等[6]的研究顯示,453 例股腘部病變患者植入InnovaTM自膨脹鎳鈦諾支架后再狹窄率為36%。 再狹窄影響血運重建,并可導致不良血管事件發生[7-8]。
血管損傷后的新內膜增生是引起支架內再狹窄(in-stent restenosis,ISR)的原因之一[9-11]。 血管平滑肌細胞(vascular smooth muscle cells,VSMC)在機械損傷和炎癥的刺激下由收縮型向分泌型分化,成為引起內膜增生的主要成分,導致再狹窄。 大量外基質成分及細胞因子, 如血小板源性生長因子(platelet derived growth factor,PDGF)的合成分泌,促進VSMC 增殖并向內遷移;同時,炎癥細胞,如單核細胞和巨噬細胞粘附并滲入損傷血管壁,刺激細胞外基質重塑,進一步促進內膜增生[12-14]。 因此,抑制VSMC過度增殖和遷移有助于預防內膜增生和再狹窄。
基于數據分析工具對相關數據進行挖掘是探索相關疾病關鍵基因的一種重要手段。 通過微陣列技術, 監測再狹窄與健康對照之間全基因組表達,鑒定可能參與這種復雜病理狀況的上調和下調基因簇, 從而得到不同亞組之間的差異表達基因(differentially expressed genes,DEG)[15]。加權基因共表達網絡分析(weighted gene co-expression network analysis,WGCNA)是一種拓撲網絡分析,可以建立基因模塊與臨床性狀之間的聯系,用于后續的分析和實驗[16]。 遺傳因素是ISR 發展過程中的一個重要因素, 基于基因表達綜合公共數據庫(gene expression omnibus,GEO),采用生物信息學分析方法探索ISR差異表達基因,有望為ISR 的發病機制及治療提供一種新思路。
A7r5 細胞(大鼠胸主動脈血管平滑肌細胞)購自中國科學院細胞資源數據庫(上海),10%血清(Gibco,美國)的DMEM 培養基,于37℃、體積分數為0.05 的CO2細胞培養箱中培養。
GSE46560 數 據 集 從GEO 數 據 庫(http://www.ncbi.nlm.nih.gov/geo)中獲取。 基于GPL15207 平臺,對冠狀動脈內支架再狹窄的全血基因表達譜進行分析。 應用R 語言對原始數據進行基因注釋,并使用affy 包進行校準歸一化處理。
通過R 語言中的limma 包識別GSE46560 數據集中ISR 患者和對照組之間的DEG,設置篩選條件為P<0.05,且|log2FC|>1。ggplot2 包用于繪制DEG的火山圖,Pheatmap 包用于構建DEG 的熱圖。 上調和下調的基因在數據集中按log2FC 排序。通過veen圖鑒定WGCNA 和DEG 的共 同基因(https://www.omicstudio.cn/tool)。
利用R 語言WGCNA 包構建基因共表達網絡,分析基因網絡與生物性狀的相關性。 使用Hclust 函數去除GSE46560 數據集中的異常值, 根據選擇的軟閾值修改相鄰矩陣, 得到拓撲重疊矩陣(topological overlap matrix,TOM) 及其相異度度量(1-TOM)。 以150 為模塊最小基因數,生成模塊識別的層次聚類樹。 計算模塊特征基因以及模塊特征基因與臨床特征的相關性, 得到各模塊的表達譜,繪制熱圖以可視化。 利用Pearson 相關系數和各模塊特征基因與疾病性狀P 值, 進一步確定模塊與ISR 之間的相關性。 將基因表達譜與模塊特征基因(module eigengenes,Mes)的相關性定義為模塊成員(module membership,MM),并將外部特征與基因表達譜之間的相關性(絕對值)定義為基因顯著性(gene significance,GS), 對具有最高MM 值和最高GS 值的基因進一步分析。
GO 功能分析包括細胞成分(cellular component,CC),分子功能(molecular function,MF),生物途徑(biological process,BP)。 KEGG 通路富集分析用于系統分析基因產物在細胞中的代謝途徑以及這些基因產物的功能。將GSE46560 中DEG 與藍色模塊交集基因提交至NetworkAnalyst3.0[17],分析其生物學 意 義 及 途 徑, 并 進 行 可 視 化(https://www.bioinformatics.com.cn)。
PPI 網絡作為生物信息學的主要方法,可以綜合分析生物體內多種蛋白質的關系和功能。 使用string數據庫(STRING,version 11.5,http://string-db.org/),設置最低交互分數為0.400,對DEG 與WGCNA 交互數據預測PPI 網絡, 并通過Cytoscape 軟件對其進行優化。CytoHubba 是Cytoscape 的一個插件,選擇5 種算法(MCC、EPC、Closeness、Betweenness、BottleNeck)對每個節點基因進行評分, 每種算法的前10 個樞紐基因用于選樞紐基因。 MCODE 插件用于基因網絡聚類分析,以映射關鍵模塊,選擇得分最高的一組,識別重要相互作用基因。
將VSMC 在6 孔板中培養至80%匯合,饑餓24 h后,用PDGF-BB 處理。 處理24 h 后,使用RIPA 裂解液提取細胞總蛋白,利用BCA 蛋白質濃度測定試劑盒(Beyotime 生物技術研究所,上海)測定蛋白質濃度。 通過SDS-PAGE 電泳分離總蛋白, 轉印至PVDF 膜,用5%的脫脂奶粉封閉1 h。 孵育ITPK1、MCM2、RAD52(1∶1 000,Abclonal)、GAPDH(1∶20 000,Proteintech)4℃過夜,TBST 清洗后,室溫下孵育二抗(1∶1 000,Beyotime,Rabbit)1 h。 使用高敏型化學發光素試劑盒可視化蛋白條帶。
運用R 中的limma 包對GSE46560 數據集進行分析, 在GSE46560 中篩選出了243 個DEG(P<0.05,|log2FC|>1), 其中包括109 個表達上調基因,134 個表達下調基因。 DEG 的結果可視化為火山圖(圖1①),前100 個DEG 顯示在熱圖中(圖1②)。

圖1 差異表達基因
對GSE46560 數據集數據進行標準化處理后進行樣本聚類分析,無異常值。 當R2>0.8 時,軟閾值選擇為13(圖2①)。 設置最小模塊為150 時,通過平均層次聚類和動態樹裁剪構建了12 個基因共表達模塊。grey 模塊代表未分類在其他模塊中的基因,blue 模塊與ISR 具有高度相關性(r=0.63,P=0.039)(圖2③)。 通過檢查基因模塊與臨床特征之間的相關性,確定了與ISR 最相關的基因模塊。 將獲得的DEG 基因與blue 模塊的基因取交集,鑒定出108 個差異基因(圖2④)。

圖2 WGCNA 的結果
圖3 ①顯示了藍色模塊的散點圖, 表明WGCNA 藍色模塊的基因與再狹窄呈現出顯著相關性(cor=0.37,P=6.8e-96),以MM>0.85,GS>0.85 為篩選標準,篩選藍色模塊中性狀模塊基因。 與DEG基因交互后,得到ITPK1 重疊基因。 選擇400 個基因繪制網絡熱圖(圖3②),顏色深淺顯示模塊基因之間相互作用程度。 對顏色模塊進行聚類分析,brown、green、yellow、blue、greenyellow 模塊之間具有強相關性,再狹窄與這些模塊之間均顯示出相關性(圖3③)。

圖3 基于GSE46560 數據集構建的共表達網絡
通過NetworkAnalyst 對108 個基因進行功能富集分析。 其生物學過程主要與蛋白磷酸化、細胞周期停滯、傷口愈合、信號轉導負調節、細胞增殖等有關。對于細胞成分,DEG 主要富集于核質、轉錄因子復合物、細胞器腔、胞質等。 分子功能分析發現,前10 條包括5 個蛋白質相關條目(圖4①)。 進一步KEGG 通路分析顯示,交集基因在細胞周期、細胞衰老、HTLV-I 感染、TGF-β 信號通路以及Fcε RI 信號通路等顯著富集(圖4②)。

圖4 GO 和KEGG 的功能和通路分析
通過string 數據庫在重疊的108 個基因之間構建PPI 網絡,將獨立于相互作用網絡的蛋白質刪除,保留與其他蛋白質存在更多相互作用的蛋白,使用Cytoscape 軟件對PPI 網絡進行可視化(圖5①)。 在CytoHubba 中,使用5 種算法MCC、EPC、Closeness、Betweenness、BottleNeck 識別PPI 中的hub 基因,選擇每種算法排序的前10 個基因進行交互測試,得到4 個hub 基因(MCM2、RAD52、APOA1、CARM1)(圖5②)。 基于交互對數和交互強度,使用MCODE進行聚類以構建子網絡。

圖5 PPI 網絡構建與關鍵基因篩選
MCODE 得分最高的中心基因與CytoHubba 篩選出的基因相交產生2 個關鍵基因:MCM2、RAD52(圖5③)。 ITPK1 在藍色模塊中與再狹窄性狀高度相關, 且與此模塊顯著相關。 MCM2、RAD52 在GSE46560 中上調,ITPK1 顯示為下調。為確認這3 個基因的表達水平, 用PDGF-BB 處理VSMC 后,提取總蛋白結果顯示,ITPK1、MCM2 和RAD52 基因與預測結果一致(圖6)。 這3 個基因的異常表達可能與ISR 的發病機制和進展相關。

圖6 相關基因表達水平
血管損傷后引起的內膜增生是血管再狹窄的原因之一,其中涉及到炎癥、局部血栓的形成以及血管重塑等。 由于血管損傷后產生大量PDGF 及血管內皮生長因子(vascular endothelial growth factor,VEGF)等生長因子,促進VSMC 增殖。因此,實驗中選擇PDGF-BB 作為建立細胞模型激動劑。Wang 等[9]研究的一種外層含有VEGF 質粒,內層為紫杉醇的納米顆粒支架, 通過順序釋放VEGF 基因和紫杉醇,不僅抑制VSMC 增殖,也促進早期內皮愈合,抑制ISR 產生。 表明通過標志基因表達可以在分子水平預防再狹窄。
本研究中,在ISR 患者和健康對照組之間篩選出243 個差異表達基因,其中包括109 個上調基因和134 個下調基因。隨后,WGCNA 顯示藍色模塊與ISR 的分子機制有關。 在藍色模塊的2 935 個基因中,108 個基因為與DEG 的交集基因。 進一步設置MM>0.85,GS>0.85,篩選出ITPK1 基因。
研究發現,ITPK1 在神經管發育中起作用,與神經管缺陷有關,可在哺乳動物中形成更高磷酸化形式肌醇(IP6)的限速酶[18-19]。 其產生的高度磷酸化的肌醇磷酸鹽對于MLKL 介導的壞死性凋亡起重要作用;此外,ITPK1 通過干擾TNFRSF1A 相關死亡結構域的激活來修飾TNF-α 誘導的細胞凋亡[20-21]。ITPK1 的乙酰化降低其酶活性和蛋白質穩定性,并抑制肌醇信號通路中較高磷酸化形式的肌醇多磷酸鹽的合成,這種乙酰化可以被哺乳動物SIRT1 逆轉[22]。SIRT1 與VSMC 增殖密切相關。肌醇磷酸途徑中IP4 調節質膜Ca2+-Cl-通道,而Ca2+通道是控制動脈張力和病理血管重塑的重要膜蛋白,與動脈粥樣硬化斑塊和再狹窄有關[23-25]。
GO 富集顯示,基因富集于蛋白磷酸化、細胞周期調節和細胞增殖。 這些基因的KEGG 分析主要是細胞周期、細胞衰老、胰腺癌、HTLV-I 感染和TGFβ 信號通路。在Cytoscape 中,獲得2 個樞紐基因,即MCM2、RAD52。
既往研究表明,MCM2、RAD52 參與DNA 復制和修復。 MCM2 是DNA 復制起始的關鍵調節因子,隨 著 細 胞 周 期 進 展,MCM 與Cdc45、GINS 形 成CMG 復合物, 招募復制相關因子如PCNA 和DNA聚合酶,以啟動DNA 復制[26-27]。 RAD52 參與雙股斷裂修復。 通過促進互補單鏈DNA 的退火和刺激RAD51 重組酶, 在基因重組和DNA 修復中起核心作用[28]。Bang 等[29]的研究顯示,上調的RAD52 通過抑制堿性成纖維細胞生長因子(basic fibroblast growth factor,bFGF),誘導內皮細胞增殖、遷移,從而影響血管生成。 本研究表明,MCM2、RAD52 可能參與ISR 的 發 生 和 發 展,MCM2、RAD52 可 能 通 過 影 響DNA 復制,引起細胞過度增殖,最終導致ISR 發生。
通過對ISR 患者數據集進行分析, 能夠更好地識別候選生物標志物和治療靶點, 有助于全面地了解ISR。 使用蛋白質免疫印跡實驗驗證,獲得了與生物信息學分析一致的結果。然而,本實驗仍有一些不足,僅使用A7r5 大鼠胸主動脈細胞作了初步的驗證, 尚未在動物水平進行相應驗證;此外, 大鼠源細胞驗證不能完全代表人體情況,且ITPK1、MCM2 和RAD52 具體作用機制仍有待進一步探索。
綜上所述,通過整合DEG 和WGCNA 的結果,篩選出3 個基因:ITPK1、MCM2 和RAD52。 這些基因在細胞增殖、細胞周期途徑中顯著富集。 蛋白質免疫印跡實驗驗證,ITPK1、MCM2 和RAD52 可能是ISR 發生發展的關鍵基因。