亓志剛
頸動脈粥樣硬化(carotid atherosclerosis,CAS)是常見的慢性血管病,以CAS斑塊形成為主要病理學改變,不同程度地限制了頸動脈血流量[1]。據統計,美國20歲以上人群中,每年約有760萬人發生腦卒中,約有20%的腦卒中事件與CAS相關[2-3]。不穩定CAS斑塊是導致缺血性腦卒中的獨立危險因素[4]。當CAS斑塊出現脂質壞死、內出血等不穩定特征時,破裂并繼發血栓形成的風險增加[5]。CAS斑塊失穩、破裂的機制尚未完全明確。臨床上他汀類、抗血小板和血管緊張素轉換酶抑制劑等藥物的應用一定程度上穩定了CAS斑塊,但藥物的肝腎毒性和出血風險仍未得到控制[6]。挖掘CAS斑塊破裂的潛在機制對預防斑塊破裂相關動脈血栓形成和腦血管意外事件有重要意義。本研究利用生物信息學方法來挖掘CAS斑塊失穩破裂的核心基因,以期為CAS斑塊穩定性相關研究提供參考。
1.1 破裂CAS斑塊差異表達基因篩選 檢索美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)的基因表達綜合數據庫(Gene Expression Omnibus,GEO),獲取CAS基因表達芯片數據。下載GSE120521[7]和GSE41571[8]數據集篩選破裂CAS斑塊的差異表達基因;下載GSE28829[9]數據集篩選作為驗證集,篩選晚期CAS斑塊破裂的核心基因。GSE120521數據集包含4個穩定CAS斑塊和4個破裂CAS斑塊的基因表達數據,實驗平臺為GPL16791 Illumina HiSeq 2500(Homo sapiens)。GSE41571數據集包含6個穩定CAS斑塊和5個破裂CAS斑塊的基因表達數據,實驗平臺為GPL570 [HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array。GSE28829數據集包含13個CAS早期斑塊和16個CAS晚期斑塊的基因表達數據,實驗平臺為GPL570[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array。利用R語言軟件中的“limma”數據包對GSE120521和GSE41571數據集進行歸一化處理,以P<0.05、|fold change|≥2為條件進行差異表達基因篩選和聚類分析,使用“ggord”和“pheatmap”數據包將結果可視化。
1.2 LASSO回歸分析篩選破裂CAS斑塊潛在核心基因 使用R語言數據包“glmnet”對破裂CAS斑塊差異表達基因進行LASSO回歸分析。LASSO回歸方法通過縮小回歸系數,通過施加與其大小呈正比的懲罰,對破裂CAS斑塊差異表達基因進行次級選擇,篩選出破裂CAS斑塊潛在核心基因。
1.3 晚期CAS斑塊發生破裂的核心基因篩選利用R 語言軟件中的“limma”數據包提取GSE28829數據集中破裂CAS斑塊潛在核心基因的表達量,運用Wilcoxon非參數秩和檢驗的方法對CAS早期和晚期斑塊中破裂CAS斑塊潛在核心基因表達量的差異進行分析,篩選晚期CAS斑塊發生破裂的核心基因。
1.4 核心基因預測CAS斑塊破裂的效能驗證將歸一化的GSE120521和GSE41571數據集構建數據庫,繪制受試者工作特征曲線(receiver operator characteristic curve,ROC) 并計算曲線下面積(area under the curve,AUC)值,用于評價核心基因對CAS斑塊破裂的預測價值。
2.1 破裂CAS斑塊差異表達基因 經篩選,與穩定CAS斑塊相比,破裂CAS斑塊基因表達存在顯著差異。共篩選獲得171個差異基因,其中上調基因48個,下調基因123個。經批次效應去除、數據標準化和聚類分析,繪制數據標準化后箱線圖、主成分分析(principal component analysis,PCA)圖、差異基因表達火山圖和熱圖,見圖1。

圖1 破裂CAS 斑塊差異表達基因
2.2 破裂CAS斑塊潛在核心基因篩選 LASSO回歸篩選獲得18 個破裂CAS 斑塊潛在核心基因,其中表達上調基因10個,包括STX4、NCF4、PLAU、THBD、LCP1、GALNS、BHLHA15、SEMA3A、CXCL3和MZT2B,表達下調基因8個,包括EVA1C、LIAS、FIBIN、PNMA8A、IFI44、MFAP5、SAMD9L 和AKR1C3,見圖2。

圖2 LASSO回歸篩選破裂CAS 斑塊潛在核心基因
2.3 破裂CAS斑塊核心基因 經提取表達量和統計 分 析,STX4、PLAU、LCP1、CXCL3、NCF4、GALNS、SEMA3A 在GSE28829 數據集中均呈高表達;EVA1C、FIBIN、PNMA8A在GSE28829 數據集中均呈低表達;提示上述基因是晚期CAS斑塊發生破裂的核心基因,見圖3。

圖3 破裂CAS 斑塊核心基因篩選
2.4 核心基因預測CAS斑塊破裂的效能驗證ROC曲線分析結果顯示,表達上調的核心基因STX4、PLAU、LCP1、CXCL3、NCF4、GALNS、SEMA3A預測CAS 斑塊破裂曲線下面積分別為0.917、0.867、0.828、0.883、0.822、0.728、0.856;靈敏度分別為86.7%、86.7%、73.3%、73.3%、80.0%、80.0%、93.3%;特異度分別為91.7%、83.3%、83.3%、100.0%、75.0%、75.0%、75.0%;約登指數分別為0.783、0.700、0.567、0.733、0.550、0.550、0.683。表達下調的核心基因EVA1C、FIBIN、PNMA8A預測CAS斑塊破裂曲線下面積分別為0.900、0.911、0.756;靈敏度分別為86.7%、93.3%、93.3%;特異度分別為83.3%、91.7%、50.0%;約 登 指 數 分 別 為0.700、0.850、0.433,見圖4。

圖4 核心基因預測CAS 斑塊破裂的ROC曲線
續圖3 破裂CAS 斑塊核心基因篩選
動脈粥樣硬化發病機制涉及血管壁慢性炎性反應、脂質沉積、平滑肌細胞遷移等多種生物學過程,形成的動脈粥樣硬化斑塊可以導致管腔狹窄,限制靶器官的血流供應[10-11]。既往學者認為動脈粥樣硬化導致的缺血是誘發心腦血管意外的主要原因,隨著研究的深入,越來越多的證據表明,動脈粥樣硬化斑塊的穩定性與不良心腦血管事件密切相關[12-13]。不穩定斑塊是指有破裂傾向或易誘發血栓形成的斑塊,以纖維帽薄、脂質核心大、大量炎性細胞浸潤、斑塊內血管新生或出血為主要特點[14-15]。不穩定斑塊破裂及其誘發的動脈血栓是誘發心腦血管意外的重要因素[16]。
炎性反應貫穿動脈粥樣硬化的發病過程。單核細胞等炎性相關細胞通過腫瘤壞死因子α、白細胞介素-6等因子參與活性氧簇介導的細胞損傷,并向巨噬細胞轉化[17];斑塊內的巨噬細胞吞噬脂質,當脂質累積過多超過巨噬細胞的處理能力時,巨噬細胞泡沫化,形成泡沫細胞[18];斑塊內活化的炎癥細胞分泌基質金屬蛋白酶,降解細胞外基質和斑塊的纖維帽,降低斑塊的穩定性,增加其破裂的概率[19-20]。
隨著測序技術的發展,生物信息學在疾病機制研究中的應用愈加廣泛。生物信息學技術以現有的已完成的測序數據為基礎,利用R語言等程序軟件或網頁在線工具對數據進行二次分析,發掘差異基因的相互關系,探究疾病的潛在機制,有效縮短了研究前期思路的挖掘時間[21]。本研究通過對GSE120521和GSE41571數據集的數據進行篩選,得到破裂CAS斑塊相關的差異表達基因;利用LASSO回歸分析進一步篩選破裂CAS斑塊的潛在核心基因。提取GSE28829數據集中破裂CAS斑塊潛在核心基因的表達量并利用Wilcoxon非參數秩和檢驗等統計學方法進一步篩選差異表達基因,得到晚期CAS斑塊發生破裂的核心基因。經分析,得到表達上調的差異基因STX4、PLAU、LCP1、CXCL3、NCF4、GALNS、SEMA3A,表達下調的差異基因EVA1C、FIBIN、PNMA8A。上述基因AUC值均大于0.7,對CAS斑塊破裂有較好的預測價值。
尿激酶型纖溶酶原激活劑(urokinase-type plasminogen activator,PLAU)與動脈粥樣硬化的相關性已得到證實。研究表明,PLAU的表達水平與血管平滑肌細胞增殖和新生內膜形成有關[22]。Persson M等[23]研究發現,與沒有CAS斑塊的人相比,合并CAS斑塊的患者血清PLAU表達量顯著升高。Samman等[24]研究表明,外周動脈疾病患者血清PLAU表達水平顯著升高。
淋巴細胞胞漿蛋白1(lymphocyte cytoplasmic protein 1,LCP1)也稱L肌動蛋白絲束蛋白,是一種肌動蛋白結合蛋白,在細胞移行過程中發揮重要作用,是直接調控細胞運動的細胞骨架結合蛋白[25]。李挺等[26]研究發現,肌動蛋白骨架系統參與平滑肌細胞的遷移運動,二甲雙胍可以通過改變肌動蛋白骨架系統形態抑制小鼠主動脈平滑肌細胞的遷移,影響動脈粥樣硬化進程。
趨化因子可通過刺激平滑肌細胞轉換表型等多種途徑干預血管平滑肌細胞的增殖和遷移,參與動脈粥樣硬化發病[27]。LU等[28]研究證實,脂多糖或血小板衍生生長因子處理的小鼠血管平滑肌細胞內CXCL3、CXCL5和CXCL9等炎性趨化因子的表達水平顯著升高。
腦 信 號 蛋 白3A(Semaphorin3A,SEMA3A)是Sema家族成員,在腎、神經、骨骼和心血管系統中發揮關鍵的調節作用,SEMA3A可以抑制毛細血管生長,同時能與內皮細胞結合并抑制內皮細胞遷移[29]。王海芳等[30]研究表明,SEMA3A可以加重過氧化氫誘導的人臍靜脈內皮細胞損傷,促進炎性細胞的分泌。但也有研究表明,高血壓患者血清SEMA3A水平與頸動脈內膜中層厚度呈負相關[31]。SEMA3A與CAS的相關性有待進一步明確。
本研究也發現,表達上調的STX4、NCF4、GALNS和 表 達 下 調 的EVA1C、FIBIN、PNMA8A 與CAS斑塊破裂顯著相關,但上述基因與CAS的相關性尚未得到證實,這為我們下一步研究提供了新的方向。