侯玉麗, 王怡斐, 付靜軒, 王培昌
(1.首都醫科大學宣武醫院檢驗科 國家老年疾病臨床醫學研究中心,北京 100053;2.首都醫科大學臨床檢驗診斷學系,北京 100069)
阿爾茨海默病(Alzheimer's disease,AD)作為一種中樞神經系統退行性疾病,以失智、健忘和記憶力減退為主要臨床特征,嚴重威脅人類健康,給患者家庭和社會帶來極大的負擔[1]。據不完全統計,全球約有5 000萬例AD患者,2025年預計將達到1.3億例[2]。AD已成為人類第5大死因[3-4]。因此,研究AD的分子機制對于AD的干預具有重要意義。AD的病因復雜,目前主流的學說主要有Tau蛋白過度磷酸化假說、β-淀粉樣蛋白(amyloid beta-protein,Aβ)沉積假說、膽堿能假說、線粒體功能障礙與氧化應激假說等,其發病機制尚不清楚,可能是由多種發病因素、多種通路和分子機制的相互作用引起的[5],而基因的改變是AD發生的根本原因。近年來,越來越多的學者通過基因測序技術與生物信息學分析結合的方法,初步篩選與疾病發生發展相關的關鍵基因,為疾病的機制研究提供了新的靶標和思路。本研究擬通過GEO數據庫篩選出AD的差異表達基因,從中評選出關鍵基因并進行驗證,以期為AD的診斷和治療提供新的思路。
在GEO公共數據庫(http://www.ncbi.gov/geo)中以“Alzheimer's disease”及“Temporal cortex”作為關鍵詞,標本信息來源于人類的“Expression profiling by array”進行檢索,選擇AD患者腦組織數據集GSE118553作為分析數據集,GSE106241作為關鍵基因的驗證數據集。GSE118553數據集來源于GPL10558平臺,選取其中10名正常對照者的顳葉皮層組織和10例AD患者的顳葉皮層組織的基因表達信息;GSE106241數據集來源于GPL24170平臺,包括6名正常對照者和54例不同braak分級(braak 1級11例,braak 2級11例,braak 3級6例,braak 4級7例,braak 5級12例,braak 6級7例)AD患者顳葉皮層組織的基因表達信息及顳葉皮層組織中Aβ42的蛋白表達水平。
采用R語言軟件中的limma程序包對數據進行標準化處理,然后進行差異表達基因的篩選,以|log FC|>0.8和校正后P<0.05為判斷標準。
對差異表達基因進行基因本體(Gene Ontology,GO)富集分析(包括生物學進程、細胞組分和分子功能3個部分)、京都基因與基因組數據庫(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析。
采用STRING在線數據庫構建PPI網絡,篩選combined score>0.4的互作蛋白。將PPI結果導入Cytoscape軟件中,采用Cytohubba插件和MCC算法篩選評分居前10位的關鍵基因。
以GSE106241數據集作為驗證數據集,分析篩選出的10個關鍵基因在不同braak分級AD患者腦組織與正常對照者顳葉皮層組織中表達的差異及其與Aβ42表達的相關性。
采用Graphpad Prism 8.4軟件進行統計分析。采用R語言軟件中的ggplot和pheatmap程序包繪制差異表達基因的火山圖及熱圖,采用clusterProfiler程序包進行基因富集的分析及繪制。2個組之間比較采用Student t檢驗,多組間比較采用方差分析。采用Pearson相關分析評估關鍵基因與Aβ42的相關性。以P<0.05為差異有統計學意義。
從GSE118553數據集中篩選出157個差異表達的基因,其中表達上調88個、表達下調69個。采用pheatmap程序包繪制出|log FC|>0.8的前50個差異表達基因的表達熱圖。見圖1。

圖1 AD患者腦組織中差異表達基因的篩選
GO富集分析結果顯示,差異表達基因涉及的生物學進程主要為細胞外成分、血管生成、轉運途徑、神經遞質活動等;涉及的細胞成分主要為運輸囊泡、突觸膜、囊泡組分、突觸小泡等;涉及的分子功能主要為細胞外基質成分、門控離子通道、γ-氨基丁酸(gammaaminobutyric acid,GABA)受體活性和蛋白聚糖結合等。見圖2。

圖2 差異表達基因的GO富集分析
KEGG通路分析結果顯示,差異表達基因主要參與黏著斑形成、神經活性配體-受體相互作用、細胞外基質(extracellular matrix,ECM)受體、GABA能突觸和藥物成癮等通路。見圖3。

圖3 差異表達基因的KEGG通路分析
采用STRING在線數據庫構建157個差異表達基因的PPI網絡。在PPI網絡中篩選出的評分居前10位的關鍵基因分別為SNAP25、SYT1、GRIN2A、SLC12A5、GAD1、GABRG2、GABRD、PVALB、GABRB2和FN1。由于FN1與其他關鍵基因的關聯不密切,后續未對其進行驗證。見圖4。

圖4 差異表達基因編碼蛋白的PPI網絡及關鍵基因的篩選
在GSE106241數據集中,不同braak分級AD患者之間腦組織SNAP25、SYT1、GRIN2A、SLC12A5、GAD1、GABRG2、GABRD、PVALB和GABRB2表達差異均有統計學意義(P<0.05)。見圖5。

圖5 不同braak分級AD患者腦組織中關鍵基因表達的比較
Pearson相關分析結果顯示,SNAP25、SYT1、SLC12A5表達與Aβ42表達呈負相關(r值分別為-0.354、-0.283、-0.310,P<0.05),GRIN2A、GAD1、GABRG2、GABRD、PVALB、GABRB2與Aβ42表達無相關性(r值分別為-0.239、-0.257、-0.262、-0.260、-0.244、0.025,P>0.05)。
隨著生物信息學的發展,學者們對尋找各種疾病關鍵基因更加關注,關鍵基因信息的收集可為疾病的診斷和治療提供新的靶點和思路[6]。本研究利用基于GPL10558平臺的數據集GSE118553,對10例AD患者和10名正常對照者顳葉皮層組織中的基因表達數據進行分析,篩選出157個差異表達基因,其中表達上調88個、表達下調69個。對差異表達基因的功能富集分析結果顯示,神經遞質活動、囊泡運輸、突觸小泡和GABA受體的改變可能參與了AD的發病過程。本研究采用Cytoscape軟件分析了差異表達基因間的相互聯系,篩選出了與AD相關的10個關鍵基因(SNAP25、SYT1、GRIN2A、SLC12A5、GAD1、GABRG2、GABRD、PVALB、GABRB2和FN1)。這10個關鍵基因的功能與突觸傳遞、GABA信號通路、神經系統發育、鈣離子通道和癲癇等相關[7-10]。采用GSE106241數據集進行驗證,結果顯示,不同braak分級的AD患者之間腦組織SNAP25、SYT1、GRIN2A、SLC12A5、GAD1、GABRG2、GABRD、PVALB和GABRB2表達差異均有統計學意義(P<0.05),SNAP25、SYT1、SLC12A5表達與Aβ42表達呈負相關(r值分別為-0.354、-0.283、-0.310,P<0.05)。提示SNAP25、SYT1和SLC12A5基因表達與AD的發病顯著相關,值得進行深入研究。
SNAP25基因定位于人染色體20p12.2,編碼的蛋白質主要參與神經遞質釋放活動。有研究發現,SNAP25基因與AD和帕金森病的發生、發展有關[7]。有研究結果顯示,AD患者腦脊液和外泌體中的SNAP25蛋白表達均降低,且可在患者未發生認知障礙時對AD進行早期診斷[8],與本研究結果一致。提示SNAP25在AD的發生、發展中有重要作用。SNAP25 rs363050基因多態性與AD患者的認知功能下降和腦萎縮,以及意識恢復相關[9],但關于SNAP25基因在AD致病機制中的作用尚不明確。
SYT1是突觸結合蛋白家族的成員,在前腦、中腦,以及大多數腦干和脊髓神經元中表達[10]。SYT1作為突觸小泡膜表面的Ca2+傳感器,在胞吞胞吐和囊泡轉運中發揮至關重要的作用[11]。SYT1表達與學習和記憶能力呈正相關(r=0.852,P<0.001),與焦慮和運動活動呈負相關[12]。有研究發現,SYT1介導的突觸功能與AD患者的記憶缺陷有關[13],腦脊液中SYT1表達水平可作為AD的診斷標志物[14]。本研究結果顯示,AD患者顳葉皮層組織中SYT1表達下調,且在不同braak分級患者之間有明顯差異;另外,SYT1表達與Aβ42表達呈負相關(r=-0.283,P<0.05)。提示SYT1或可作為AD診斷的新靶點。
SLC12A5是溶質載體(solute carrier,SLC)家族中的一員。SLC家族是目前發現的最大的跨膜轉運蛋白家族,在各種物質跨膜轉運中發揮著極其關鍵的作用。SLC12A5作為膜轉運蛋白,負責維持成熟神經元中的低氯水平,使GABA受體去極化,維持神經元的正常功能[15-16]。本研究結果顯示,AD患者顳葉皮層組織中SLC12A5表達下調,且在不同braak分級患者之間有明顯差異;另外,SLC12A5表達與Aβ42表達呈負相關(r=-0.310,P<0.05),提示SLC12A5與AD密切相關。
綜上所述,本研究利用GEO數據庫篩選出3個與AD密切相關的基因(SNAP25、SYT1和SLC12A5),對其進行深入研究可能有助于進一步闡釋AD發生、發展的機制。但本研究尚缺少基礎研究數據的驗證,因此后續將繼續收集臨床樣本,對篩選出的3個關鍵基因進行深入研究。