劉靜,張蕾,趙志剛,陳瑞玲,劉騰,余克富,朱斌
(1.首都醫科大學 附屬北京天壇醫院,北京 100050;2.首都醫科大學 附屬北京世紀壇醫院,北京 100038)
?
·論 著·
基于表達譜芯片數據的阿爾茨海默病易感基因的生物信息學數據挖掘
劉靜1,張蕾2,趙志剛1,陳瑞玲1,劉騰1,余克富1,朱斌1
(1.首都醫科大學 附屬北京天壇醫院,北京 100050;2.首都醫科大學 附屬北京世紀壇醫院,北京 100038)
目的:采用生物信息學對阿爾茨海默病(AD)表達譜芯片結果進行數據挖掘,尋找影響AD發病的差異表達基因,為AD的前期有效預防提供一定的基礎。方法:從GEO數據庫中下載符合條件的表達譜芯片研究結果,通過Expression Console對數據進行標準化處理后,導入Transcriptome Analysis Console進行數據分析比較。將得到的數據導入在線分析工具DAVID、ToppGene、STRING中對差異表達基因進行篩選,同時進行GO分析及Pathway分析。結果:本次研究共納入3項以人腦海馬組織為樣本的獨立實驗。24個差異表達基因中上調的基因共有18個,下調基因6個。NEFM和SV2B基因與神經突觸信號傳導關系密切,與AD的發病有一定的聯系。結論:AD的發病可能與NEFM和SV2B基因密切相關,尚需具體實驗進行更深一步研究。
阿爾茨海默病;生物信息;表達譜芯片;基因
阿爾茨海默病(Alzheimer’s disease,AD)是嚴重影響老年人生活質量的危險疾病之一[1-2]。AD的發病機制很復雜,呈現多樣性和不確定性,臨床診斷的AD患者多已處于中晚期,現有治療均難以取得滿意療效[3]。自1906年11月德國病理學和精神病學醫師Alois Alzheimer首次報道1例老年性癡呆病例起,已有100多年的時間,在此期間各國學者在多個領域從不同角度開展對AD的研究,試圖揭示其發生發展的病理機制,但因病因不明和早期診斷困難,再加上缺乏有效的治療藥物,給診斷、預防和治療帶來了難以克服的困難[4]。本研究擬通過對美國國家生物信息中心(NCBI)數據庫中的表達譜芯片原始數據進行數據挖掘,從而篩選到AD發病的易感基因,為AD的早期預防和診斷提供可參考的標志物。
1.1 原始研究資料
數據來自所有采用美國Affymetrix公司表達譜芯片且其比較了患病和未患病患者的原始芯片研究結果(CEL文件)。具體方法如下:通過NCBI的GEO數據庫(http://www.ncbi.nlm.nih.gov/pubmed/),以“Alzheimer”“Hippocampus”“Homo sapiens”為檢索詞,查找所有符合條件的研究結果。
1.2 數據處理及差異基因分析
將3項研究的結果分別導入Expression Console(Affymetrix)軟件,采用RMA法和MAS 5對數據進行歸一化處理,同時對芯片探針信號強度及芯片質量進行分析。完成上述分析后,將所得到3項CHP文件導入到Transcriptome Analysis Console(TAC)中,基因表達數據缺失數不超過50%,對通過過濾標準的基因進行非配對樣本t檢驗。根據設定的篩選標準:fold change<-1.5或者fold change>1.5,且P值小于0.05,篩選得到每個數據集的差異基因。利用在線分析網站(http://bioinfogp.cnb.csic.es/tools/venny/index.html)制作Venn圖得到3張芯片的共有差異基因。
1.3 差異基因的GO分析和通路分析
將所篩選到的共有差異基因分別上傳至the Database for Annotation,Visualization and Integrated Discovery(DAVID)生物信息數據庫中,對這些差異基因分別進行生物學過程、分子功能、生物學通路分析。利用ToppGene(http://topp.gene.cchmc.org/)在線工具對差異表達基因進行共表達分析。
1.4 差異基因編碼蛋白的相互作用分析
將得到的差異基因上傳至蛋白質相互作用關系數據庫(Functional Protein Association Networks,STRING),通過STRINQ分析工具,分析其所編碼的蛋白之間的相互作用圖,找出處在關鍵節點的蛋白質。
2.1 納入分析的基因芯片數據一般情況
通過橫向比較篩選,我們共得到3項研究符合本此研究條件的研究(表1)。3項研究均采用AD患者和非AD患者進行比較,其中第1個研究共納入17例樣本(AD患者7例,非AD患者10例);第2個研究共納入20例樣本(AD患者10例,非AD患者10例);第3個研究共納入24例樣本(AD患者15例,非AD患者9例)。
表1 前期研究所納入的3項研究
Tab 1 The studies which included in the research

研究研究者取樣組織檢測平臺芯片類型芯片型號第1個研究YusakuNakabeppuHippocampusHomosapiensGPL6244AffymetrixHumanGene1.0STArrayGSE36980第2個研究WinnieLiangHippocampusHomosapiensGPL570AffymetrixHumanGenomeU133Plus2.0ArrayGSE4757第3個研究EricMBlalockHippocampusHomosapiensGPL96AffymetrixHumanGenomeU133AArrayGSE1297
2.2 差異基因篩選
通過分析,我們獲得3項獨立研究中均出現明顯表達的差異基因共24個(圖1、表2)。其中上調的基因共有18個,下調基因6個。

圖1 所納入的3項獨立研究篩選得到的差異基因
Fig 1 The Venn diagram of the differently expressed genes
2.3 差異基因的GO富集分析和通路分析
差異基因所涉及到的基因功能主要與神經細胞、神經突觸及細胞骨架相關的功能相關。在本研究中的24個基因中與神經突觸功能相關的基因約有9個基因,分別為ATP2B1、SLC12A5、NEFM、SLC17A7、GABBR2、WASF1、SV2B、NEEFM及GABBR2。通過ToppGene在線工具進一步的分析,我們最終確定了NEFM和SV2B為神經信號轉到通路上的關鍵基因。見圖2、表3。
2.4 NEFM和SV2B蛋白相互作用圖
通過STRING 10在線工具對最終篩選的差異基因進行蛋白質相互作用網絡分析,從圖3可以看出NEFM和SV2B蛋白與其他蛋白均存在≥5的相互作用關系,為此蛋白質相互作用網絡的中心節點,刪除這些節點蛋白后,網絡結構的穩定性降低。
表2 24個差異基因及其所在研究中的差異倍數變化
Tab 2 The fold changes of the 24 differently expressed genes

差異基因差異倍數(研究1)差異倍數(研究2)差異倍數(研究3)HOPX1.741.721.55MAN1A11.761.851.74ENC11.811.811.95SLC17A71.561.761.61GABBR21.571.81.67CAP21.521.811.59OXCT11.591.811.61SV2B2.011.521.81WIF12.661.543.98ANGPT1-1.51-1.67-1.66AEBP1-1.87-1.87-2.63RGS42.431.512.16LMO41.562.221.82WASF11.711.631.74SCN3B1.781.651.79SLC12A51.581.561.6MYO161.541.672.27NEFM1.681.522.11APLNR-1.95-2.33-3.01GPR221.623.612.43AHNAK-1.53-4.83-1.51FLNC-1.81-1.54-1.75ATP2B11.521.641.56CP-1.73-1.95-1.83

圖2 GO分析網絡圖
Fig 2 The network diagram of GO analysis
阿爾茨海默病的發病機制目前仍不明確,其發病是多基因、多途徑、多步驟、多階段相互作用和相互影響的復雜過程。然而由于阿爾茨海默病患者的腦組織不易取得,這也嚴重阻礙了對該病的治療進展。為了更好地研究AD患者的發病機制,最直接的辦法就是以患病的組織為標本進行研究,然而這些標本的取得往往存在非常大的難度,因而也限制了對AD發病機制的深入研究。本次研究我們利用國外珍貴海馬組織芯片數據,一方面解決了課題研究過程中標本獲得困難的不足,另一方面通過對多項研究數據的橫向比較也可以更加行之有效地篩選出特異性的差異基因。
表3 24個差異基因GO分析
Tab 3 The GO analysis of the 24 genes
隨著基因芯片技術的不斷成熟,為高通量篩選疾病易感基因帶來了新的曙光。通過生物信息學進行信息挖掘,我們能夠多層次了解基因表達狀況,對基因功能富集分析、通路富集分析及網絡調控分析的探討有重要作用,因此該技術已經廣泛應用于疾病差異基因的篩選、疾病治療藥物的篩選以及疾病應用基因診斷和治療等方面[5]。通過生物信息學對阿爾茨海默病進行信息挖掘,能夠深層次了解相關基因表達狀況,對于疾病差異基因的篩選、治療藥物篩選以及早期標志物的發現,具有重大的現實意義。

圖3 NEFM和SV2B蛋白相互作用圖
Fig 3 The interaction of NEFM and SV2B
本研究共篩選到了與阿爾茨海默病發病相關的基因24個,涉及與神經生長、突觸連接、離子轉運、G蛋白偶聯等,其中每一項研究中fold change≥2或fold change≤-2的差異基因主要有SV2B、WIF1、AEBP1、RGS4、LMO4、MYO16、NEFM、APLNR、GPR22及AHNAK。同時,通過對GO分析得到的基因功能中與神經細胞相關的基因(dendrite membrane,synapse,neuron projection membrane,neuron part,synaptic vesicle membrane,neurofibrillary tangle,neuron projection)進行篩選,得到ATP2B1、SLC12A5、NEFM、SLC17A7、GABBR2、WASF1、SV2B、NEEFM、GABBR2等9個基因。將2次基因篩選得到的結果進行較分析,發現NEFM和SV2B在所納入的3項研究中其FDR值均≥2,且其基因功能均與神經細胞的生長發育密切相關。其中NEFM的基因功能與神經元信息傳遞、神經原纖維纏結關系緊密,而SV2B(突觸囊泡蛋白2B)與神經細胞信號轉到關系密切。由此我們推測在AD患者中NEFM和SV2B基因的突變可能與阿爾茨海默病的發展密切相關,但是其具體的作用機制目前還不清楚,文獻中也未見詳細報道,可以作為潛在的治療靶點,但尚需實驗進行證實。
[1] LLORET A,FUCHSBERGER T,GIRALDO E,et al.Molecular mechanisms linking amyloid beta toxicity and Tau hyperphosphorylation in Alzheimer’s Disease[J].Free Radic Biol Med,2015,83:186-191.
[2] MAYEUX R.Early Alzheimer’s disease[J].N Engl J Med,2010,362(23):2194-201.
[3] 高天麗,陳克平.阿爾茨海默病的常見診斷方法[J].現代醫學,2016,44(3):415-419.
[4] KUMAR A,SINGH A,EKAVAL I.A review on Alzheimer’s disease pathophysiology and its management:an update[J].Pharmacol Rep,2015,67(2):195-203.
[5] 李鐵求,楊宇,李琦,等.前列腺癌轉移相關基因的生物信息學分析[J].實用醫學雜志,2013,29(21):3481-3485.
Bioinformatics data mining of Alzheimer’s disease susceptible genes based on the data of expression profile chip
LIU Jing1,ZHANG Lei2,ZHAO Zhi-gang1,CHEN Rui-ling1,LIU Teng1,YU Ke-fu1,ZHU Bin1
(1.BeijingTiantanHospital,CapitalMedicalUniversity,Beijing100050,China;2.BeijingShijitanHospital,CapitalMedicalUniversity,Beijing100038,China)
Objective: To analyze the expression information of three independent researches to explore differential genes in the progress of alzheimer disease(AD)and providing a basis for the AD prevention.Methods: Raw data were downloaded from NCBI databases and imported to “Expression Console” to standardize the data and then the results were output to “Transcriptome Analysis Console” for data analysis.After that all different genes were imported to online analysis tools DAVID,ToppGene,STRING for further analyze.Results: The studies included in our research all used human brain hippocampus sample.Through further analysis,24 differentially expressed genes were analyzed,among which 18 genes were increased and 6 were down-regulated.Through further analysis,two genesNEFM and SV2B were found to be closely related to synapses signal transduction.Conclusion: The pathogenesis of AD may be closely related with NEFM and SV2B genes.Nevertheless,specific experiment will be needed to verify the geness.
Alzheimer’s disease; biological information; expression profile chip; gene
2016-05-18
2016-07-06
國家自然科學基金青年基金資助項目(81402814)
劉靜(1975-),女,北京人,主管藥師。E-mail:liujing1366@sina.cn
朱斌 E-mail:zbtcm@163.com
劉靜,張蕾,趙志剛,等.基于表達譜芯片數據的阿爾茨海默病易感基因的生物信息學數據挖掘[J].東南大學學報:醫學版,2016,35(5):653-657.
R749.16; Q7
A
1671-6264(2016)05-0653-05
10.3969/j.issn.1671-6264.2016.05.002