胡黎丹 魏曉云 劉蜀東 李松 曾真 秦麗
(重慶市精神衛(wèi)生中心歌樂山院區(qū)綜合科,重慶 400036)
精神分裂癥是一種嚴重的神經(jīng)發(fā)育障礙慢性精神疾病,世界范圍人群發(fā)病率大約1%[1]。在青春期后期或成年早期容易出現(xiàn)明顯精神疾病癥狀,研究表明18歲之前出現(xiàn)的早發(fā)性精神分裂癥發(fā)病率大約0.03%[2]。高通量芯片在基因診斷等方面應(yīng)用廣泛,可以幫助我們在分子水平上識別潛在的生物標記,解釋其可能的發(fā)病機制,為精神分裂癥的高效診治提供理論基礎(chǔ)。本研究運用生物信息學(xué)技術(shù)對早發(fā)性精神分裂癥患者與健康人對照組基因芯片進行比較分析,挖掘顯著差異表達基因,并進行GO與pathway功能富集分析,構(gòu)建蛋白相互作用網(wǎng)絡(luò),研究相關(guān)基因功能與通路的變化,為該病的診斷和治療提供新的研究思路和理論依據(jù)。報告如下。
1.1數(shù)據(jù)下載與處理 NCBI網(wǎng)站GEO數(shù)據(jù)庫下載GSE54913,該數(shù)據(jù)來源于無錫精神衛(wèi)生中心基于GPL15314平臺(Agilent_033010探針版本)的研究早發(fā)性精神分裂癥基因芯片捕獲數(shù)據(jù),包含來自中國北方漢族12個健康人對照組與18個早發(fā)性精神分裂癥患者,抽取外周血,分離獲取單核細胞,提取RNA,并進行質(zhì)控,實驗方法參考已文獻[3]。表1為所有分析樣本數(shù)據(jù)臨床特征。根據(jù)GPL15314芯片平臺注釋信息將探針表達數(shù)據(jù)轉(zhuǎn)換為基因名,對于一個基因有多個探針,取平均值作為該基因表達量,最終獲得基因表達矩陣數(shù)據(jù)。

表1 GEO數(shù)據(jù)精神分裂癥臨床樣本特征
1.2差異表達基因 差異表達基因分析使用R軟件包limma[4],定義差異表達基因篩選標準為2倍以上表達差異,并且P<0.05為差異有統(tǒng)計學(xué)意義。
1.3GO和Pathway功能富集分析 GO數(shù)據(jù)庫包含分子功能、細胞組分、生物過程三大本體,KEGG是有關(guān)Pathway的主要公共數(shù)據(jù)庫。GO與KEGG通路富集分析被頻繁用來研究差異表達基因功能,目前有很多成熟的軟件可以使用[5],其中DAVID是一款廣泛應(yīng)用的在線免費基因功能注釋,可視化,數(shù)據(jù)整合分析的軟件,在本研究中我們使用DAVIDV6.8進行差異表達基因GO和pathway功能富集[6],篩選P值小于0.05為顯著富集的GO條目與KEGG 通路。
1.4蛋白網(wǎng)絡(luò)互作分析 我們進一步挖掘顯著差異基因中有互作關(guān)系的核心基因,我們使用在線STRING數(shù)據(jù)庫分析差異基因?qū)?yīng)的的編碼蛋白相互作用關(guān)系[7],篩選綜合得分0.4(滿分1)以上的基因構(gòu)建蛋白相互作用網(wǎng)絡(luò),構(gòu)建的蛋白互作網(wǎng)絡(luò)導(dǎo)入軟件Cytoscape(V3.6.1)進行網(wǎng)絡(luò)分析,選擇連接度最大的前5個節(jié)點作為表達調(diào)控的核心基因。之后利用Cytoscape插件MCODE工具分析蛋白質(zhì)互作網(wǎng)絡(luò)中相關(guān)模塊,篩選MCODE得分大于3,并且節(jié)點數(shù)大于4的網(wǎng)絡(luò)模塊分析基因富集的功能。
2.1數(shù)據(jù)處理 基于基因表達芯片平臺GPL15314注釋信息,總共17 199 mRNA探針被鑒定到,轉(zhuǎn)換為基因名,對于一個基因有多個探針,取平均值作為該基因表達量,最終得到13 124基因表達數(shù)據(jù)信息。
2.2差異表達基因分析 早發(fā)性精神分裂癥與健康人對照組基因表達數(shù)據(jù)比較,根據(jù)定義的顯著差異表達基因閾值,共檢測到314個顯著差異表達基因,其中221個基因表達顯著上調(diào),93個基因發(fā)生顯著下調(diào)表達,表2列出了調(diào)控最顯著的20個差異表達基因。

表2 早發(fā)性精神分裂癥顯著差異表達基因top20
2.3GO功能富集 將篩選到的顯著差異表達基因按照上調(diào)與下調(diào)模式通過在線工具DAVID進行富集分析,得到有代表性的GO富集條目與KEGG通路,GO功能富集結(jié)果顯示,共153個差異表達顯著上調(diào)基因映射到60個GO條目,P<0.05作為顯著富集標準,篩選到20個顯著富集GO。上調(diào)表達基因與下調(diào)表達差異顯著基因分別富集到GO數(shù)據(jù)庫的生物過程,細胞組分,分子功能三大本體各條目結(jié)果如表3。

表3 早發(fā)性精神分裂癥中顯著差異表達基因GO富集結(jié)果
2.4Pathway通路分析 通過DAVID工具獲得顯著上調(diào)與下調(diào)基因所在的KEGG通路。上調(diào)的差異基因富集到2個通路,顯著富集通路只有嗅覺信號傳導(dǎo),下調(diào)的基因共富集到7個通路,其中上調(diào)控與下調(diào)控基因顯著富集共6個KEGG通路,結(jié)果如表4。

表4 精神分裂癥差異表達基因KEGG通路顯著富集
2.5蛋白質(zhì)相互作用網(wǎng)絡(luò)分析 使用在線STR-ING數(shù)據(jù)庫分析差異基因編碼蛋白相互作用關(guān)系,篩選出得分最高的前5位核心基因,分別是AKT1,PAICS,CXCL10,CHEK1,LATS2,其中AKT1相關(guān)節(jié)點數(shù)14個最多。使用Cytoscape的MCODE插件分析STRING數(shù)據(jù)庫得到的蛋白網(wǎng)絡(luò)中84個節(jié)點2316條關(guān)系,篩選出一個得分最高的模塊,該模塊基因包含SSTR4,P2RY4,CCNE1,MKI67,OPRL1,CXCL10,AKT1共7個,我們對該模塊的基因進行功能分析,結(jié)果顯示模塊中豐度最高的基因主要與神經(jīng)肽綁定(neuropeptide binding),刺激神經(jīng)組織配體受體交互信號通路(neuroactive ligand-receptor interaction)有關(guān)。
本文通過下載GEO數(shù)據(jù)庫早發(fā)性精神分裂癥和健康人對照樣本高通量基因表達芯片GSE54913數(shù)據(jù)進行生物信息分析,篩選到314個顯著差異表達基因,其中221個基因表達顯著上調(diào),93個基因發(fā)生顯著下調(diào)表達,其中4個基因ATP2B3,OPRL1,CLCN1,POU6F2與中樞神經(jīng)系統(tǒng)發(fā)育相關(guān),SSTR4,OPRL1,MC4R 3個基因與神經(jīng)肽連接有關(guān)。與健康人相比早發(fā)性精神分裂癥上調(diào)控表達的基因更多,且表達變化倍數(shù)更大,上調(diào)基因主要有PNMA2,TBX20,ERAS,PRICKLE2,SCAP,CTLA4等。CTLA4 基因編碼白細胞分化抗原,是T細胞上的一種跨膜受體,參與細胞毒性T淋巴細胞相關(guān)蛋白4通路調(diào)控,已有很多研究報道該基因在精神分裂癥中顯著上調(diào)表達[8,9],與我們的結(jié)果一致。
GO分析結(jié)果表明這些基因主要參與g蛋白偶聯(lián)受體信號通路,嗅覺感知,離子運輸調(diào)控,鈣離子通道調(diào)控激活,神經(jīng)肽綁定等。KEGG通路富集結(jié)果表明上調(diào)基因主要富集在嗅覺信號傳導(dǎo)通路,下調(diào)基因主要富集在醚脂類代謝,花生四烯酸代謝,甲狀腺激素合成以及長期抑制(LTD)通路等。有趣的是上調(diào)基因顯著富集在嗅覺信號傳導(dǎo)通路,已有很多研究報道精神分裂癥患者嗅覺系統(tǒng)損傷[10],與我們資料的嗅覺基因表達失調(diào)結(jié)果吻合。另外下調(diào)表達基因顯著富集長期抑制通路,可能會導(dǎo)致釋放神經(jīng)遞質(zhì)減少,神經(jīng)突觸持續(xù)效率功能依賴性降低。
核心基因與大多數(shù)基因有相互作用關(guān)系,我們通過蛋白互作網(wǎng)絡(luò)分析篩選到得分最高的核心基因AKT1,該基因位于染色體14q32.33區(qū)域,是抗精神病藥氯氮平等情緒穩(wěn)定劑的作用靶點[11],很多研究報道該基因在精神分裂癥存在變異與表達異常,在腦組織中也存在該基因的異常表達,本研究發(fā)現(xiàn)AKT1在精神分裂癥患者外周血中表達顯著上調(diào),在信號轉(zhuǎn)導(dǎo),G蛋白偶聯(lián)受體信號通路以及鈉離子轉(zhuǎn)運正調(diào)控中起到重要作用,核心基因CHEK1與DNA損傷檢查點有關(guān),是細胞周期重要基因,該基因異常會導(dǎo)致精神分裂癥[12],AKT1,CHEK1都被證實與精神分裂癥有關(guān)系,可以作為精神分裂癥識別的生物標記以及治療潛在靶點。
由于生物活檢取樣精神分裂癥腦組織幾乎不可能實現(xiàn),大部分研究選擇精神分裂癥尸檢志愿者腦組織區(qū)域研究基因表達,樣品收集困難,時間較長,并且存在志愿者年齡,死亡時間,PH值變化,微生物等多方面因素干擾基因檢測。有研究表明精神分裂癥中外周血的分子變化可以某種程度代表腦組織中的病理生理變化[13]。本文選擇生物活檢提取外周血單核細胞材料,構(gòu)建RNA文庫使用基因芯片檢測基因表達,所有志愿者來源于小于18歲年齡相仿的青少年,腦部還處在發(fā)育階段,沒有使用精神類藥物治療史,因此受到的個體差異的干擾因素少。
綜上,本研究通過R,DAVID工具,STRING數(shù)據(jù)庫和Cytoscape軟件等多種生物信息方法探索了早發(fā)性精神分裂癥基因發(fā)病機制的相關(guān)基因及其表達功能特征以及影響的通路,找到了潛在的生物標記與治療靶點,為進一步的生物學(xué)驗證和基礎(chǔ)研究提供依據(jù),為精神分裂癥的診斷和治療提供了新的方向。