楊超,傅岳文,張莉,王艷,楊萍
研究表明,兒童青少年雙相情感障礙(PBD)是一種發(fā)生于兒童或青少年早期(18歲以前)的精神障礙性疾病[1]。PBD患者有極高的共患病概率,美國(guó)一項(xiàng)研究表明,95.5%的PBD Ⅰ型患者伴有超過(guò)3種其他精神障礙[2],且該類患者病程更加遷延,復(fù)發(fā)率高,預(yù)后較差。由于PBD病情復(fù)雜、癥狀易與兒童期其他障礙的癥狀重疊,PBD患者很難得到較好的臨床診斷及早期干預(yù)治療,嚴(yán)重影響其社會(huì)功能及生活質(zhì)量,自殺率也難以得到有效控制[3]。為了更加明確地指導(dǎo)PBD的防治,需要從分子水平揭示其發(fā)病機(jī)制。基因芯片技術(shù)是一種能夠高通量地獲取生物信息的技術(shù),其可分析疾病組織與正常組織之間的差異表達(dá)基因。故本研究利用既往報(bào)道證實(shí)與PBD相關(guān)的變異基因進(jìn)行生物信息挖掘分析,探索與PBD相關(guān)的通路及通路核心基因,以期從分子水平揭示PBD的發(fā)病機(jī)制,為PBD的基礎(chǔ)研究和臨床治療提供新思路。
1.1 研究時(shí)間 本研究時(shí)間為2018年2—7月。
1.2 基因組數(shù)據(jù)收集 文獻(xiàn)檢索及數(shù)據(jù)分析流程圖見圖1。

圖1 文獻(xiàn)檢索及數(shù)據(jù)分析流程圖Figure 1 Flow chart of literature retrieval and data analysis
1.2.1 PBD相關(guān)基因研究數(shù)據(jù)檢索 文獻(xiàn)納入標(biāo)準(zhǔn):(1)文獻(xiàn)研究對(duì)象為PBD患者;(2)提供變異或差異基因名稱。文獻(xiàn)排除標(biāo)準(zhǔn):某種干預(yù)措施對(duì)PBD基因變化的影響研究。分別以“pediatric bipolar disorder sequencing”“youth bipolar disorder sequencing”為關(guān)鍵詞,在PubMed檢索2014年1月—2018年7月的文獻(xiàn),共獲得32篇文獻(xiàn)。挑選其中應(yīng)用全外顯子組測(cè)序或轉(zhuǎn)錄組測(cè)序研究且納入的患者例數(shù)超過(guò)10例的數(shù)據(jù)集,經(jīng)檢索篩選共得到5套完整數(shù)據(jù)集,包含4套全外顯子組測(cè)序研究[4-7]及1套轉(zhuǎn)錄組測(cè)序研究[8]。
1.2.2 全外顯子組測(cè)序數(shù)據(jù) KATAOKA等[4]利用全外顯子組測(cè)序技術(shù),對(duì)比臨床數(shù)據(jù)進(jìn)行相關(guān)性挖掘分析,在71個(gè)基因中檢測(cè)到可導(dǎo)致蛋白功能缺失的致病變異;RAO等[5]的研究利用全外顯子靶向測(cè)序技術(shù),檢測(cè)并分析了來(lái)自家系遺傳的青少年P(guān)BD患者的突變圖譜,通過(guò)家系對(duì)比分析找出14例罕見且可能致病的基因突變;SAFARI等[6]的研究利用公共數(shù)據(jù)挖掘發(fā)現(xiàn),膠質(zhì)細(xì)胞源神經(jīng)營(yíng)養(yǎng)因子(GDNF)基因在PBD患者中異常表達(dá),然后收集了健康人及PBD患者共66例,通過(guò)Sanger測(cè)序的方法檢測(cè)GDNF基因的單核苷酸多態(tài)性,通過(guò)統(tǒng)計(jì)學(xué)方法確定該基因的功能性變異rs2075680 C>A在患者與健康人之間有顯著差異,證明該基因功能異常與患者發(fā)病具有強(qiáng)相關(guān)性。來(lái)自約翰霍普金斯研究所的GOES等[7]進(jìn)行了目前最大規(guī)模的PBD患者隊(duì)列測(cè)序研究,共計(jì)3 541例患者(其中超過(guò)60%的患者為20歲以下家系遺傳青少年P(guān)BD)、4 774例健康對(duì)照者,該研究利用生物信息學(xué)富集分析發(fā)現(xiàn),82個(gè)基因的84個(gè)疑似致病性變異會(huì)導(dǎo)致PBD患病風(fēng)險(xiǎn)增加。
1.2.3 轉(zhuǎn)錄組測(cè)序數(shù)據(jù) UThealth研究中心FRIES等[8]設(shè)計(jì)并入組了3類人群(成年P(guān)BD患者、其后代青少年P(guān)BD患者、健康人群),以外周血單個(gè)核細(xì)胞(PBMC)為取材對(duì)象,結(jié)合轉(zhuǎn)錄組及表觀組學(xué)(甲基化)測(cè)序,并根據(jù)不同人群直接的基因?qū)Ρ劝l(fā)現(xiàn)了41個(gè)與PBD高風(fēng)險(xiǎn)相關(guān)的異常表達(dá)基因。
1.2.4 數(shù)據(jù)匯總確認(rèn) 綜上,本研究共納入來(lái)自4項(xiàng)研究的全外顯子組測(cè)序數(shù)據(jù),去重之后共計(jì)包含175個(gè)潛在與PBD風(fēng)險(xiǎn)相關(guān)的基因;納入1項(xiàng)來(lái)自轉(zhuǎn)錄組學(xué)的數(shù)據(jù),包含41個(gè)潛在與PBD風(fēng)險(xiǎn)相關(guān)的重要基因。
1.3 變異基因集差異表達(dá)基因的生物信息學(xué)分析 去重之后的基因按照不同組學(xué)方法分成兩組:來(lái)自全外顯子組測(cè)序的175個(gè)基因(全外顯子組)與來(lái)自轉(zhuǎn)錄組測(cè)序的41個(gè)基因(轉(zhuǎn)錄組),分別使用生物信息軟件DAVID[9]、KEGG[10]、Panther[11]、WebGestalt[12]進(jìn)行每組基因生物學(xué)功能(BP)的富集分析,通過(guò)KEGG、Panther數(shù)據(jù)庫(kù)計(jì)算其所富集的通路。
按照細(xì)胞生物學(xué)過(guò)程,轉(zhuǎn)錄組學(xué)處于全外顯子組學(xué)的下游,且更接近行使具體功能的蛋白表達(dá)。本研究同時(shí)對(duì)比了兩種組學(xué)基因之間BP及通路調(diào)控方面的異同,并尋找DNA以及RNA均發(fā)生異常的功能基因及通路,進(jìn)一步確定與PBD患病高度相關(guān)的基因。
2.1 BP的富集分析 全外顯子組基因富集分析結(jié)果顯示,共得到9個(gè)顯著富集的BP分類(見圖2),發(fā)生重要影響功能變異基因的主要作用與陰離子跨膜轉(zhuǎn)運(yùn)、氯離子運(yùn)輸、胚胎發(fā)育、神經(jīng)管發(fā)育模式相關(guān),另有少量基因顯著富集與腎上腺發(fā)育功能相關(guān)。
轉(zhuǎn)錄組基因富集分析結(jié)果顯示,共得到10個(gè)顯著富集的BP分類(見圖3),發(fā)生異常表達(dá)的基因主要集中在組蛋白泛素化、甲狀腺素合成與水解、蛋白折疊、組蛋白修飾等蛋白合成或水解相關(guān)的功能。
2.2 KEGG/Panther通路分析 全外顯子組基因在KEGG數(shù)據(jù)庫(kù)中顯著富集的通路主要為肌醇磷酸鹽代謝、磷脂酰肌醇信號(hào)系統(tǒng)通路(見圖4);轉(zhuǎn)錄組基因在KEGG數(shù)據(jù)庫(kù)中顯著富集的通路主要為泛素化調(diào)控的蛋白水解通路(見圖5)。
全外顯子組基因在Panther數(shù)據(jù)庫(kù)中顯著富集的通路主要包括血管生成相關(guān)通路(見圖6)與帕金森疾病類通路。轉(zhuǎn)錄組基因在Panther數(shù)據(jù)庫(kù)中未見顯著富集的通路。
綜上,通過(guò)對(duì)公共數(shù)據(jù)庫(kù)中PBD研究相關(guān)的重要基因進(jìn)行富集分析,整合不同參考數(shù)據(jù)庫(kù)的結(jié)果篩選出共計(jì)6個(gè)最為顯著富集的BP或通路(見表1),其中20個(gè)基因與胚胎發(fā)育相關(guān),包括PLCD3、DAG1、APLNR、EPAS1等,其他重要BP或通路包括泛素化調(diào)控的蛋白水解通路、腎上腺發(fā)育信號(hào)系統(tǒng)通路、磷脂酰肌醇信號(hào)系統(tǒng)通路、血管生成相關(guān)通路。

圖2 全外顯子組基因集顯著富集的BPFigure 2 Enrichment analysis of biological process from genes in wholeexome sequencing group

圖3 轉(zhuǎn)錄組基因集顯著富集的BPFigure 3 Enrichment analysis of biological process from genes in transcript sequencing group

圖4 全外顯子組基因在KEGG數(shù)據(jù)庫(kù)中顯著富集的通路Figure 4 Enrichment analysis of KEGG pathways from genes in wholeexome sequencing group

圖5 轉(zhuǎn)錄組基因在KEGG數(shù)據(jù)庫(kù)中顯著富集的通路Figure 5 Enrichment analysis of KEGG pathways from genes in transcript sequencing group
近年來(lái)PBD發(fā)病率逐年升高,從早期的1%逐漸攀升到接近3%[13]。同時(shí)由于PBD的臨床表現(xiàn)較為復(fù)雜,且與成年人PBD有較大差異,因此存在較高比例患者被漏診及誤診。數(shù)據(jù)顯示,接近70%的PBD患者回憶起最初的發(fā)病狀態(tài),在青少年時(shí)期已呈現(xiàn)出相關(guān)的臨床表征[14]。近年來(lái)分子生物學(xué)及二代測(cè)序技術(shù)逐漸普及應(yīng)用,不同生物醫(yī)學(xué)領(lǐng)域逐漸引入組學(xué)測(cè)序技術(shù)并輔助進(jìn)行更深層次的病理機(jī)制探索。不斷有臨床報(bào)道發(fā)現(xiàn)基因變異及異常表達(dá)與PBD患者的病情及預(yù)后有相關(guān)性[15],同時(shí)也有較大規(guī)模的患者標(biāo)本測(cè)序研究發(fā)現(xiàn)一類或多類相同功能的基因同時(shí)呈現(xiàn)異常表達(dá)狀態(tài)[16]。這些研究逐漸推動(dòng)臨床研究從分子層面揭開PBD的發(fā)病原因,對(duì)于臨床分子診斷、個(gè)性化醫(yī)療的實(shí)現(xiàn)奠定了基礎(chǔ)。為此,本研究通過(guò)匯總既往研究結(jié)果,整理全外顯子組測(cè)序數(shù)據(jù)及轉(zhuǎn)錄組測(cè)序數(shù)據(jù),并進(jìn)行數(shù)據(jù)的二次挖掘分析,通過(guò)生物信息學(xué)富集分析算法、軟件及數(shù)據(jù)庫(kù)探尋與PBD患者相關(guān)的基因、通路以及致病機(jī)制,發(fā)現(xiàn)了6個(gè)顯著富集的BP及通路,推測(cè)其與PBD患者發(fā)病具有較強(qiáng)的相關(guān)性。

圖6 全外顯子組基因在Panther數(shù)據(jù)庫(kù)中顯著富集的血管生成相關(guān)通路Figure 6 VEGF signaling pathway of Panther from genes in whole-exome sequencing group

表1 基因顯著富集的重要BP及通路Table 1 Top ranked biological process or pathways
本研究全外顯子組基因富集分析共得到9個(gè)顯著富集的BP分類,發(fā)生重要影響功能變異基因的主要作用與陰離子跨膜轉(zhuǎn)運(yùn)、氯離子運(yùn)輸、胚胎發(fā)育、神經(jīng)管發(fā)育模式相關(guān),提示PBD患者可能由于胚胎發(fā)育階段基因發(fā)生變異或遺傳了來(lái)自父母的變異基因而導(dǎo)致神經(jīng)發(fā)育及離子運(yùn)輸功能異常。本研究轉(zhuǎn)錄組基因富集分析共得到10個(gè)顯著富集的BP分類,發(fā)生異常表達(dá)的基因主要集中在組蛋白泛素化、甲狀腺素合成與水解、蛋白折疊、組蛋白修飾等蛋白合成或水解相關(guān)的功能。由于本研究所使用的數(shù)據(jù)集來(lái)自不同研究中心,患者集的年齡、性別、病情程度均未進(jìn)行深入對(duì)比,因此轉(zhuǎn)錄組異常表達(dá)基因的BP與全外顯子組并無(wú)重疊。
本研究結(jié)果顯示,發(fā)生變異的基因中有20個(gè)基因與胚胎發(fā)育相關(guān),包括PLCD3、DAG1、APLNR、EPAS1等。既往研究證明,PBD與遺傳高度相關(guān),一項(xiàng)研究估計(jì)PBD的遺傳性(患者發(fā)病與遺傳相關(guān)的概率)高達(dá)0.7~0.8[17]。結(jié)合本研究結(jié)果推測(cè),PBD患者遺傳的變異基因在胚胎發(fā)育階段由于功能異常,導(dǎo)致其發(fā)病年齡呈現(xiàn)早齡化特點(diǎn)。本研究全外顯子組基因富集分析結(jié)果顯示,另有少量基因顯著富集與腎上腺發(fā)育功能相關(guān),這與之前的研究結(jié)果[18]一致,提示下丘腦-垂體-腎上腺軸(HPA)的功能障礙會(huì)導(dǎo)致PBD患者的疾病進(jìn)展,并且這些基因的異常高表達(dá)會(huì)增加后代患病的風(fēng)險(xiǎn)。
既往研究證明,磷脂酰肌醇是G蛋白偶聯(lián)受體信號(hào)傳導(dǎo)的重要物質(zhì),并且可活化Ca2+、激活各類Ca2+依賴蛋白、調(diào)節(jié)各種酶活性[19]。在哺乳類腦神經(jīng)元突觸處鈣調(diào)素依賴性激酶Ⅱ十分豐富,其與記憶形成有關(guān),該蛋白發(fā)生點(diǎn)突變的小鼠表現(xiàn)出明顯的記憶無(wú)能[20]。因此推測(cè)肌醇磷酸鹽代謝通路相關(guān)基因變異導(dǎo)致了患者神經(jīng)元的發(fā)育或者功能受損,與PBD患病相關(guān)。同時(shí)本研究發(fā)現(xiàn),磷脂酰肌醇信號(hào)系統(tǒng)、血管生成相關(guān)通路以及帕金森疾病類通路基因均發(fā)生異常,包含PIK3C2A、PLCG1、PLCD3、PIKFYVE等,說(shuō)明PBD患者的血管生成以及神經(jīng)元發(fā)育功能均不同程度受損。從神經(jīng)發(fā)育角度來(lái)說(shuō),有研究證明,PBD患者早期發(fā)育階段便呈現(xiàn)出前帶灰質(zhì)體積的下降[21-23];另有尸檢結(jié)果顯示,PBD患者前扣帶神經(jīng)元密度下降,而神經(jīng)元密度下降可能導(dǎo)致有效軸突的減少[21-23]。此外,有研究表明,功能磁共振圖像顯示PBD患者的丘腦存在明顯異常[24]。
本研究通過(guò)數(shù)據(jù)挖掘進(jìn)一步探索了PBD患者的臨床癥狀與患者基因異常之間的聯(lián)系,但是由于本研究數(shù)據(jù)多為西方人群,尚不能完全代表中國(guó)PBD患者發(fā)病的分子機(jī)制,因此仍需要更多的研究探索中國(guó)PBD患者的發(fā)病機(jī)制,促進(jìn)臨床上更早實(shí)現(xiàn)患者的精準(zhǔn)診療、分子診斷、早期診斷,并進(jìn)行早期干預(yù)、治療以減少患者痛苦,降低或延緩病情發(fā)展。同時(shí)本研究所納入的研究未提供患者年齡、性別、病情嚴(yán)重程度等詳細(xì)信息,因此不能排除不同臨床表現(xiàn)的患者其突變基因及異常表達(dá)基因會(huì)呈現(xiàn)出不同的功能富集。
綜上所述,PBD患者異常突變的PLCD3、DAG1、APLNR、EPAS1等基因與嬰兒的胚胎發(fā)育相關(guān),且該類變異屬于遺傳自父母的胚系突變,進(jìn)一步提示臨床進(jìn)行嬰幼兒體檢篩查時(shí)可重點(diǎn)關(guān)注以上基因。除此之外,本研究還發(fā)現(xiàn)PBD患者中異常突變或表達(dá)的基因與磷脂酰肌醇信號(hào)系統(tǒng)以及血管生成相關(guān),提示PBD的發(fā)病機(jī)制可能與該通路有密切關(guān)系,為臨床上患者的治療提供了可靠的研究方向。
作者貢獻(xiàn):楊超進(jìn)行研究的實(shí)施與可行性分析,撰寫論文;楊萍進(jìn)行文章的構(gòu)思與設(shè)計(jì),負(fù)責(zé)文章的質(zhì)量控制及審校,對(duì)文章整體負(fù)責(zé)、監(jiān)督管理;傅岳文進(jìn)行數(shù)據(jù)收集;張莉進(jìn)行統(tǒng)計(jì)學(xué)處理;王艷進(jìn)行結(jié)果的分析與解釋。
本研究無(wú)利益沖突。