黃 煜 孫翔飛
【提 要】 目的 識別介導兒童期經歷中等至極端虐待與抑郁障礙相關的DNA甲基化位點,有助于在分子水平闡明抑郁障礙的發病機制,同時也可為改善臨床治療手段提供參考依據。方法 采用基于貝葉斯壓縮估計的高維中介效應模型識別具有中介效應的DNA甲基化位點,數據來源于gene expression omnibus(GEO)數據庫,分析采用基于R4.0的hdbm包進行分析。結果 采用貝葉斯高維中介效應模型進行分析,研究識別出具有潛在中介效應的2個DNA甲基化位點,分別為cg08522473與cg13224723,且分別位于基因TAGLN3與PAOX。結論 采用該模型識別出的甲基化位點分別位于基因TAGLN3與PAOX,且該基因都在人腦中有表達,且都與人類精神疾病相關,故這些DNA甲基化位點很可能介導了兒童期經歷中等至極端虐待后導致成年抑郁障礙的發生。
抑郁障礙是最常見的精神障礙之一,是指各種原因引起的以顯著而持久的心境低落為主要臨床特征的一類心境障礙。據WHO報告的數據顯示,全球有超過3.5億人受到抑郁癥的困擾,且在近十年來罹患該疾病的人數增長了約18%,故闡明抑郁障礙的發病機制具有重要的意義。目前普遍認為抑郁障礙發病是遺傳、心理、社會環境等多種因素共同作用的結果。近年來越來越多的研究者在表觀遺傳學領域對該疾病的發病機制進行了研究,且有研究表明DNA甲基化與抑郁障礙的發病存在關聯[1]。DNA甲基化是基因表觀遺傳修飾機制的一種,它雖不會改變DNA序列,但卻能影響DNA序列的活性,從而產生一些未知的生物學效應。
目前有研究支持兒童期遭受虐待會增加成年后罹患抑郁障礙的風險[2-3]。但是在分子水平上對該疾病的發病機制卻未完全闡明,有研究表明DNA甲基化可能參與了該疾病發病。目前的研究可知,兒童期經歷過虐待可導致DNA甲基化[4],此外,也有研究支持DNA甲基化與成年罹患抑郁障礙有關[1,5],識別DNA甲基化位點對于在分子水平層面闡明抑郁障礙征具有重要的意義。
DNA甲基化在抑郁障礙的發病過程中起的作用相當于“黑盒”效應,即兒童期經歷虐待導致DNA甲基化的改變,DNA甲基化的改變又導致罹患抑郁障礙。DNA甲基化發揮著介導的作用,且可以建立起抑郁障礙的發病過程。
中介效應分析是研究中介變量如何解釋暴露變量影響結局的機制。中介效應分析可將暴露變量對結局的作用分為兩部分:通過中介變量發揮的作用稱為中介效應;中介變量無法解釋的效應則稱為直接效應。在我國醫學研究領域涉及中介效應的研究中多為中介模型的應用[6-8]。較少涉及中介模型的方法學研究。目前的中介分析方法由單中介模型,進階為多中介模型,以及高維中介模型[9-10],此外,這些模型適用于連續和二分類結局,同時也有研究考慮暴露與中介變量間的相互作用的研究[11]。但是,這些研究基本都忽略了中介變量間的關系,由于DNA甲基化數據存在高維的特性,以及測序技術的原因,不可避免地在位點間存在一定的相關性。
基于以上的考慮,本研究采用高維情況下的貝葉斯中介分析方法[12]。貝葉斯中介模型是在分層框架中提出的,在該理論框架中,暴露因素對結局的影響是基于單個中介變量定義的。為了估計模型中的直接和中介效應,我們做了中介效應稀疏性的假設,即認為在只存在少部分的中介變量具有中介效應。在該先驗下,認為一小部分的DNA甲基化位點介導了兒童期經歷中等至極端虐待對成年后罹患抑郁障礙的效應。該方法將DNA甲基化位點識別的問題轉變為DNA甲基化位點的選擇問題,并應用貝葉斯方法對連續收縮率的影響進行預測。該方法不僅可以同時分析多個中介變量,而且也無需對中介變量做出任何路徑特定或因果順序的假設。
1.數據來源
研究數據來自于美國格雷迪創傷項目研究,該研究在獲得埃默里大學醫學院和格雷迪紀念醫院機構審查委員會批準后,將亞特蘭大市中心居民中招募的非裔美國人作為研究對象。該數據集包含基線信息、細胞組成資料和DNA甲基化數據(DNAm)。研究采用改良的貝克抑郁量表(BDI)對研究對象進行測量[13],且篩選出BDI評分≥10的觀察單位。在觀察結果中,排除了接受過抑郁障礙治療的研究對象,因為接受的治療可能會影響DNAm的改變,從而使中介效應分析的結果變得更為復雜與不確定。同時,研究也剔除了兒童期經歷中度至極端虐待缺失的觀察單位,最后納入中介效應分析的研究對象有128例。關于該研究項目的詳細信息,讀者可以在網站http://gradytraumaproject.com/進行參閱。研究采用的原始數據(DNAm數據、臨床數據和細胞數據)可以在以下網址進行下載獲取 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE72680。
2.方法
本研究采用R4.0軟件的hdbm包進行分析,利用實際數據構建兩個條件回歸模型,在利用Yi|Ai,Mi,Ci模型時,要確保暴露因素Ai與Yi之間有關聯。首先構建Yi|Ai,Ci模型:
(1)
繼而再構建Yi|Ai,Mi,Ci模型:
(2)


其次,構建Mi|Ai,Ci模型,即
Mi=Aiαa+αcCi+εMi
(3)

DE=E[Yi(a,Mi(a*))-Yi(a*,Mi(a*))|Ci]=βa(a-a*)
中介效應可表示為:
ME=E[Yi(a,Mi(a))-Yi(a,Mi(a*))|Ci]=
(1)貝葉斯方法先驗的指定
本研究對于第j個中介因素,假定了兩個正態分布的先驗,即


(2)后驗抽樣算法



圖1 具有最大效應的106個DNA甲基化位點介導的兒童期經歷虐待導致成年罹患抑郁障礙
(4)


表1 貝葉斯高維中介模型識別出具有中介效應的甲基化位點
本研究采用貝葉斯高維中介模型識別出了介導抑郁障礙發病的潛在中介效應基因TAGLN3與PAOX。圖2反映出基因TAGLN3在人腦中高表達,在人體的其他組織中則為呈低表達狀態,且Aguzzi等在2008研究發現該基因編碼蛋白hNP25,且該蛋白能夠上調與增強調節克羅伊茨費爾特-雅各布病與維持細胞骨架功能間的關系,該疾病是由朊病毒引起的中樞神經系統變性疾病[19]。則說明該基因參與了某些神經系統疾病的發病。雖然未發現直接的研究支持該基因與抑郁障礙有關,但是認為該基因很可能與抑郁障礙的發病過程有關。對于基因PAOX,圖3反映出該基因在人腦中并非呈高表達狀態,但是目前的研究發現,基因PAOX與某些精神疾病相關,比如,Moore K等研究發現基因PAOX對于焦慮的發病能起到保護作用;Cabrera-Mendoza B等對人腦基因甲基化與自殺身亡進行了研究,提出基因PAOX是在以后的自殺研究中值得研究的基因[20],同樣未找到直接的研究支持基因PAOX與抑郁障礙的發病有關,但是抑郁障礙與自殺存在很高的相關性,故該基因有很大可能性介導了兒童期經歷中等至極端虐待導致成年后抑郁障礙的發病。研究結果可為分子水平上闡明抑郁障礙的發病機制提供參考,但要得出確定性的結論,則需要進行生物學實驗才能驗證。

圖2 基因TAGLN3在不同人體組織中的表達量,該圖來自于(https://www.ncbi.nlm.nih.gov/gene/29114)

圖3 基因PAOX在不同人體組織中的表達量,該圖來自于(https://www.ncbi.nlm.nih.gov/gene/196743)
本研究雖采用了Song等研究提出的模型,同時也進行了數值模擬研究佐證了該方法的優越性。但是,利用該模型進行分析時,未對甲基化位點的性質進行考量,位于不同基因的DNAm位點,由于基因間可能存在著上位效應,即DNAm位點在發揮效應時,可能處于不同的水平。而該模型將所有的DNAm位點都視為在同一水平發揮效應;該研究基于DNAm位點進行研究,但基因才是遺傳的基本功能單位,對甲基化位點的生物學解釋具有一定的局限性;其次,研究識別出與抑郁障礙相關的DNAm位點在不同人群或地區中可能具有一定的差異性,因為甲基化位點較基因的穩定性差,故結果的外推性小;同時,模型在計算中介效應時采用了平方的形式來避免不同方向中介效應的相互抵消,但是位點在模型擬合的過程中,無法控制方向不同的中介效應的相互抵消,致使可能無法識別出具有潛在中介效應但存在相互抵消的位點。同時,識別出具有潛在中介效應的位點的意義要遠大于計算出中介效應大小的意義,計算中介效應的大小的目的是要了解在抑郁障礙發病過程中中介效應所占的比例,但是,在模型估計過程中尚無法兼顧正負中介效應抵消的問題,所能識別出的都是中介效應非常顯著的位點,而且本模型采用了平方的形式來避免結果中中介效應的相互抵消,但是采用這樣的方法將導致無法直觀地計算出中介效應在致病過程中所占的比例,故本研究的結果部分沒有呈現中介效應大小的結果。
最后,從生物學的角度,可知基因分為主效應基因與微效基因,對于主效應基因,可能單個位點即具有顯著的生物學效應,但是對于微效基因,則單個位點的生物學效應較小,只有將這些微效效應累加起來才能發揮顯著的生物學效應,該模型對于微效基因甲基化位點的識別可能不顯著。故以后將構建更加吻合生物學意義的中介效應模型。