張曉宇 劉天一 朱文豪 王海峰
(吉林大學第一醫院神經外科,吉林 長春 130021)
腦卒中按照腦血管突然發生的病變可分為缺血性腦卒中和出血性腦卒中。缺血性腦卒中最常見的是腦梗死,其亞型包括大動脈粥樣硬化、小血管閉塞和心源性腦卒中等〔1,2〕;出血性腦卒中分為腦出血和蛛網膜下腔出血兩大類〔3〕。腦卒中在目前中老年人群中有著較高的發病率、致殘率和死亡率〔4〕,所以探索腦卒中的病因和高危因素非常重要。近期,基于全基因組關聯研究的大樣本的孟德爾隨機化研究方法廣泛應用在腦卒中的病因探索中,它是使用與風險因素相關的遺傳變異作為工具變量,推測風險因素和疾病之間的因果關系。近年來,孟德爾隨機化研究在疾病的高危因素探索中的應用越來越廣泛。本文將圍繞目前孟德爾隨機化的研究方法及其在腦卒中的病因探索進行綜述。
流行病學研究的主要目的是明確疾病的高危因素或者暴露于特定風險因素是否會改變疾病的嚴重程度的可能性〔5〕。傳統的觀察性研究由于無法排除環境中產生的混雜因素影響,即使在暴露和結果之間測量出了強大的統計關聯時,也無法證明暴露和結局之間存在明確的因果關系。與傳統的觀察性研究相比,孟德爾隨機化研究使用長時間暴露產生的遺傳變異作為工具變量(通常是單核苷酸多態性)來模擬暴露因素對疾病易感性的影響,有效避免了反向因果和混雜因素干擾,繼而更為準確地推測出暴露和結局之間的因果關系〔6~8〕。
孟德爾隨機化是由Katan在1986年首次提出,它是以孟德爾分離定律為理論基礎,即“對親本性狀的等位基因形成配子時產生的影響,隨減數分裂隨機分配給子代”,利用全基因組關聯研究通過測試數百萬個遺傳變異與疾病或者風險因素結果的關聯,發現了大量與人類疾病或風險因素相關的遺傳變異,在一些大型生物庫中(如英國生物銀行UK Biobank,FINNGEN等)可以獲取這些疾病和風險因素相關的單核苷酸多態性信息,然后利用這些單核苷酸多態性作為工具變量,進行有目的性的孟德爾隨機化研究。
孟德爾隨機化研究在確立暴露和結局的因果關系前,必須滿足3個基本假設:(1)工具變量與暴露因素強相關;(2)工具變量與任何潛在的混雜因素無關;(3)工具變量與結局不直接相關,它對結局的作用只通過暴露來體現〔9〕。第一個假設通過選擇與暴露因素強烈相關的遺傳變異來解決;后兩個假設通常被遺傳多效應所違反,即一個基因位點通常影響一個以上的性狀,這就意味著遺傳變異位點可能通過暴露以外的途徑去影響結局。目前已經開發了很多方法去檢驗多效性,例如,在加權中位數作為孟德爾隨機化的主要分析方法評估暴露和結局的因果關系時,MR-Egger、加權中值、加權模式和多效性殘差和異常值(MR-PRESSO)經常作為加權中位數的補充方法,進行孟德爾隨機化研究結果的敏感性分析來檢驗結果是否有因所選擇的工具變量的多效性而產生的偏倚〔10~14〕。
孟德爾隨機化研究過程中,通常暴露和結局的遺傳變異信息通常來自不同的人群,這也就是孟德爾隨機化最基本的研究方法,即兩樣本孟德爾隨機化〔15〕。這就需要考慮群體分層所產生的異質性問題,這會使結果產生偏倚,所以在進行孟德爾隨機化研究過程中通常盡可能地選擇有相同遺傳背景的人群。在此基礎上,還發現了其他的孟德爾隨機化的研究形式。例如:(1)雙向孟德爾隨機化評估了暴露和結局之間正向和反向因果關系,即暴露和結局是否互為因果,這就需要暴露和結局之間正反進行兩次的孟德爾隨機化研究〔15〕;(2)兩步孟德爾隨機化探討了中介變量是否能介導暴露對結局的影響,這一般適用于尋找從暴露到結局的潛在發生機制〔15,16〕。在中介效應的探究過程中,會產生3個參數:假設暴露對結局的直接效應為A;暴露對中介變量的效應為B;中介變量對結局的效應為C。若A、B、C均顯著,說明暴露到結局存在因果關系,且這種關聯有一部分是由中介變量介導的;若A不顯著,B、C都顯著,則說明暴露到結局完全由中介變量介導;若A顯著,但B、C中至少有一個不顯著,說明從暴露到結局的因果關聯中不存在由該中介變量介導的中介效應;(3)多變量孟德爾隨機化研究時,通常使用兩個以上彼此之間存在一定關聯的暴露因素,比如高密度脂蛋白,低密度脂蛋白,三酰甘油和載脂蛋白B等,結果會展現出在考慮多種暴露因素時,其中的單個暴露因素在矯正其他因素影響后是否對結局存在因果關系〔15,16〕。不同形式研究方法,使得孟德爾隨機化在疾病高危因素探究中的應用越來越廣泛。
2.1生活方式因素和腦卒中 在過去的觀察性研究中,發現了許多生活方式因素和腦卒中風險相關,但是這些生活方式是否與腦卒中之間有明確的因果關系及改變這些因素是否會降低腦卒中的患病風險尚不清楚。Harshfield等〔17〕通過兩樣本孟德爾隨機化和多變量孟德爾隨機化研究發現了抽煙和肥胖比會增加缺血性腦卒中及其亞型(大動脈粥樣硬化和小血管閉塞)的風險,而受教育年限和腦出血、缺血性腦卒中及其亞型呈負相關。Titova等〔18〕利用前瞻性隊列研究和孟德爾隨機化研究分析了睡眠時間和腦卒中的關系,在前瞻性研究中發現睡眠時間長與缺血性腦卒中的風險增加有關,睡眠時間段與腦出血風險增加有關,然而孟德爾隨機化研究并不支持這些發現,但表明了基因預測的短睡眠時間僅和缺血性腦卒中的亞型大動脈腦卒中的風險增加有關,Ma等〔19〕應用兩樣本孟德爾隨機化研究發現白天嗜睡是與大動脈腦卒中風險增加有明確的因果關系。之前有隊列研究發現單獨或聯合飲用咖啡和茶與腦卒中的風險降低有關〔20〕。Wang等〔21〕的孟德爾隨機化研究發現了每天飲用一杯茶,可以降低小血管卒中風險,但與缺血性腦卒中及其他亞型無關。然而Qian等〔22〕利用兩樣本孟德爾隨機化卻沒有發現喝咖啡和缺血性腦卒中及其亞型之間存在明確的因果關系。此外, Karhunen等〔23〕還發現了吸煙和失眠的遺傳易感性與顱內動脈瘤和動脈瘤性蛛網膜下腔出血的風險增加相關。這些研究明確和排除了多種生活方式因素與腦卒中之間的因果關系,這可能提示了對腦卒中進行一級預防的日常行為方式。
2.2循環脂質代謝和腦卒中 循環脂質代謝物與腦卒中之間的關系一直是研究的熱點,Fatumo等〔24〕利用非洲個體脂質循環的遺傳特征、英國生物銀行和百萬退伍軍人計劃的薈萃分析,進行了循環脂質代謝物和腦卒中的孟德爾隨機化研究,研究發現較高遺傳性的低密度脂蛋白膽固醇、總膽固醇和較低遺傳性的高密度脂蛋白膽固醇與非洲遺傳個體的缺血性腦卒中風險增加有關,在歐洲個體進行分析時,也得到了類似的結果,并沒有出現明顯的群體差異。然而,在Yuan等〔25〕關于循環脂質和缺血性腦卒中的研究中卻發現,在使用單變量孟德爾隨機化研究時,載脂蛋白B、低密度脂蛋白膽固醇和三酰甘油水平升高與缺血性腦卒中及其亞型的風險增加有關,但在進行多變量孟德爾隨機化研究時,載脂蛋白B保留了與缺血性腦卒中穩健的因果關系,但是低密度脂蛋白膽固醇卻在矯正載脂蛋白B和三酰甘油的影響后卻顯示出可能降低缺血性腦卒中的患病風險;在載脂蛋白A-I和高密度脂蛋白膽固醇的單變量分析中均表現出與缺血性腦卒中和其亞型的負相關性,但在相互調整后,便失去了與缺血性腦卒中的因果關系。此外,有臨床試驗和觀察性研究指出,低密度脂蛋白膽固醇水平可能與腦出血風險呈負相關〔26~28〕,Falcone等〔29〕和Acosta等〔30〕的孟德爾隨機化研究分別表明了基因升高的低密度脂蛋白膽固醇水平與腦出血和蛛網膜下腔出血的風險降低有關。
2.3非脂質循環物和腦卒中 目前,B族維生素治療降低血液中總同型半胱氨酸水平以預防腦卒中的臨床試驗尚無明確的結論,Yuan等〔31〕利用兩樣本孟德爾隨機化研究發現遺傳預測的總同型半胱氨酸水平的升高與缺血性腦卒中和蛛網膜下腔出血的風險增高有關,基因預測的維生素B6水平升高和缺血性腦卒中的風險增加相關,而維生素B12與腦卒中無相關性。高濃度的血清膽紅素一直被認為是有毒的,而輕中度升高的膽紅素可作為一種有效的內源性抗氧化劑,可對抗腦卒中病情發展過程中產生的氧化應激,Choi等〔32〕利用韓國的生物數據庫中獲取了高達1 784個與血清膽紅素水平高度相關的單核苷酸多態性作為工具變量,研究發現在韓國人群中,高膽紅素與腦卒中風險降低之間存在因果關系。此外,血清鎂濃度與調節血壓和血管內皮的功能有關〔33,34〕,Larsson等〔35〕僅利用6個與血清鎂濃度高度相關的單核苷酸多態性,明確了較高的血清鎂濃度可以降低顱內動脈瘤和動脈瘤性蛛網膜下腔出血的風險。
2.4病理狀況和腦卒中 孟德爾隨機化在腦卒中病因的探索中,還確定和排除了一些病理狀況和腦卒中的因果關系。例如,2型糖尿病會引起各種微血管和大血管變化,最終導致的主要臨床并發癥之一便是腦卒中〔36〕,Larsson等〔37〕利用孟德爾隨機化研究確定了2型糖尿病和大動脈腦卒中之間的因果關系;神經質描述了一種焦慮、抑郁和其他負面情緒的傾向,Liu等〔38〕利用孟德爾隨機化研究確定了神經質會增加缺血性腦卒中的風險;非酒精性脂肪肝會導致葡萄糖和脂蛋白代謝受到干擾、氧化應激增加和血液高凝狀態而增加腦卒中風險,Wu等〔39〕的孟德爾隨機化研究并沒有發現它與缺血性腦卒中之間存在因果關系,而是與其亞型(大動脈粥樣硬化和小血管閉塞)之間存在明確的因果關系;之前有觀察性研究發現偏頭痛患者的腦卒中風險增加〔40〕,而Shu等〔41〕的孟德爾隨機化研究否認了偏頭痛和腦卒中之間存在因果關系,作者認為可能是由于腦血管腦卒中引發的偏頭痛樣發作與偏頭痛之間的混淆,導致了之前誤以為偏頭痛與腦卒中之間存在關聯。
孟德爾隨機化在進行因果關系的論證過程中也存在著一些局限性。①孟德爾隨機化的研究結論可能因為暴露和結果的全基因組關聯研究人群的不匹配而導致假陰性或者假陽性的結果,隨著未來各大數據庫變得更大更多樣化時,這將是一個更令人擔憂的問題;②孟德爾隨機化經常推測的是長時間暴露對結局的影響,但是單核苷酸多態性的信息是由一個或一組個體在某一時刻被獲取的,這意味著所獲取的遺傳變異信息可能與個體長時間的暴露信息存在差異;③遺傳變異不可避免的存在多效性問題,很難證明遺傳變異只是通過暴露來影響結局,所以在研究過程中需要應用不同的孟德爾隨機化研究方法檢驗多效性問題,盡量去減少多效性對研究結論引起的偏差〔42〕。
綜上,孟德爾隨機化是一個非常強大的流行病學研究方法,隨著大數據和基因技術的發展,在眾多醫學領域已經有了廣泛的應用。在腦卒中病因探索過程中,它能解決之前限制腦卒中風險因素研究的混雜因素,可以更加清楚地認識腦卒中及其高危因素之間的因果關系。例如單變量因素和多變量因素孟德爾隨機化研究的對比分析可對脂質循環物和腦卒中之間因果關系的認識更進一步。希望在今后的關于腦卒中的孟德爾隨機化分析中可以有更多的中介變量分析,探究風險因素和腦卒中之間可能存在的中介效應,發現更多的風險因素和腦卒中之間可能存在的作用機制。
盡管孟德爾隨機化研究存在一些局限性,但是在今天及可預見的未來,隨著數據生成成本的不斷降低及孟德爾隨機化分析方法的不斷完善,它未來將成為一種更為主流的流行病學研究方法在腦卒中和其他疾病的研究中發揮更多更強大的作用。