胡惠芳
(湖北輕工職業技術學院湖北武漢430200)
基因組拷貝數變異及其突變機理分析
胡惠芳
(湖北輕工職業技術學院湖北武漢430200)
拷貝數變異能夠導致呈孟德爾遺傳的單基因病和罕見疾病,同時與復雜疾病相關。目前用來進行全基因組范圍的拷貝數變異研究方法有很多,包括單核苷酸多態性分型芯片技術、基于芯片的比較基因組雜交技術和新一代測序技術。拷貝數變異的形成機制也有很多種,總的來說可以概括為DNA重組和DNA錯誤復制兩大類。本文對基因組拷貝數變異進行簡單介紹,并詳細分析了其突變機理。
基因組;拷貝數變異;發現;突變機理
顧名思義,“拷貝數變異”就是會產生拷貝數的量變。準確來說,拷貝數變異通常是指長度超過1kb的基因組大片段的拷貝數減少或者增加,主要表現為亞顯微水平的重復和缺失。拷貝數變異是由基因組發生重排而導致的,是基因組結構變異的重要組成部分。
2004年是拷貝數變異研究中具有重大意義的一年。利用新的能夠覆蓋整個人類基因組的先進研究技術,有兩個研究小組差不多同時發現了大片段的拷貝數變異,這種大片段的拷貝數變異不僅能夠導致出生缺陷等重大疾病,而且能夠作為一種遺傳多態性而廣泛分布于人類基因組之中。目前,被報道的基因組結構變異已經超過了66000個,其中主要是拷貝數變異。
那么,人類基因組上大量的拷貝數變異究竟是如何產生的呢?DNA重組是其中一類已知的機制,包括非同源末端連接和非等位同源重組等。最近研究發現的“復制叉停滯與模板交換”(Fork stalling and template switching,FoSTeS)模型是一種新的基于DNA錯誤復制的機制。此種機制可以解釋那些不符合非等位同源重組和非同源末端連接等突變機制的具有復雜結構的拷貝數變異。
2004年,某研究小組應用寡核酸微陣列分析技術,使用85000個平均間隔為35kb的探針對20例正常個體的基因組DNA片段的拷貝數情況進行了分析,鑒定出其中76個位點上存在的221個長度超過100kb的拷貝數變異。同時,有人利用基于細菌人工染色體探針的分辨率為1Mb的比較基因組雜交芯片,對55例個體的大片段拷貝數變異情況進行了分析,發現了255個重復和缺失。
“基因組變異數據庫”對已經被報道的拷貝數變異進行了收錄和數據整理。“基因組變異數據庫”中的所有拷貝數變異所覆蓋的基因組片段占人類基因組的29.7%,但是實際上這個比例要更低一點。此外,根據研究數據估計,人類基因組上有5~10%的區域存在拷貝數變異,比其他遺傳變異形式要高很多。
事實證明,拷貝數變異研究具有重大的臨床價值和科學意義,因此全球范圍內開展拷貝數變異研究項目的研究中心越來越多,例如千人基因組計劃和人類基因組結構變異研究組等。千人基因組計劃已經獲得了初步數據,包括2萬個拷貝數變異,100萬個短的插入或缺失以及1500萬個單核苷酸多態性的位點,其中絕大部分都是新的發現。
3.1 非等位同源重組主要發生在減數分裂中,可導致倒位、重復和缺失
等位同源重組是生物遺傳多樣性的來源,是指在減數分裂過程中,基因組上同一位點的DNA序列與其同源序列發生的重組。
非等位同源重組是由兩條同源的、但在基因組不同位置重復出現的、高度相似性的DNA序列配對并發生序列交換造成的。非等位同源重組若發生在相同染色體上的同向重復序列間則會造成缺失或重復,若發生在相同染色體上的反向重復序列間則會造成倒位。若非等位同源重組發生在不同染色體上的重復序列間則可能會導致染色體易位。
非等位同源重組的底物通常是長度超過10kb,序列相似度大于95%的SD序列。除了SD序列之外,非等位同源重組的底物還包括可以反轉錄轉座的L1元件、Alu等較短的重復序列。由于檢測手段的局限性,此類機理導致的拷貝數變異通常會低估。
同源重組(包括非等位同源重組和等位同源重組)是存在重組熱點的,即重組發生的位點存在著一定的序列傾向性,而不是隨機分布于基因組之上。一個順式作用基序“CCNCCNTNNCCNC”富集的現象在等位同源重組和非等位同源重組的重組熱點中都有被發現,這不僅說明等位同源重組和非等位同源重組是共享重組熱點的,并具有類似分子機理,同時也提示了該段特征序列是某些或者某一重組相關蛋白識別位點的可能性。
非等位同源重組主要發生在減數分裂中,造成不平衡交換,形成攜帶有拷貝數變異的配子,進而傳遞給后代。在有絲分裂中也可以發生較少的非等位同源重組事件,在體細胞中形成攜帶拷貝數變異或者其它結構變異的嵌合型。
基于非等位同源重組機理發生的拷貝數變異具有較高的突變率。某研究小組采用精子分型技術,分析了幾名4個基于非等位同源重組機理產生的拷貝數變異,源自5名正常男性的精液樣本。這些拷貝數變異包括:Potocki-Lupski綜合征重復突變與Smith-Magenis綜合征缺失突變,腓骨肌萎縮癥重復突變與遺傳性壓力敏感性神經病缺失突變,無精子癥因子a缺失突變及其相對的重復突變,7q11.23重復突變和Williams-Beuren綜合征缺失突變。
3.2 一些結構簡單的拷貝數變異可以源自非同源末端連接
非同源末端連接是在人類細胞中進行生理性的V(D)J重組的,此外還可以修復由氧化反應或者輻射引起的DNA雙鏈斷裂。如前面所述,非等位同源重組需要具有同源性的DNA片段作為重組底物,而非同源末端連接則是不需要的;另外,非同源末端連接產生以后能夠在連接部位插進若干個堿基。同其他突變機理相比,這兩點是非同源末端連接的主要特征。
某些基于非同源末端連接的拷貝數變異的斷點傾向于落在重復序列內或者其周圍;此外,某些DNA基序可以引起DNA彎曲或導致DNA雙鏈斷裂,如TTTAAA,因此基于非同源末端連接產生的拷貝數變異容易出現在此類位點附近。
3.3 基于DNA錯誤復制的FoSTeS機理可以產生含復雜結構的拷貝數變異
高密度比較基因組雜交芯片技術的發展促進了對拷貝數變異的研究,眾多具有復雜重排結構的拷貝數變異被發現,并且無法被前述的基于DNA重組的機理模型所解釋。為此,有人提出了一種解釋拷貝數變異突變和一些異常人類基因組重排的新機理。
根據“復制叉停滯與模板交換”模型,在DNA復制叉停滯的同時,滯后鏈從模板上脫落,通過微同源序列轉移到另一個復制叉上,然后開始重新合成DNA。兩個要產生模板轉換的復制叉會在空間上接近彼此。新復制叉上錯誤的結合片段最終是正向還是反向出現,這取決于復制叉的方向以及新復制叉中的作為模板是引導鏈還是滯后鏈。除此之外,模板轉換的結果是重復還是缺失,取決于新的復制叉是在起始復制叉的上游還是下游。
研究表明,由于DNA復制錯誤而產生的拷貝數變異在SMS綜合征或PTLS綜合征、佩梅病、LIS1、MECP2等位點上都有被發現。通過“復制叉停滯與模板交換”機理不但可以產生長度高達數Mb的拷貝數變異,還能夠引起單個外顯子水平和基因水平的重排并產生拷貝數變異。“復制叉停滯與模板交換”可以導致基因的重復和外顯子混編,這些過程是驅動基因和基因組進化的主要機制。
拷貝數變異是產生人類遺傳多樣性和個體間遺傳差異的一個重要來源。與單核苷酸多態性相比,拷貝數變異涉及更多的人類基因組序列,具有更高的突變率。基于DNA重組機制(例如非等位同源重組和等位同源重組)與DNA錯誤復制機制(例如“復制叉停滯與模板交換”)的基因組重排可以產生多種類型的拷貝數變異。拷貝數變異與人類復雜疾病相關,也可以導致呈孟德爾遺傳的單基因疾病。但是,由于當前基因組覆蓋率和拷貝數變異研究方法的分辨率的限制,人類基因組中沒有被發現的拷貝數變異還有很多。今后,對拷貝數變異相關疾病以及人類基因組的系統研究,可以使我們對拷貝數變異的形成、分布、進化、生物學效應以及自然選擇等問題產生更加全面認識。
[1]吳志俊,金瑋.拷貝數變異:基因組多樣性的新形式.遺傳,2014,31(4):339~347.
[2]何陽花,俞英,張沅.拷貝數變異與疾病的關系及其在動物抗病育種中的應用前景.遺傳,2013,30(11):1385~1391.
[3]杜仁騫,金力,張鋒.基因組拷貝數變異及其突變機理與人類疾病.遺傳,2015,33(8):857~869.
R394
A
1004-7344(2016)30-0296-02
2016-10-9
胡惠芳(1982-),女,碩士,主要從事生物、化學等相關工作。