陳語
摘 要:轉座子(TEs)是可以在基因組內移動的DNA序列。TEs可以通過多種機制大幅度地塑造基因組,轉錄本和宿主生物的蛋白組。但是,TEs通常干擾基因并且是宿主基因組不穩定,這樣本質上降低了宿主生物的適合度。理解TEs的基因組的干擾和進化的動態將大大地加深我們對TE介導的生物過程的理解。大部分TE插入在黑腹果蠅中是高度多態的,提供給我們一個很好的系統在群體水平來研究TEs的進化。數十年的理論和實踐的研究已經很好的建立起“轉座-選擇”群體基因模型,此模型假設在TE復制和單純選擇之間的平衡決定TEs在基因組內克隆的數目。在過去的十年中,P元件誘導的wimpy testis-interacting RNAs(piRNAs)被證明是TE在果蠅中活動的主要抑制著。piRNAs的發現革新了我們對TE抑制的理解,因為它揭示了宿主生物已經進化出一種適應性的機制來抵御TE的入侵。大量的項目被實施來理解piRNAs抑制活躍的TEs的分子機制,盡管在此過程中的許多細節仍待進一步的探索。piRNAs和TEs之間的相互作用很好的解釋了在果蠅中I-R系統和P-M系統雜種不育的根本分子機制,這曾困擾進化生物學家數十年。piRNA抑制通路給我們提供了一個無與倫比的系統來研究寄生物和宿主之間共進化的過程。
關鍵詞:piRNA;轉座子;轉座子沉默;“Ping-Pong”循環
1.介紹
雜種不相容常常導致兩亞種之間的生殖隔離,這對選育很重要。雜種不相容的經典基因機制是Bateson-Dobzhansky-Muller模型。在此模型下,當一個祖先種群分化成兩個亞群是,原始的兩個相互作用的基因,在祖先種群中是aa和bb,在兩個亞種中分別進化成AA和bb,aa和BB。如果配子A和B相互不相容,則兩個亞種的雜交后代將會死亡或者不育,導致兩個亞種的生殖隔離。在眾多導致雜種不育可能的機制中,一個重要的形式是外來基因組沖突。當在一個基因組內的基因被不同的機制傳送輸,或者當一個基因通過損害宿主增加其傳輸時,外來基因沖突興起。然后宿主馬上發展策略來抑制這自私的基因元件造成的決定性影響。基因組的沖突常常經常導致雜種不相容或者雜種不育。
轉座子(TEs)代表了一種在幾乎所有生物基因組內的自私元件,而P元件誘導的piRNAs代表sRNAs中的一種,sRNAs在動物生殖細胞中抑制TEs。piRNA通路的發現很好地解釋了長久以來的進化上的觀察,比如導致果蠅雜種不育的I-R系統和P-M系統。在此,我們簡短地總結在生物基因,機制和在模式生物果蠅中piRNAs的功能的研究過程,并且我們討論TEs和piRNAs相互作用可能的進化寓意。
2.TEs
TEs的含量在真核生物基因組中變化廣泛,從1%到80%。根據移動的機制,TEs被分為轉座子和反轉座子。轉座子是在基因組中可移動的DNA片段,可以通過“cut and paste”被轉座到另一個位點,然而反轉座子是通過RNA的反轉錄以“copy and paste”的方式來介導和復制,以致插入新的位點。TEs可以通過水平轉移在物種間穿行。
經過長時間的進化,TEs通過大量的機制形成了宿主基因組的組分。首先,同源TEs的拷貝分散在基因組中可以誘導異位重組。第二,TEs可以被馴化形成編碼蛋白質的基因的新結構域。第三,TEs的適應擴展可以提供新的基序來調控基因表達。TE插入已經被很好的證明是有助于宿主的適應性進化,通過影響周圍基因的表達。盡管TEs很大程度上影響基因組的進化,但是它們基本對宿主有損害,因為:1.破壞編碼和基因的調控區域;2.減少細胞的能量和資源;3.通過異位重組介導細胞錯誤的重排。
TEs在果蠅中已被研究數十年。大約120TE家族已經在D.melanogaster內被識別,這至少占真核生物基因組的5%。在D.melanogaster內有約2000未激活的inaction vation escape 1(INE-1)基因家族的拷貝,即使對于大部分TE家族拷貝的數目在1到300之間。基于這種表達的模式,TEs可以被分為生殖細胞特異,體細胞和介導群體。大部分在果蠅中的TEs是活躍的,并且在D.melanogaster內產生可見表型的突變幾乎50%到80%都是由TEs導致。估計TEs降低了大約0.4%到5%的果蠅適合度。
3.Argonaute蛋白
自從RNA干擾(RNAi)機制被發現,sRNAs的全部內容正在被探究。Argonaute(AGO)蛋白結合sRNAs并且形成RNA誘導的復合物(RISC),在RISC中sRNAs識別帶有互補序列的目標基因,AGO蛋白剪切和抑制目標基因。AGO由四個結構域組成:N末端結構域,PAZ結構域結合RNAs,MID結構域結合mRNA的Cap結構,PIWI結構域對目標基因的剪切至關重要。AGO蛋白很古老并且可以在幾乎所有真核生物中找到,除了Saccharomyces cerevisiae。AGO家族的大小在不同物種中不同,在哺乳動物中有八個基因,果蠅中五個,線蟲中27個。AGO蛋白質被分成三個分支:AGO,PIWI和線蟲特異的AGO(WAGO)分支。微RNAs(miRNAs)和小干擾RNAs(siRNAs)都可以與AGO蛋白結合并且參與在細胞質中的轉錄后基因沉默過程,而PIWI蛋白主要在生殖腺表達,結合piRNAs類沉默TEs。WAGO蛋白在線蟲內參與獨特的RNAi系統。
果蠅的基因組含有五種AGO基因,包括兩個成員來自AGO分支(ago1和ago2)和三個成員來自PIWI分支(piwi,aub和ago3)。定位三種PIWI蛋白質是很困難的。Aub和Ago3位于生殖細胞的細胞核周圍的電子聚集云團中,而Piwi的主要位點是卵的生殖細胞和體細胞的細胞核。在卵發育過程中Piwi也位于細胞質中。這三種PIWI蛋白有強烈的與piRNAs結合的偏好。piRNAs反義的TE轉錄本主要被Piwi和Aub結合,而piRNAs正義的TEs主要被Ago3結合。因為Drosha和Dicer不參與piRNA通路,piRNAs的生物通路不同于miRNAs和內源的siRNAs。piRNA生物起源是很復雜的并且具體的機制需進一步的探究,但是已知Piwi,Aub和Ago3參與piRNA的生成,通過“Ping-Pong”模型來沉默目標。
4.在果蠅中的piRNAs:a snapshot
在果蠅中,piRNAs是23-29nt的sRNAs,主要表達在生殖細胞中。第一個鑒定的piRNAs是重復相關的siRNASA(rasiRNAs),來自于the Y-linked Suppressor of Stellate位于D.melanogaster。這些piRNAs被發現是沉默the X-linked串聯重復的stellate基因。此后,piRNAs被發現作為主要的調節者來抑制果蠅中的TEs和其他模式生物,比如小鼠,大鼠,線蟲和斑馬魚。piRNA的全部序列很復雜,上千個分離的piRNA序列存在于果蠅的基因組上。還有,不同的piRNAs的序列之間沒有結構或者功能的相似,除了第一個核苷酸上的尿嘧啶這個很強的偏差外。在果蠅中,piRNAs通過完美或幾近完美的反義匹配來識別它們的靶標,主要是活躍的TEs的mRNAs。piRNAs通過“Ping-Pong”循環來抑制它們的目標mRNAs。
5.piRNA簇
piRNAs基因組水平的圖譜表明D.melanogaster中大部分piRNAs是來源于離散的位點,也被稱為piRNAs簇。只有小部分piRNAs來自于基因的區域,比如來自tj的3UTR。至少142個piRNAs簇被證實位于D.melanogaster的基因組上并且這些簇聚集在重復序列或者未激活的TE片段。piRNAs簇最高達200kb,并且它們偏好位于異染色體區域,此區域的特質是在組蛋白H3的賴氨酸9的三甲基化(H3K9me3),并且組蛋白H3結合異染色體蛋白1(HP1)。這些異染色體區域通常不易重組,所以降低了單純選擇的有效性,此區域被認為是TEs積累和發展成piRNA簇的“safe harbors”。所以,幾乎所有研究表明異染色體的形成對于piRNAs的正常生成至關重要。
基于成熟piRNAs的線性分布,piRNAS簇被分為“uni-strand”和“dual-strand”簇。“uni-strand”簇含有位于一個基因組線的piRNAs,比如flamenco簇位于X染色體并且長達180kb,這是對應于腺囊滿中的體細胞piRNAs(體細胞在生殖細胞周圍)。“uni-strand”piRNA簇可能被經典RNA轉錄酶2(RNAP2)轉錄。比如,flamenco簇被Ci蛋白質激活并且flamenco的轉錄本前體經歷選擇性剪切后生成各種各樣的piRNA前體。可見一個P因子插入Flamenco的5末端會導致在此簇中的所有轉錄失敗。
“dual-strand”簇產生決大部分D.melanogaster基因組中的piRNAs,產生的piRNAs位于兩條鏈。“dual-strand”簇通常不展示RNAP2轉錄的標記,因為它們缺少明確的啟動子,5甲基-尿嘧啶cap和明確的轉錄終止信號,可能是異染色體蛋白Rhino,Deadlock和轉錄終止輔因子Cutoff形成“RDC”復合物來介導雙鏈piRNA簇在果蠅卵中的轉錄。此外,Rhino,Cutoff和RNA解旋酶UAP56被要求來抑制前體轉錄本的剪接,為了piRNAs。并且,一個piRNAs簇的雙鏈的轉錄被要求為了形成piRNAs的正確產物。
6.初級piRNA的成熟
在卵泡細胞中,只有PiWi表達,沒有Aub或者Ago3。單鏈piRNA簇的轉錄本首先被轉錄到細胞質中的Yb小體內。位于線粒體外膜上的Zucchini(Zuc)剪切長單鏈轉錄本,并且生成piRNA中間物。piRNA中間物的5末端被負載于生殖細胞Yb小體的Piwi上。明顯的piRNAs5端尿嘧啶偏差與Piwi的MID結構域相互聯系。此外,piRNA的3末端被Nibler或者Trimmer和其PIWIs的輔因子修剪形成成熟的長度。當3末端的修剪停在被Piwi保護的piRNA中間物的區域,3末端被Hen1甲基化,形成成熟初級piRNAs的一個2-O-甲基化修飾。在生殖細胞中,成熟的初級piRNAs能夠以轉錄后的方式來識別和摧毀目標轉錄本。許多其他的蛋白質也參與了卵泡細胞中初級piRNAs的成熟。這些蛋白質包括Tudor protein Yb,Vreteno(Vret),Minotaur(Mino),Gasz,解旋酶Armitage(Armi),伴侶因子Shutdown(Shu),還有熱休克蛋白90(Hsp90),其中大部分都錨定在線粒體外膜上。
在生殖細胞中,Vasa和UAP56識別piRNA簇的轉錄本,并且將它們從細胞核轉移到細胞質中。在生殖細胞中,初級piRNA的處理與卵泡細胞中的機制類似,除了Piwi,Aub和Ago3都被表達, 但是只有Piwi和Aub負載成熟的初級piRNA。Aub負載的初級piRNA,與Ago3一起,通過一個“Ping-Pong”循環來產生次級piRNA。
7.“Ping-Pong”循環擴增次級piRNA并且沉默靶標基因
“Ping-Pong”循環是一個在生殖細胞TE抑制中很好的機制。簡單來說,在“Ping-Pong”循環中,一個Ago3相關的piRNA識別一條互補的轉錄本(通常來自于活躍的TE),并且Ago3根據Ago3結合piRNA的10個堿基來剪切靶標基因的位點,然后產生新的被Aub負載的piRNA。這個Aub負載的piRNA反過來又識別和剪切一條互補的TE轉錄本,產生一個與初始Ago3負載piRNA一樣的新piRNA。piRNA在“Ping-Pong”循環過程中被擴增,產生在正義鏈和反義鏈之間10個堿基對的重疊序列。“Ping-Pong”循環同時也消耗了TE的轉錄本,因此沉默了TE。
8.總結和展望
過去的十年,piRNA的發現革新了我們對TE沉默的分子機制的理解。piRNA和TE之間的相互作用很好地解釋了在果蠅I-R和P-M系統的雜交不育。在初級和次級piRNA生產過程中,有多種蛋白質的參與,最重要的是PiWi、Aub和Ago3,并伴隨著“Ping-Pong”循環來擴增次級piRNA。更多新的piRNA的生成是沉默相對應TE的基礎。一些研究表明,piRNA與其蛋白復合物與TE特異性結合后,招募重塑蛋白、DNA甲基化蛋白、組蛋白甲基轉移酶來使TE沉默。
但是,一些基本的問題亟待去進一步的探究。從進化的角度,為什么果蠅選擇了使用piRNA機制來抵抗TE?在piRNA生成和作用的過程中,哪些蛋白質結合了piRNA,對piRNA起什么作用?piRNA如何識別TE,又如何沉默TE?回答這些問題將毫無疑問地幫助我們更好的理解有關piRNA的基本問題,也將有助于從研發有關piRNA的應用,比如對RNA的編輯、對基因的沉默調控等。