白少川,張樂超, 葛琳涵,郭艷麗,王德賀,李蘭會
(河北農業大學動物科技學院,保定 071000)
內源性逆轉錄病毒(endogenous retrovirus,ERVs)屬于長末端重復(LTR)逆轉座子中的一類,普遍存在于所有脊椎動物的基因組中,是外源性逆轉錄病毒整合在宿主基因組并按孟德爾規律遺傳的基因序列。脊椎動物基因組中ERVs已經嵌入數百萬年,雞[1]、牛[2]、人[3]和鼠[4]基因組中ERVs分別占到1.3%、3.2%、8%和10%。
ERVs是古老病毒感染的“化石”,自侵入宿主生殖細胞后隨世代進化積累了大量突變,以阻止其組裝感染性病毒粒子,不能感染宿主細胞。雖然多數ERVs已經失活,但是有些仍能在宿主基因組中轉座生成大量拷貝。新整合的ERVs對鄰近基因的表達產生調控作用,成為宿主進化的“發動機”,另外,其不受控制的擴展和表達也是對宿主生命的威脅。ERVs整合誘導宿主產生新的適應性遺傳變異和感染抗性,但也產生自發的免疫缺陷、癌變、神經性退行性變化等負面效應[5]?,F代全基因測序和重測序技術積累了大量基因組數據,有利推動了ERVs的進化、功能性、調控機制等研究。本文對ERVs的結構、整合機制、在宿主的表達調控及其進化對宿主功能影響的研究進行綜述,為深入挖掘ERVs與宿主的共進化調控機制提供借鑒和參考。
侵入到宿主的外源病毒,用自身的逆轉錄酶將病毒基因組RNA轉錄為cDNA,利用整合酶將cDNA整合到宿主基因組中,完成自身基因組在宿主細胞的部署。之后,整合的原病毒轉錄為RNA,利用宿主的核糖體機制繁殖后代,產生更多的病毒形成對宿主的感染。一般情況下,逆轉錄病毒僅感染宿主體細胞,偶爾整合進入宿主生殖細胞,則以原病毒基因組形式永久地與宿主細胞DNA相結合,定位保持在染色體組上,并作為宿主基因組的一部分按孟德爾規律進行垂直傳遞遺傳,從而形成了ERVs[4]。ERVs隨宿主基因組世代遺傳,對宿主基因組進化具有重要作用。
ERVs全長7~11 kb,其典型結構為5′ LTR-gag-pol-env-LTR 3′。LTR區在病毒RNA基因組逆轉錄過程中形成,是逆轉錄病毒表達的調控中心,包含有調控RNA轉錄的啟動子、增強子、聚腺苷酸化位點,以及多種轉錄因子結合位點;gag、pol和env是ERV的結構基因,5′LTR區與gag基因間有引物結合位點(PBS),3′LTR區與env基因間有多嘌呤區(PPT)。PBS是逆轉錄過程中細胞tRNA的結合位點,PPT是正鏈DNA生成中引物結合的位點。由于LTR區的同源重組或非同源重組,大多數的ERVs內部編碼區序列缺失,或者只剩下LTR區(solo-LTR),只有極少數整合較晚的ERVs仍保留有完整的基因組結構。
由于ERVs與宿主具有相同的單堿基替換速率(10-9·年-1),比原外源病毒的進化速率(10-3·年-1)慢106,所以保留了外源病毒相似的基因組序列,使ERVs成為逆轉錄病毒基因組的“化石記錄”,從而由ERVs的基因組結構變化可以推斷其與宿主的長期進化關系[6],利用ERVs的整合分析揭示了Kihnu綿羊的古老起源[7]。這些基因序列曾被認為是“冗余廢棄物”或“無用”DNA,不具備任何功能,但是,越來越多的研究發現ERVs參與早期的胚胎發育、腫瘤發生、免疫紊亂以及免疫系統正常功能等生理、病理活動。
雖然重組等變異造成ERVs序列的不完整,但宿主基因組仍有具備完整結構和轉座轉錄活性的ERVs,宿主進化出多種機制嚴密調控成年體細胞和胚胎發育過程逆轉座和ERVs轉錄表達的發生[8]。
ERVs一般陷入在異染色質內,被宿主的第一道防線表觀修飾機制沉默,哺乳動物5-甲基化胞嘧啶是典型的抑制性表觀修飾方式之一[9],DNA的甲基化通過胞嘧啶脫氨基酶家族誘導人ERV(HERV)基因組5-甲基化胞嘧啶脫氨基突變為胸腺嘧啶,導致錯義突變或失活,從而抑制HERV的復制,保持宿主基因組的穩定性[10]。甲基化水平低的2日齡雞法氏囊和心組織ALV-E1表達高于甲基化水平高的35日齡雞的表達,證明了甲基化對ERVs表達的調控作用[11]。Kuse等[12]發現LTR甲基化程度影響貓ERVs的復制能力,并且LTR區的A>T突變影響了啟動子活性,低活性的T型ERVs在貓基因組中生成了更多拷貝。Chung等[13]發現雙重miRNA抑制豬ERV-B的表達效率達到86%。
組蛋白修飾參與沉默早期胚胎干細胞的ERVs表達[14]。組蛋白去甲基化酶(KDM1A)、輔阻抑物(KAP1)和組蛋白去乙?;?HDAC)參與沉默過程,KDM1A沉默ERVs的啟動子,而組蛋白甲基轉移酶(ZFP42)與gag基因表達有關[15-17]。小鼠胚胎細胞的腦池病毒粒子(IAP)沉默是由組蛋白甲基轉移酶(SETDB1)和KAP1介導的,IAP的5′UTR區可能通過KRAB-ZFPs招募KAP1和SETDB1完成沉默[7,18-19]。
外源病毒傾向于整合在細胞的開放染色體,尤其是蛋白編碼基因附近,盡管內源病毒可能具有相似的生物偏好,但人工或自然選擇可能剔除有害的內源病毒元件。Lee等[1]發現雞全長GGERV10(Gallusgallusendogenous retrovirus 10)偏向定位于高AT含量(59.01%vs57.08%)的低基因密度區(3.83vs20.41個基因·Mb-1)。Mason等[20-21]利用obsERVer檢測地方雞基因組974種ALV-E整合,被發現的雞ALV-E增加到1 300種;但只有1.5%整合在基因編碼區外顯子中,顯著低于4.9%的隨機整合頻率。商業種雞群體中編碼區的ALV-E有顯著的剔除特征(26.7%vs51.8%的隨機整合),在蛋白編碼基因上下游10 kb范圍內有8倍的富集特征(32.9%vs4.1%的隨機整合),地方雞群體中分別是40.7%和17.5%[21]。這反映了商品雞比地方雞更強的人工選擇,剔除了有害ALV-E整合,增強了有利效應。
基因組數據分析揭示ERVs一般反向整合于功能基因外部,與隨機整合理論矛盾,由于正向整合對典型剪切信號的潛在干擾,表明宿主自身強的凈化選擇效應[22]。禽EAV-HP反向整合在SLCO1B3基因5′UTR區形成綠殼蛋表型[23],TYR基因內含子4的ALV反向整合造成雞的隱性白羽表型[24]。另外,整合位點側翼poly-A重復與ALV整合連鎖,有色羽不存在poly-A,但紅原雞存在[25]。Poly-A與隱性白羽雞ALV整合的連鎖,側面證明了負向選擇作用,poly-A缺失的ALV整合個體可能由于機體的嚴重危害而被凈化。
ERVs在宿主體內的相對穩定性,以及不同宿主同源序列的保守性表明ERVs和宿主間存在長期進化共生關系。ERVs表達參與哺乳動物的胎盤生成和胚胎發育是被研究最典型的宿主征用功能,其與宿主表型、胚胎發育和免疫調節的關系正被逐漸揭示。
被甲基化、乙?;纫种苹钚缘腅RVs在生殖細胞生成和受精卵發育的重編程時期,轉錄轉座活性失控,ERVs編碼蛋白合胞素就是被哺乳動物馴化為自身細胞功能的很好案例[26]。胎盤形成過程中HERV-W和HERV-FRD的env基因分別生成合胞素1和合胞素2,對胎盤合胞體的形成和維持滋養層細胞的融合起關鍵作用,合胞素發揮病毒編碼蛋白與宿主細胞膜融合的功能。這一功能被哺乳動物征用,使胎盤對母體子宮更具“侵略性”,并且使母體失去對胎兒的免疫排斥,從而為胚胎發育提供了進化優勢[27]。
轉錄組學研究揭示了HERV表達與早期胚胎發育的復雜互作關系,LTR被征用為啟動子或增強子,提供如LBP9、NANOG、OCT4、GCM1、Sp1和GATA等轉錄因子家族的結合位點,調控附近胚胎發育和多潛能維持的功能基因[28]。人和小鼠ES細胞25%的NANOG和OCT4結合位點是由轉座子提供的,并且結合位點附近的基因是這些轉錄因子的功能靶標[6]。早期胚胎干細胞中ERVs轉錄生成lncRNA與OCT4(POU5F1)的反式激活互作,協同促進了特異ERVs表達[29-30],形成復雜的調控網絡精細調控早期胚胎發育。
ERVs的LTR被公認為宿主儲備的潛在順式調控元件,在進化過程被招募參與鄰近基因的轉錄調控。雞的隱性白羽、綠殼蛋、公雞henny性反轉羽毛等表型都是由于ERVs整合影響功能基因表達形成的。TYR基因內含子4中7.5 kb的ALV反向插入引起雞隱性白羽,TYR轉錄產物有多種3′UTR區被截短的異常剪接體,外顯子5缺失,影響了跨膜域的翻譯??赡苄纬闪税麧{型而非跨膜型的TYR,不能正確定位至黑素小體,具有功能活性的黑色素催化合成受損[24]。Chang等[25]發現隱性白羽雞Tyr酶的表達水平明顯低于野生型,但在胚胎皮膚中表達差異不顯著,而10周齡皮膚表達差異極顯著,這說明ALV對宿主細胞基因的表達調控受到細胞環境的影響。長4 250 bp的EAV-HP反向整合在雞1號染色體SLCO1B3基因5′UTR區,發揮增強子作用,SLCO1B3轉錄產物5′末端增加了EAV-HP的24 bp LTR序列[23],并且在雞卵巢和蛋殼腺中的表達量分別增加180和19倍[31],轉運更多的膽綠素到蛋殼,表現綠殼蛋表型。SLCO1B3基因啟動子區甲基化水平與其表達水平及蛋殼綠色深度呈顯著負相關,隨著甲基化水平的提高,CpG5和CpG8位點的甲基化會阻礙轉錄因子與啟動子的結合,從而在產蛋后期降低SLCO1B3的表達并導致蛋殼顏色更淺[32]。Li等[33]發現7 524 bp的ERV整合在雞10號染色體CYP19A1基因的5′UTR區,3′LTR區的TATA box參與CYP19A1的轉錄,形成包含99 bp 3′LTR的CYP19A1轉錄本,并在皮膚組織異位表達,導致公雞性反轉產生henny羽毛特征。ev21整合在雞PRLR基因5′UTR區,PRLR和SPEF2的重復基因與慢羽連鎖[34],但ev21是否與該重復區域的形成有關,是否影響PRLR的轉錄還有待挖掘。
ERVs整合引起其他脊椎動物表型變化。小鼠Agouti基因1C外顯子下游內含子中反向整合5 357 bp 內源逆轉錄病毒VL30,VL30內部有另一種內源逆轉錄病毒β4,兩種內源逆轉錄病毒嵌套整合在Agouti基因的5′UTR區,抑制Agouti基因的正常轉錄,形成純黑色被毛表型[35]。鼠內源白血病毒Emv-3整合在肌球蛋白重鏈基因Myh內含子區,其轉錄剪切發生變化導致小鼠無被毛表型。逆轉錄轉座子插入到PMEL基因導致澳大利亞牧羊犬白色被毛表型[36];7 125 bp的ERV插入KIT基因形成顯性白貓表型[37]。ERVs整合改變插入位點附近功能基因的正常表達,導致宿主表型發生變化。
ERVs進化出多種機制參與宿主免疫調節。人、貓、水貂、大鼠、小鼠等宿主胚胎發育以及生長發育階段ERVs編碼的env蛋白有抵抗外源逆轉錄病毒的感染功能[38-40]。env蛋白通過與外源病毒蛋白競爭細胞表面受體,阻止外源病毒的感染,也能有效塑造T細胞庫和體液反應的抗原[41],還具有超抗原誘發非特異T細胞激活功能[42];gag蛋白能干擾外源病毒侵入后的感染周期,影響病毒粒子的組裝或釋放從而發揮抗病毒感染作用,Fv1蛋白通過與鼠ERVs衣殼結合,阻止衣殼分解和ERVs整合進入細胞染色質[43]。
整合到宿主基因組的ERVs片段,尤其是LTR與誘導干擾素的轉錄調控因子結合,增強免疫基因的表達。整合在TP63基因上游的HERV-9的LTR起到增強子的作用,增強雄性生殖干細胞抗腫瘤能力,并保持生殖細胞的轉錄保真性[44-45]。TP53是重要的腫瘤抑制基因,其編碼的蛋白質p53作為轉錄因子,在體細胞中參與DNA損傷的細胞凋亡過程,因此被視為“基因組的守護者”,人基因組中1/3以上的p53結合位點位于ERVs的LTR區域[46]。綜上表明,宿主招募ERVs的LTR豐富細胞轉錄因子的免疫調控網絡。
另外,ERVs產生的非編碼序列發揮抗病毒或抗感染基因的增強子作用,尤其是其雙向轉錄產物的生成,活化雙鏈RNA沉默途徑發動I型干擾和細胞凋亡。Chen等[47]發現去甲基化試劑處理雞CEF細胞后,ALV-E1轉錄激活,生成反義產物lncRNA釋放到細胞質與TLR3結合并活化其信號途徑,誘導IFN-β相關基因表達發揮抗病毒效應。雞睪丸中有特異piRNA的表達,piRNA序列與ERV mRNA互補配對形成雙鏈,沉默ERVs轉錄后翻譯,因此逆轉座子誘發的病毒到宿主的基因流動可能產生RNA介導的、序列特異性反義免疫記憶,類似CRISPR/Cas系統[48-49]。piRNA生成是ERVs與宿主共進化的結果,家雞ERVs轉錄生成的一類piRNA在原雞中并無表達[50]。ERV轉錄的RNA增加,導致細胞溶質中核酸的堆積,被核酸傳感器識別,誘導細胞產生抗病毒和炎癥反應的雙鏈RNA和cDNA[51]。Hu等[52]發現miR-155抑制了病毒感染過程中env的過表達,從而激發自然免疫。
ERVs主要定位于異染色質,被表觀遺傳沉默而保持穩定狀態,在人體正常組織中沒有轉錄活性,但在癌變細胞、神經性病變組織中,有不正?;虿皇芸刂频腅RVs表達[53-55]。Montesion等[56]對8個HERVs的LTR區序列多態性及其腫瘤細胞轉錄活性進行比較分析,發現整合位點附近啟動子的通讀引發ERVs的轉錄,70%的乳腺腫瘤細胞中ERVs具有轉錄活性,并且其轉錄活性與LTR序列轉錄因子結合性的改變一致,特別是HOX-PBX、RFX3等轉錄因子結合位點的形成。說明整合位點、細胞環境對ERVs轉錄表達的重要性,LTR的序列結構與宿主存在共進化關系。另外,外源病毒生成病毒蛋白增加轉錄因子與LTR的結合性,反式激活ERVs的表達,加重病變[41,57]。
家雞[58]、豬[59]ERVs整合較晚,仍具備轉錄活性和感染性,并能與宿主基因或外源病毒重組形成新的病毒。ALV-E與內源逆轉錄病毒EAV-HP整合形成ALV-J亞型,導致肉雞骨髓性白血病、蛋雞廣譜性腫瘤[60]。MDV疫苗注射能誘導處于沉默狀態的ALV-E1、ALV-E21的表達,誘導淋巴瘤的較高發生率[61]。ALV-E的表達不僅能重組形成新的病毒,還引起家禽肌肉生長率和產蛋率等生產性能的下降。含有產生完整病毒粒子ALV-E10、ALV-E19或ALV-E12的來航雞造成年產蛋率降低8%~9%,蛋重降低2.2 g[62]。Ka等[63]對經過45代選育的高體重和低體重白洛克雞cDNA芯片分析,發現低體重比高體重具有更多的ALV-E整合位點和表達,并且ALV-E高表達與母雞低體重存在保守的相關關系。Chen等[64]對18種ALVEs在我國地方雞、商品蛋雞、肉雞等8個品種中的群體分布檢測發現,ALVEs的整合多態性與家雞的選育方向和選育程度存在關聯。ERVs在越南豬的拷貝數低于西方豬,并存在品種特異性[65]。Chiu和Vanderwoude[66]發現家貓ERVs通過直接或間接的基因調控對外源病毒感染具有宿主保護作用,表明內源逆轉錄病毒的進化效應。
ERVs與宿主進化發育關系研究的難點之一在于:宿主基因組中存在高相似度的ERVs多拷貝序列。雖然測序技術的提高,增加了ERVs定位和序列檢測的準確度,但開展ERVs活性、與鄰近基因的表達關系、表觀調控和染色質狀態等研究首先要明確ERVs的特異性。ERVs作為宿主基因組序列的整合成分,與宿主基因組的長期進化過程中被宿主征用為自身功能,參與免疫調節抑制外源病毒感染、對宿主的健康、疾病等多種生物過程發揮重要作用。探究ERVs在宿主基因組的進化及其調控表達對外源病毒的防控具有指導意義,通過PCR或RFLP技術對宿主ERVs進行檢測,利用基因敲除技術建立無ERVs的家雞或家豬,對轉基因雞、豬器官移植、雞胚疫苗或成纖維細胞制備具有重要意義。