王曉樂,馬榮榮,魯鎮飛,馬煒煒
(寧波市農業科學研究院 作物研究所,浙江 寧波 315000)
無論在真核還是原核生物中,基因的表達調控都是發生在轉錄水平和轉錄后水平上的多層次調控,這些過程對生物的生長、發育和生存都至關重要。近年來,關于RNA上化學修飾的研究逐漸使人們認識到這些化學修飾在基因表達調控中的重要性,而對于RNA上的化學修飾的研究被統稱為表觀轉錄組學。
在所有RNA化學修飾中,m6A是真核生物RNA中最常見也是分布最廣泛的表觀轉錄修飾。m6A修飾最早發現于20世紀70年代,當時人們猜測m6A修飾可能是一種mRNA潛在調節因子[1-2]。隨后在酵母的研究中證實了m6A修飾水平是一個動態變化過程,并對酵母的生長發育至關重要。在酵母孢子形成過程中,m6A甲基轉移酶的缺失抑制酵母孢子的形成,并阻斷新個體的發育[3-4]。此后,研究者們逐漸發現m6A修飾具有多種生物學功能。在細胞及組織水平上,m6A影響細胞分化[5-7]、腫瘤形成[8-11]、節律鐘調控[12]、神經發育及其功能行使[13]、果蠅性別決定[14-16]及X染色體沉默(XCI)[17]。在分子水平上,m6A修飾與mRNA的最終命運密切相關,一方面m6A通過破壞m6A所在區域的mRNA二級結構從而提高其附近區域與蛋白的結合能力[18],另一方面m6A同樣具有招募特定蛋白(也被稱為READER閱讀蛋白,如翻譯起始因子eIF3和YTH蛋白)結合mRNA的功能[19-20]。Meyer等[21]研究發現,5′UTR區具有m6A修飾的mRNA能夠招募eIF3蛋白并增強缺失eIF4E情況下的mRNA翻譯過程。由于在環境脅迫或疾病情況下eIF4E的表達受抑制,因此,m6A依賴的eIF3蛋白招募在脅迫條件或疾病狀態下可能至關重要[22]。盡管有若干關于eIF3與m6A互作的報道,但eIF3如何識別m6A并與之互作的分子機理研究卻較少。與此相比,另一類m6A結合蛋白YTH蛋白則已有較為詳盡的研究。本文我們將詳細綜述YTH蛋白在m6A修飾調控RNA過程中的功能多樣性。
1998年Imai等[23-24]通過酵母雙雜交法篩選TRA-2β(剪切復合體的組分)的互作蛋白時發現了第一個YTH蛋白,并將其命名為YT521-B。隨后通過BLAST比對發現該蛋白中一段由140個氨基酸組成的區域在其同源蛋白中高度保守,遂將這一區域命名為YTH(YT521-B homologs)結構域[25],而具有YTH結構域的蛋白也隨之被命名為YTH蛋白。由于YTH結構域與RNA結合結構域RRM具有高度同源性,因此,YTH結構域被認為,可能是新的RNA結合結構域[25]。通過BLAST比對發現,幾乎所有生物中均能找到YT521-B的同源蛋白或具有YTH結構域的蛋白,但秀麗隱桿線蟲Caenorhabditiselegans除外[26]。
前人對于YTH蛋白的研究主要集中在動物(特別是哺乳動物)中,并將動物YTH蛋白分為3大類:YTHDC1(YTH domain-containing protein 1)、YTHDC2(YTH domain-containing protein)和YTHDF(YTH domain-containing family protein)。除YTH結構域外,三者并無氨基酸序列相似性,蛋白大小和結構域排列也存在明顯差異(圖1)。雖然YTHDC1與YTHDC2名字相似但實際上除都具有YTH結構域外,兩者并無同源關系。大部分無脊椎動物僅具有1個YTHDF亞家族的同源蛋白,而大部分脊椎動物則具有3個序列高度相似的YTHDF同源蛋白:YTHDF1、YTHDF2和YTHDF3。與YTHDC2具有多個結構域不同,YTHDF蛋白除C端的YTH結構域外缺乏其他可識別的蛋白結構域,其余部分為一段約350個氨基酸組成的富含P/Q/N的低復雜度區域。

圖1 人YTH家族的蛋白結構域
與動物中的情況不同,植物中YTH蛋白的種類變化更為復雜。首先,通過同源比對發現植物沒有YTHDC2的同源蛋白。其次,多數雙子葉植物具有2個以上YTHDC1的同源蛋白,例如擬南芥具有2個,土豆具有4個;相較而言單子葉植物僅具有1~2個YTHDC1的同源蛋白,如水稻僅具有1個。最后,相較YTHDC1,YTHDF同源蛋白在不同植物(特別是被子植物)之間差異更為顯著。雖然2個不同的研究小組都曾對植物YTHDF進行系統發育分析,并各自將植物YTHDF分為3個分支(Li等將3個分支命名為Group Ⅰ/Ⅱ/Ⅲ,而Scutenaire等命名為YTHDFA/YTHDFB/YTHDFC),但2個研究小組對每個分支的組成并不統一[27-28]。通過對動物及植物YTHDF蛋白進行系統發育分析發現,植物YTHDF蛋白與動物YTHDF蛋白的演化互相獨立,植物YTHDF的3個分支與脊椎動物YTHDF1/2/3并無直接的對應關系(未發表數據)。除同源性差異外,YTHDF同源蛋白的數量在不同植物中也有顯著差異,大豆、番茄、玉米等物種分別具有18、4以及16個。模式植物擬南芥和水稻雖然均具有11個YTHDF同源蛋白,但是兩者的YTHDF蛋白并非全部直系同源[25]。植物中存在大量的YTH蛋白暗示植物YTH蛋白的功能可能更為復雜,有待我們進一步進行研究。
值得注意的是,并非所有YTH蛋白均具有YTH結構域。Devanshi等[29]深入研究不同物種YTHDC2時發現,盡管在大部分多細胞生物中均可發現YTHDC2的直系同源基因,但部分生物(哺乳動物鴨嘴獸,部分鳥類、兩棲類和爬行動物,果蠅以及線蟲)的YTHDC2顯然缺少了YTH結構域。這一研究結果暗示YTHDC2蛋白可能逐漸不再依賴YTH結構域行使其生物學功能。
由于YTH結構域與RNA結合結構域RRM具有高度同源性,YTH結構域被認為同樣具有RNA結合活性[25]。通過交聯免疫沉淀技術(CLIP)研究細胞內YTH蛋白的結合靶標時發現,大部分哺乳動物YTH蛋白能夠與RNA上某個含有m6A修飾的特定模塊相結合[15,18,28]。
迄今為止,大量研究數據顯示動物YTHDF蛋白主要結合在DR[m6A]CH(D=A/G/U,R=A/G,H=A/C/U)模塊上[30],且這一結果與通過meRIP方法測序獲得的動物細胞內m6A的分布情況一致[31]。早期研究認為,哺乳動物YTHDF1和YTHDF2結合于不同的m6A修飾位點上,其重疊部分僅占所有測序位點的60%[32]。但Patil等[32]研究顯示,哺乳動物不同YTHDF蛋白在轉錄組上結合位點的分布與m6A在mRNA上的分布情況完全一致,由此推斷哺乳動物YTHDF蛋白對m6A修飾位點的結合并無偏好性。這一相反結論可能是由于2項研究采用了不同的方式對CLIP數據進行分析。早期研究更關注于不同YTHDF蛋白結合于哪些位點,因此,通過生物信息學方法僅對出現頻率高于閾值的結合位點進行統計。然而這一方法對于閾值附近的結果如何取舍具有一定的隨機性。Patil等[17]的研究則更傾向于關注每個m6A位點上結合的YTHDF蛋白的頻率是否相近,并認為對于每個位點而言YTHDF1/2/3蛋白具有高度相似的結合比例。綜上所述,不同YTHDF蛋白對于具有m6A修飾的RNA并無選擇偏好性。
與動物YTHDF類似,動物YTHDC1與YTHDC2也主要與DRACH(D=A/G/U,R=A/G,H=A/C/U)模塊結合,但與YTHDF蛋白不同的是YTHDC1定位于細胞核中[30],因此,YTHDC1更傾向于結合ncRNA,特別是XIST[17]。而對于大部分m6A位點而言,除在特定條件下或特定類型細胞內,YTHDC2并無m6A結合能力[17],這一結果與部分物種的YTHDC2蛋白丟失YTH結構域相佐證。
雖然植物具有更多YTH同源蛋白,但對植物YTH蛋白的結合模塊研究較少。在研究擬南芥YTHDF蛋白ECT2(Evolutionary Conserved C-Terminal Region 2)的結合模塊時發現,ECT2主要結合在URUAY(R=G>A,Y=U>A)模塊上[33-34]。但對擬南芥莖、葉片及花器官中m6A修飾位點的研究揭示擬南芥m6A修飾位點主要為RR[m6A]CH(R=A/G,H=A/C/U)[35],與動物中的m6A修飾位點相近,而與ECT2的結合模塊不同。這2項相悖的研究結果是否說明其中一方的研究結果存在缺陷呢?值得注意的是,除經典的RRACH模塊外,植物m6A修飾位點還存在其他類型。水稻愈傷組織中m6A修飾主要分布在RAGRAG(R=A/G)模塊上[36],而水稻葉片及玉米幼苗的m6A修飾則主要集中在UGUAMM(M=A/C)模塊上[31,36],其中UGUAMM模塊與ECT2結合的URUAY模塊具有一定程度的相似性。這些研究結果表明,在植物的不同組織中m6A修飾位點不同。結合植物中普遍存在較多YTH同源蛋白,我們推測植物YTH蛋白可能結合于不同的m6A修飾位點上并行使差異化的功能。
對擬南芥ECT2結合模塊(URUAY)進一步研究發現,該模塊位于Poly(A)位點上游30~150堿基處,且包含多聚腺苷酸化相關的UGUA序列,ECT2通過結合URUAY模塊啟動多聚腺苷酸化并維持靶標mRNA穩定性[34],這一結果與動物YTHDF2誘導mRNA降解正好相反,進一步使我們猜測植物YTHDF蛋白可能發揮與動物并不相同的生理生化功能。
m6A修飾不僅存在于mRNA和ncRNA,也存在于18S和28S rRNA,那么YTH蛋白是否結合18S或28S rRNA上的m6A呢?rRNA上的m6A修飾位于一種A-m6A-C模塊序列中[37],iCLIP結果顯示沒有一個YTH蛋白結合在這些位點上[30]。近期對于人類核糖體結構的研究表明,18S和28S rRNA中的m6A位點均被包埋在核糖體亞基內部[38]。因此,iCLIP實驗所顯示的YTH蛋白不與rRNA m6A結合這一結果可能與YTH蛋白無法接觸這些位點有關。
體外實驗證明YTH結構域能夠通過結合m6A進一步與RNA結合[19]。雖然關于YTH結構域和m6A修飾的RNA結合能力的研究結果不盡相同(部分研究認為其結合濃度需達到100~300 nmol,而使用YTHDF2的YTH結構域進行的RNA結合能力實驗僅需1~3 μmol),但相較需要5~10倍濃度才能與YTH結構域結合的未被甲基化的RNA,m6A修飾的RNA的確具有更強的YTH結構域結合能力[39-44]。與大部分僅需較低濃度(nmol級)即可結合的特異性RNA結合蛋白相比[45],YTH結構域結合m6A修飾的RNA的能力并不強,這說明YTH結構域可能并不能獨自與靶標RNA形成穩定的復合體,而是需要N端低復雜度區域序列輔助參與蛋白-RNA的互作。
3個獨立研究小組分別研究了釀酒酵母(Zygosaccharomycesrouxii)甲基化RNA結合蛋白1(MRB1)、人源YTHDC1及YTHDC2與具有m6A修飾的RNA形成復合體的晶體結構[39-41,46],結果表明,MRB1、YTHDC1及YTHDC2的YTH結構域使用了一套相似且保守的m6A識別機制,即m6A的甲基部分被由1個酪氨酸和2個色氨酸組成的芳香族籠狀結構識別(圖2),腺嘌呤本身并不與3個氨基酸中的任何1個發生互作[39]。隨后2個YTHDF蛋白(YTHDF1[42]及YTHDF2[43-44])的晶體結構相繼報道,研究結果顯示,兩者的芳香族籠狀結構與YTHDC1或YTHDC2略有不同,是由3個色氨酸組成,但同樣能夠識別N6-甲基基團。此后在對多個物種的YTH結構域比較后發現,組成籠狀結構的這3個芳香族氨基酸在不同物種中高度保守[30]。

圖示為釀酒酵母MRB1的YTH結構域部分結構,組成芳香族籠狀結構的酪氨酸和色氨酸以球棍模型表示,3個氨基酸共同形成籠狀疏水區域,結合m6A位點上的甲氨基團,m6A中的嘌呤環并不參與疏水互作。
值得注意的是裂殖酵母(Schizosaccharomycespombe)Mmi1蛋白是個例外,Mmi1蛋白雖然具有YTH結構域及芳香族籠狀結構,卻并不與m6A結合,而是結合1個未甲基化的RNA模塊DSR(the determinant of selective removal motif,UUAAAC)[47]。而且,在DSR模塊上添加m6A修飾并不會增強兩者的結合能力,甚至在一些研究結果中反而降低了兩者的結合能力。對Mmi1-DSR復合體的晶體結構研究顯示Mmi1與RNA的結合面不同于典型YTH蛋白-RNA結合面,而是位于另一區域[47]。因此,Mmi1與未甲基化的RNA結合并不需要芳香族籠狀結構的參與。
m6A修飾最為廣泛常見的分子生物學功能是起始mRNA翻譯和介導mRNA降解[48]。除此之外,Patil等[30]認為,m6A以及YTH蛋白還能夠調節可變剪切或基因組沉默等分子生物學過程(圖3)。

A—通過招募SRSF10及磷酸化的SRSF3,YTHDC1啟動特定mRNA前體剪切;B—YTHDC1結合XIST上的m6A誘導X染色體沉默;C—YTHDC1通過招募未磷酸化的SRSF3促進RNA向核外轉運;D—YTHDF1通過與mRNA終止密碼子及3′UTR區域附近的m6A結合,并招募eIF3及其他翻譯起始元件從而調控翻譯過程;E—YTHDF3通過與YTHDF1互作增強YTHDF1介導的翻譯起始;F—YTHDF3引導m6A修飾的轉錄本與YTHDF2結合,進入RNA降解途徑;G—YTHDF2與m6A結合并招募CCR4/CAF/NOT復合體使m6A修飾的mRNA發生脫腺苷化并降解。
3.1.1 YTH蛋白調控可變剪切
在被定義為m6A結合蛋白之前,YTHDC1最初被認為是啟動外顯子包含過程的調控因子[49],而YTH結構域對于行使這一功能是必要的[48]。基于目前對YTH結構域的理解,YTHDC1對于mRNA剪切的調控依賴于與m6A的結合[49]。近期的研究顯示YTHDC1通過招募2種競爭性mRNA剪切因子SRSF3(serine/arginine-rich splicing factor 3)和SRSF10行使其功能[47]。YTHDC1與磷酸化的SRSF3結合會啟動外顯子包含過程[48],而與SRSF10的結合則啟動外顯子跳躍過程(圖3 A)。但是關于m6A直接參與調控可變剪切的證據仍不充分。在METTL3干擾材料中,僅有不足100個含有m6A的外顯子發生了可變剪切[19]。不僅如此,分析METTL3-/-老鼠胚胎干細胞中m6A介導的剪切情況時發現,僅有不足0.5%的外顯子表現出了可變剪切,而其中不足100個外顯子具有m6A位點[5,50]。
雖然哺乳動物細胞中m6A可能并不會影響全部mRNA可變剪切,但在果蠅(Drosophila)中已有確切的報道表明,m6A通過調控Sxl(sex-lethal)的可變剪切影響性別特異性基因的表達[14-16]。果蠅的性別決定過程與Sxl蛋白有關,當全長且具有生物學活性的Sxl蛋白存在時,子代表現為雌性果蠅,而當Sxl無法成功翻譯全長蛋白時則為雄性果蠅。果蠅Sxl轉錄本的第二外顯子中含有1個可提前終止Sxl蛋白翻譯的終止密碼子,因此,雄性果蠅的Sxl基因在翻譯過程中提前終止,無法翻譯出全長Sxl蛋白,最終表現為雄性果蠅。而在雌性果蠅中,第二外顯子內的m6A修飾能夠招募YT521-B(果蠅YTHDC1的直系同源基因)對Sxl轉錄本進行可變剪切,從而在mRNA成熟過程中剪切掉含有終止密碼子的外顯子,最終翻譯出全長Sxl蛋白序列。m6A的缺失會阻斷Sxl轉錄本的外顯子跳躍過程,導致子代中雄性果蠅的數量增加。過表達YT521-B對雄性果蠅而言是致死的[15],推測可能是因為過量表達YT521-B產生了類似雌性果蠅Sxl轉錄本類型,最終抑制了雄性果蠅中msl-2(male-specific lethal 2)基因的表達,導致雄性果蠅中出現異常X染色體劑量補償效應。因此,在果蠅中m6A能夠通過招募YT521-B直接引發特定基因的可變剪切事件。
3.1.2 YTH蛋白介導mRNA外運過程
在海拉細胞系中,YTHDC1介導m6A修飾的mRNA外運過程。YTHDC1首先與m6A結合,進一步與m6A修飾所在的mRNA結合形成mRNA-蛋白復合體(mRNPs),該復合體招募未磷酸化的SRSF3和外運受體蛋白NXF1[51](圖3中C)。值得注意的是SRSF3的磷酸化狀態似乎與其行使的功能有關,YTHDC1與磷酸化的SRSF3結合啟動外顯子包含過程,而與未磷酸化的SRSF3結合則引發mRNA外運[51]。
3.1.3 YTH蛋白影響RNA降解過程
在哺乳動物中,YTHDF2作為m6A閱讀蛋白之一能夠誘導mRNA的降解。在海拉細胞系中,YTHDF2解碼2 000種以上mRNA中的m6A編碼,而敲除YTHDF2會引起這些mRNA含量顯著上升,因此認為,YTHDF2與具有m6A修飾的mRNA的穩定性有關[20]。而這些受YTHDF2調控的mRNA的穩定性與其3′端的多聚腺苷化程度呈正相關,即相比其他mRNA,與YTHDF2結合的mRNA普遍表現出較短的多聚腺苷酸尾部[20]。體外實驗發現METTL3甲基轉移酶缺失時去腺苷化水平顯著降低,這說明YTHDF2調控m6A修飾的mRNA穩定性與m6A修飾直接相關。TFA(Tethering reporter assay)實驗還證明YTHDF2的N端結構域對去腺苷化極為重要[52]。綜上所述,YTHDF2首先通過YTH結構域結合于m6A上,隨后其N端結構域與CNOT1的SH(superfamily homolog)結構域互作,并招募CCR4/CAF/NOT復合體行使去腺苷化功能[52](圖3中G)。早期研究認為,YTHDF2引導mRNA離開多聚核糖體進入p小體(富含mRNA-蛋白(mRNP)復合體,也包含mRNA降解因子,可能是mRNA的降解中心),最終促進mRNA降解[20]。然而近期的研究似乎并不支持這一觀點,Hubstenberger等[53]在p小體中幾乎未觀察到顯著的mRNA降解事件,p小體更可能是作為mRNPs的儲存及分揀中心。這一相悖結果使得我們需要重新考慮YTHDF2介導mRNA進入p小體的重要性。
另外,YTHDF1和YTHDF3也能影響具有m6A修飾的mRNA的穩定性。例如在海拉細胞系中,YTHDF1和YTHDF3引導m6A修飾的轉錄本與YTHDF2結合,進入RNA降解途徑(圖3中F)[26]。然而有趣的是,過表達YTHDF1蛋白24 h后,細胞中m6A/A比值不僅沒有下降,反而上升了24%,推測可能是由于YTHDF1結合m6A修飾的mRNA引導其進入翻譯過程(圖3中D)起到了保護mRNA不被降解的作用[32]。
除mRNA外,YTH蛋白同樣能夠影響其他類型RNA的穩定性。人源YTHDF2能夠與上千種環形內源RNA(circRNA)結合[26]。circRNA是RNA前體經過反向剪接內部重復序列形成的環狀結構RNA。這些circRNA能夠中和miRNA的功能或阻止RNA與蛋白的結合[26]。在敲除YTHDF2的細胞里,circRNA前體的半衰期遠遠短于其他類型的m6A修飾轉錄本。此外,m6A修飾并不影響成熟circRNA的穩定性。這些結果說明YTHDF2可能通過影響circRNA成熟過程或前體的穩定性來調控circRNA[54]。盡管如此,YTHDF2調控circRNA穩定性是否依賴于m6A修飾的腺苷酸殘基仍有待探討。
3.1.4 YTH蛋白影響RNA翻譯過程
除影響RNA穩定性外,哺乳動物YTHDF1能夠解碼m6A修飾并在特定細胞類型或特定環境條件下影響靶標轉錄本的翻譯過程[32,55]。在海拉細胞系中,YTHDF1能夠結合某些mRNA終止密碼子及3′UTR區域附近的m6A,并與48S翻譯起始復合體中的eIF3(eukaryotic initiation Factor 3)互作,進一步招募其他翻譯起始復合體成員及核糖體,從而提高翻譯效率(圖3中D)[32]。
最近的研究顯示,其他YTHDF蛋白結合到報告基因的RNA上也會增強報告基因的翻譯[56]。Shi等[57]發現,在海拉細胞系中YTHDF3通過與YTHDF1協作,促進60%的YTHDF1目標蛋白翻譯,但YTHDF3既不能直接促進翻譯也不能獨自行使該功能。另一關于YTHDF3蛋白的研究也發現,YTHDF3不能獨自起始報告基因的翻譯,但YTHDF3的缺失會降低YTHDF1和YTHDF2對目標RNA的結合能力,同時YTHDF3還能促進YTHDF1起始的蛋白翻譯過程[58]。因此,YTHDF3能通過增強YTHDF1與RNA的特異性結合從而間接提高m6A依賴的翻譯效率(圖3中E)。具有m6A修飾的circRNA的翻譯過程則完全不依賴YTHDF1,但YTHDF3是必需的。YTHDF3通過招募直接結合于IRES(internal ribosome entry sites)上的eIF4G2,起始不依賴eIF4E的翻譯過程[54]。除了YTHDF1/3之外,在鼠睪丸細胞和肝癌細胞中,YTHDF2也參與翻譯調控過程[59-60]。體外TFA實驗證明,YTHDC2降低報告基因表達的同時,卻能誘導報告基因的翻譯。
植物YTH蛋白同樣能夠參與類似過程的調控。擬南芥YTHDF蛋白ECT2定位于細胞核及細胞質中,組學研究表明ECT2同樣與RNA翻譯及降解過程有關,但具體機理仍不清楚。在脅迫條件(主要是熱脅迫及鹽脅迫)下,ECT2和ECT4重新定位于脅迫小體中(類似動物的p小體,主要負責mRNP復合體的儲存與分揀),部分與翻譯相關因子共定位,這說明ECT2和ECT4可能與脅迫響應下的翻譯下調過程有關[34]。與ECT2/4相比,ECT3并未出現這種類型的重新定位,可能是由于ECT3缺失了ECT2/4中富含YPQ的區域,在動物YTHDF蛋白中也發現了這一類似區域的存在。
3.1.5 YTH蛋白參與調控表觀遺傳組
核非編碼RNA(ncRNA)XIST通過包被X染色體并招募染色質修飾因子(chromatin-modifying factors)隨機沉默1條X染色體,因此,在雌性哺乳動物的X染色體沉默(XCI)中扮演著重要角色[61]。XIST至少有76個m6A修飾,YTHDC1通過結合XIST上的m6A從而調控XIST的活性。從胚胎干細胞中移除m6A修飾能夠阻斷XIST介導的X染色體基因沉默[17],同樣缺失YTHDC1也能阻斷XIST介導的X染色體沉默過程,且該表型能被外源添加的YTHDC1-XIST復合體恢復[17]。因此,YTHDC1通過結合XIST的m6A位點誘導X染色體沉默的發生(圖3中B)。
Wu等[62]研究發現,YTHDF2能夠促進KDM6B的降解,而后者則能夠促進多種促炎細胞因子上的H3K27me3去甲基化過程并增強促炎細胞因子的表達。同時H3K27me3也能抑制轉錄過程中腺苷酸上的甲基化過程,KDM6B通過招募m6A甲基轉移酶從而移除靶標基因附近的H3K27me3修飾,并促進新轉錄出來的mRNA上的m6A修飾。這些結果證明在病毒侵染過程中,m6A與組蛋白甲基化存在某種程度上的互作,并共同行使功能。
綜上所述,哺乳動物的YTH蛋白具有相似的分子生物學功能,但其功能是否冗余或是各有分工還需要進一步研究驗證。那么植物中數量眾多的YTH蛋白的分子生物學功能又是什么,相互之間是否冗余?這些問題仍有待進一步研究。
3.2.1 性別決定及生殖系統發育
在小鼠中,YTHDC1對于生殖系統發育至關重要。在雄性小鼠中抑制YTHDC1的活性會導致精原細胞發育受阻,而在卵母細胞中缺失YTHDC1會引起上千種轉錄本發生可變剪切,多聚腺苷酸尾部及3′UTR區域長度改變,最終阻斷卵母細胞成熟,說明YTHDC1對兩性生殖細胞發育都非常重要。在果蠅中,YTHDC1的同源基因YT521-B通過改變下游基因Sxl轉錄本的可變剪切影響子代果蠅的性別[15]。
YTHDC2在哺乳動物生殖細胞中表達量較高,同樣對于雌雄兩性發育起著重要作用[26]。YTHDC2缺陷型小鼠雖然能夠存活,但不論是雄性小鼠或是雌性小鼠均表現為不育,同時睪丸和卵巢發育較正常小鼠更小,這些生殖細胞發育缺陷是由減數分裂缺陷引起的。YTHDC2缺陷型小鼠的生殖細胞形成過程在減數分裂前期I受阻,產生大量異常減數分裂的中期細胞,最終提早進入細胞凋亡過程[63-66]。這些表型與MEIOC(Meiosis specific with Coiled-coil domain)缺陷型小鼠相似,后者可以與YTHDC2直接互作。在雄性或雌性生殖細胞中,YTHDC2與MEIOC共同下調一系列編碼有絲分裂調節因子的mRNA,同時啟動減數分裂相關基因表達[63-64],值得注意的是,這些被下調的mRNA均富含m6A修飾,這說明YTHDC2可能通過結合m6A修飾負調控其目標基因。
3.2.2 干細胞維持與分化
Zhang等[67]研究斑馬魚甲基轉移酶METTL3時發現,該基因對造血干細胞/祖細胞分化過程至關重要,而YTHDF2識別notch1α上的m6A修飾并使之降解,從而抑制內皮Notch信號通路,最終促進造血干細胞/祖細胞的分化。同樣在小鼠中,YTHDF2能夠結合多潛能基因的轉錄本,而這些轉錄本在缺失METTL3的情況下穩定性提高。YTHDF2與這些mRNA的結合開啟胚胎干細胞的“超多能”狀態,阻斷其分化[68]。在肺癌研究中發現YTHDF2通過結合6-磷酸葡萄糖酸脫氫酶3′UTR區的m6A修飾,從而促進6-磷酸葡萄糖酸脫氫酶的翻譯過程并進一步促進肺癌的發生[11]。同時YTHDF2還能通過促進IL11(白細胞介素11)及SERPINE2的mRNA降解從而促進炎癥反應介導的肝癌產生[69]。
在擬南芥中,去甲基化突變體表現出多種表型,包括胚發育停滯、生長抑制、莖尖分生組織異常、根系發生減少及向地性異常等[70-72]。體外和體內實驗均證明擬南芥ECT2能夠直接結合m6A修飾的RNA,且ECT2和ECT3均與葉片發生及發育有關[73]。然而,ECT2/3/4的任何1個單基因突變體并不會表現出顯著的葉片發育缺陷表型,而三突突變體的葉原基中細胞分裂速率受抑制并表現出類似于去甲基化突變體的葉片表型[70,73-74]。這說明擬南芥中ECT2/3/4基因對于依賴m6A修飾的葉片發育調控過程可能是冗余的。除了參與葉片發育過程,ECT2和ECT3蛋白還與表皮毛狀體發育有關。毛狀體是一種生長于葉片上皮的伸長枝狀單細胞,是表皮原細胞停止有絲分裂轉而發生多次核內復制(細胞僅復制不分裂)過程的產物。核內復制的次數直接決定了分枝的數量,正常的成熟毛狀體一般具有3個分枝。單獨缺失ECT2或ECT3功能的擬南芥突變體表現出類似的毛狀體數量及分支增加的表型,而在ect2/3雙突變體中該表型則更為嚴重,說明ECT2和ECT3在毛狀體發育過程中并非完全冗余[27]。在ect2單突變體中,ECT2功能的缺失引起至少3個與毛狀體發生相關的具有m6A修飾的轉錄本發生快速降解或表達下調,造成表皮原細胞核內復制增加1次,產生具有更多分枝的毛狀體[27,34],但ECT2和ECT3調控表皮毛狀體發育的完整分子機理仍有待進一步研究。
3.2.3 神經發育
在小鼠中,YTHDF1對于周圍坐骨神經損傷后軸突再生過程是必需的,而在去甲基化突變體中也能觀察到與YTHDF1缺陷個體相同的表型。這一結果說明,圍繞m6A-YTHDF1行使的功能對周圍神經系統創傷反應非常重要[55]。不僅如此,YTHDF1能夠響應神經刺激,并促進海馬體中神經元細胞內m6A修飾的mRNA的表達,從而影響成年老鼠的學習及記憶能力[75]。
敲除初代培養的神經元細胞m6A閱讀蛋白會引起突觸傳導障礙并產生不成熟的樹突棘[13],沉默YTHDF3使軸突終末分支數量增多、PSD-95簇數量減少、AMPA受體表達降低。由此猜測神經元細胞末梢中的YTH蛋白與所處區域的m6A修飾的轉錄本互作并發揮功能,從而產生強烈的突觸反應。此外還發現YTHDF1能夠調控APC基因的翻譯過程,而后者與神經元形態及神經發育有關。
除YTHDF外,其他YTH蛋白同樣與神經發育有關。與果蠅神經系統中高水平存在的m6A修飾mRNA一致,果蠅神經系統中YT521-B(YTHDC1的同源基因)同樣高表達。YT521-B或Ime4缺陷的果蠅表現出飛行或爬行功能缺陷[14-16]。同時人類基因組計劃也發現YTHDC2的突變是自閉癥譜系障礙的潛在風險因子之一[76]。綜上所述,YTH蛋白對動物神經發育、運動、學習及記憶起著至關重要的作用。
3.2.4 脅迫響應
YTH蛋白在脅迫響應中發揮功能。當溫度升高時,熱休克相關轉錄本的5′UTR端會發生甲基化修飾,細胞質定位的YTHDF2進入細胞核中,與熱休克基因mRNA上5′UTR區域的m6A位點結合從而保護該m6A位點。之后YTHDF2招募eIF3復合體并啟動不依賴于帽結構的翻譯過程[21, 77]。這一過程可能在其他類型的脅迫反應中也存在。此外,在熱脅迫下m6A依賴的circRNA的翻譯水平也顯著升高。當細胞受到紫外線照射時,mRNA 5′UTR區域的m6A水平同樣會顯著升高,但這些m6A修飾以及其閱讀蛋白的功能和作用機理仍未研究清楚[54,78]。
3.2.5 硝酸鹽網絡調控
CPSF30-L是擬南芥YTH蛋白家族的一員,具有典型的DC類型YTH結構域和CCCH類型鋅指結構域。近期研究顯示CPSF30-L能夠調控硝酸鹽吸收、信號轉導、積累、內部運輸及同化過程[79]。在硝酸鹽調控網絡中,CPSF30-L調控數個硝酸鹽響應基因的表達,特別是硝酸鹽轉運蛋白NRT1.1。位于CPSF30-L第3個鋅指結構域的點突變會引起NRT1.1表達水平降低和其3′UTR區域多聚腺苷酸長度縮短,硝酸鹽同化基因表達升高,并且植株硝酸鹽吸收量減少,根系硝酸鹽還原反應增強、氨基酸含量增加[79]。這一表型只能由全長CPSF30-L蛋白來恢復,不具有YTH結構域的CPSF30-S則不能,這說明YTH結構域對CPSF30-L在硝酸鹽代謝網絡調控過程中至關重要,但該過程是否與m6A修飾有關仍有待探索。
從2012年發現m6A閱讀蛋白至今,科研工作者們已經對m6A閱讀蛋白在細胞內的功能進行了大量研究,包括維持正常的細胞活性和促進生殖、生長及發育過程等。YTH蛋白是m6A閱讀蛋白中最為廣泛研究的成員。從先前的研究中我們已經能夠了解到YTH蛋白通過YTH結構域形成的芳香族籠狀結構結合m6A的甲基基團并進一步與RNA結合,從而調控RNA的成熟、定位、翻譯及降解等過程,最終影響生物體干細胞的維持與分化、生殖系統發育、神經發育和逆境響應等一系列過程。然而現有的研究主要還是以動物(特別是哺乳動物細胞系)YTH蛋白為模型,因此,對于YTH蛋白的功能研究仍有許多問題留待我們解決。
對于YTHDF蛋白而言,一個重要的問題就是這些蛋白的功能是冗余的還是分化的。YTHDF1與YTHDF2能夠對同一個轉錄本上的m6A修飾競爭性結合,并產生截然相反的作用——啟動翻譯或降解mRNA。YTHDF蛋白之間也能夠合作,在海拉細胞系中YTHDF3與YTHDF1或YTHDF2結合,輔助后者發揮功能。近期Li等[80]通過X晶體衍射等方法發現YTHDF1/2/3具有相似的與m6A互作模式,認為三者在細胞學功能上存在冗余性。在擬南芥中,ECT2和ECT3均對表皮毛狀體形態建成至關重要,任何一個基因單獨突變都會引起毛狀體分支及數量改變,雙突變體則表現出更為嚴重的毛狀體發育缺陷。這些研究結果說明至少在一些特定發育過程中YTHDF蛋白并非完全冗余。然而就葉片發育角度而言,ECT2/3/4的任何一個基因的單突變體均沒有顯著的表型,僅在三突突變體中能夠觀察到類似去甲基化突變體的葉片形態,因此,在某些過程中YTHDF蛋白的功能似乎又存在冗余性。與哺乳動物僅具有YTHDF1/2/3 3個成員不同,植物YTHDF亞家族數量更多,親緣關系更為復雜,此前的研究將植物YTHDF亞家族分為3個分支[27-28],且不同植物物種在每個分支內部又存在數量不等的YTHDF同源蛋白,分支內同源蛋白之間是否存在功能冗余,分支間功能是否冗余?這些問題值得進一步在植物體內驗證。
此外,YTH蛋白是否均通過與m6A結合行使功能也有待證實。在動物細胞中,YTHDC2定位于細胞質中并受腫瘤壞死因子α的誘導[29,81],推測YTHDC2可能在一些特定的細胞類型中受外界刺激調控。利用自身的解旋酶結構域,YTHDC2解旋缺氧誘導因子1α(HIF1-α)的5′UTR區,增強其翻譯效率[59],但該過程是否與m6A有關仍未知。此外,YTHDF2通過結合核糖體RNA上的m5C從而促進rRNA成熟[82],而YTHDF3則通過結合IGF1R轉錄本上的m1A并下調IGF1R的表達,從而抑制滋養層細胞浸潤過程[83]。不僅如此,擬南芥YTHDC1的同源基因CPSF30-L參與硝酸鹽代謝網絡調控過程,該功能需要YTH結構域的參與,但是否需要m6A修飾的直接結合仍有待進一步證據證實。這些結果揭示YTH蛋白可能能夠通過m6A以外的途徑行使功能。
除了研究YTH蛋白的功能,對于“YTH蛋白是如何被調控的”這一問題仍知之甚少。YTHDF蛋白可能在不同組織類型或特定信號響應中受不同的調控。磷酸化蛋白組學研究揭示在YTHDF蛋白的富P/Q/N區域和YTH結構域附近存在大量磷酸化位點[84]。因此,YTHDF蛋白的翻譯后修飾可能影響了LLPS(liquid-liquid phase separation)形成過程中YTHDF介導的蛋白成簇互作。除了磷酸化修飾,YTHDF蛋白還具有?;揎梉85]。然而YTHDF蛋白上翻譯后修飾的改變是否受到了外源或內源刺激的誘導仍有待進一步研究。如果確實存在外界刺激誘導,那么這些翻譯后修飾的YTH蛋白如何與其他蛋白或mRNA互作以及這些修飾如何影響YTH蛋白的亞細胞定位,這些問題都有待研究。至今為止,沒有一條信號通路直接調控m6A,因此,任何關于YTH蛋白如何受到信號調控的信息都將拓展我們對于m6A調控機制的了解。
對m6A修飾的研究,特別是對m6A閱讀蛋白YTH的研究雖然開展時間較短,但作為一種轉錄后調控機制,m6A修飾的分子機理研究正逐漸體現出其必要性及潛在應用價值。在許多疾病中,例如病毒侵染和不同類型的癌癥,m6A扮演了非常重要的角色[56,86-93]。因此,研究者逐漸對開發針對m6A修飾復合體的小分子抑制劑或m6A競爭性結合小分子產生了新的研究興趣。同樣,深入研究植物(特別是農作物)中數量眾多的YTH蛋白分子作用機理,回答其是如何影響作物生長發育并響應外界環境變化這一問題,對于精確調控作物生長,最終提高作物產量、減少化學肥料及農藥使用至關重要。總而言之,深入研究m6A閱讀蛋白為發掘表觀轉錄組學在藥物研發、作物育種等領域中的應用價值奠定理論基礎。