梁佳萱
(湖南師大附中梅溪湖中學,湖南 長沙 410205)
人類基因組計劃是分子生物學領域一項承前啟后的偉大工程。一方面,它揭示了人類2.5萬個基因的生物學功能,找到了一千多萬個基因變種,有力支持了經典遺傳學;另一方面,人們也驚奇地發現編碼蛋白質的序列只占人類基因組的1.5%,如此之多的非編碼序列究竟有什么生物學功能?2003年9月,“DNA元件百科全書”(ENCODE)計劃正式啟動,研究發現人類基因組中有75%的序列會被轉錄成RNA,這些轉錄產物中有近74%為非編碼RNA(ncRNA)。
ncRNA長短不一,種類繁多,功能多樣。根據其生物學功能分為兩類:看家型ncRNA和調控型ncRNA。miRNA、piRNA和lncRNA是幾種主要的ncRNA類型,廣泛參與基因轉錄和蛋白合成的調控,對細胞分化、個體發育和疾病發生等生命過程都有重要作用。本論文將對這幾種ncRNA進行分類闡述,分析ncRNA走向臨床應用的幾種可能模式和技術瓶頸,對其應用前景進行展望。
miRNA是一類內源性單鏈RNA分子,其長度只有21~25個核苷酸。成熟的miRNA組裝進RISC復合體中,通過堿基互補配對與目標mRNA的3'UTR結合,并指導RISC對mRNA進行降解或阻遏其翻譯,從而在轉錄后水平上調節基因表達。一種miRNA可以調控幾十到幾百種靶基因的表達,一種基因也可能受到多個miRNA的共同精細調控。截至2014年6月miRBase數據庫共收錄223個物種的35828個成熟miRNA,其中包括人類的2588種miRNA。miRNA序列在不同物種間具有高度的保守性,其表達具有組織特異性和時序性,參與生長發育過程中的多種調節途徑。對miRNA作用機制的深入研究將有望使miRNA成為新的疾病診斷標志物和藥物靶標。
piRNA是一類動物生殖細胞特異的單鏈RNA分子,長度通常為24-30個核苷酸。轉座子是一小段可以在基因組中移動的DNA序列,具有破壞功能基因的潛力,并參與癌癥等多種疾病的發生過程。piRNA一般認為是由轉座子的轉錄產物經過剪切形成的,通過與PIWI家族蛋白結合組成pi-RISC復合物,特異地識別轉座子并抑制其活性,達到維持基因組穩定的目的。piRNA的種類在數百萬量級,其表達同樣具有嚴格的時序性,在精子形成過程中出現了兩次高峰期,分別為前粗線期和粗線期。在粗線期精細胞內mRNA發生大規模降解,其分子機制依賴于pi-RISC介導的數千種mRNA的降解。
lncRNA是一類長度大于200個核苷酸的單鏈RNA分子,與mRNA結構相似,但缺少特異完整的ORF,所以一般認為lncRNA不編碼蛋白質。目前ENCODE數據庫中共收錄人類和小鼠的lncRNA的數量分別是56018條和46475條。有證據表明lncRNA的產生機制可能有以下四種:(1)一個編碼蛋白質的基因被插入另一段DNA序列而停止翻譯,合并成為lncRNA;(2)非編碼基因發生逆轉錄轉座,介導基因重排而產生假基因lncRNA;(3)染色體重排使兩個不轉錄序列合并,轉錄出lncRNA;(4)由ncRNA產生lncRNA。不難推測,lncRNA的序列保守性不是很嚴格,而序列多樣性使其以多種模式參與基因表達和生理代謝調控。
如前所述,lncRNA具有與mRNA非常類似的結構,只是缺少特異完整的ORF,但lncRNA又有著龐大的序列多樣性,所以個別lncRNA就具備了翻譯出蛋白或微肽的能力。2015年,UT Southwestern的Eric Olson實驗室證實了一種骨骼肌特異的lncRNA編碼了一條46AAs的微肽,該微肽形成跨膜α-螺旋,并抑制肌質網膜蛋白SERCA對鈣離子的輸運,調控肌肉收縮。Pri-miRNA是miRNA的前體,Combier JP實驗室在許多pri-miRNA中鑒定出ORFs序列,并進一步預測出氨基酸序列,通過人工合成多肽和抗體進化成功證實了多肽產物的存在。
lncRNA與新基因的產生也有著密切關系。北京大學李川昀實驗室在精細對比恒河猴和人類的基因組、轉錄組之后,發現人類特有的蛋白編碼基因有43個,而猴和黑猩猩等物種基因組的對應區域只轉錄成lncRNA,并沒有翻譯出蛋白質。從猴子的視角看待人類演化的話,具有翻譯潛力的lncRNA已經長期存在,在某些偶然因素作用下翻譯出新蛋白,而新蛋白被賦予新的功能,原DNA序列就成為新基因。顯然,這是一個逆自然選擇的過程,卻為新物種的產生提供了合理的解釋。例如,人類特有的ARHGAP11B基因可以促進人腦干細胞產生更多神經元,腦容量相應擴大,為高級神經活動的發生發展提供基礎。
ncRNA的研究尚處于初級階段,但隨著第二代測序技術的發展與成熟,ncRNA的發現與功能研究呈現井噴式增長。RNA-seq技術可以高通量、無差別、高靈敏地檢測各種RNA的轉錄水平,并開始在細胞亞群和單細胞水平上應用,對ncRNA的基礎研究和臨床應用都提供了重要的技術保障。
ncRNA在臨床上的應用模式主要包括以下幾種:(1)以miRNA、siRNA為基礎的RNA干擾技術可以通過誘導mRNA降解的方式抑制靶蛋白的合成;(2)利用高特異性RNA適體與靶蛋白的結合起到抑制和拮抗的效果;(3)ncRNA廣泛參與疾病的發生發展,同時具有序列保守性和組織特異性,已逐漸成為疾病診斷的新型標志物;(4)ncRNA表現出的重要調控功能也使其成為新藥研發的重要靶標;(5)在腦醫學領域用于克服藥物成癮性和耐藥性。
目前ncRNA的臨床應用尚處于摸索階段,技術方面RNA-seq的成本依然較高,基礎研究方面人們對ncRNA的生物學功能的認識還比較局限,而臨床轉化方面則面臨更多的實際問題,如RNA的脫靶現象、降解問題、轉運吸收和效能評估等。隨著科研工作的推進和技術的革新,這些瓶頸終將被打破,ncRNA必將以豐富多彩的模式在臨床上廣泛應用。
[1] Lauressergues D,et al.Primary transcripts of microRNAs encode regulatory peptides[J].Nature,2015,520(7545):90-3.
[2] Anderson DM,et al.A micropeptide encoded by a putative long noncoding RNA regulates muscle performance[J].Cell,2015,160(4):595-606.
[3] Chen JY,et al.Emergence,Retention and Selection:A Trilogy of Origination for Functional De Novo Proteins from Ancestral LncRNAs in Primates[J].Plos Genetics,2015,11(7):e1005391.