秦少偉 陸夢婷 周媛媛 呂建兵 王付康 溫永強 趙利峰,2*
(1 塔里木大學生命科學學院,新疆 阿拉爾 843300)(2 塔里木大學塔里木盆地生物資源保護利用重點實驗室, 新疆 阿拉爾 843300)
?
長鏈非編碼RNA在動物和植物中的最新研究進展
秦少偉1陸夢婷1周媛媛1呂建兵1王付康1溫永強1趙利峰1,2*
(1 塔里木大學生命科學學院,新疆 阿拉爾 843300)(2 塔里木大學塔里木盆地生物資源保護利用重點實驗室, 新疆 阿拉爾 843300)
摘要長鏈非編碼RNA(long non-coding RNA, lncRNA)是一類轉錄本長度大于200nt、不編碼或很少編碼蛋白質的RNA。lncRNA能在轉錄、轉錄后、表觀遺傳等多個水平調控基因表達,廣泛參與基因組印跡、染色體重塑、轉錄激活、轉錄干擾、細胞周期等多種生命過程的調控,影響著各種生物學過程,是當前分子生物學和遺傳學研究的熱點。本文圍繞近幾年國內外關于lncRNA的最新研究成果,就其在動物和植物中參與的生物學過程進行了比較,對其分子機制、功能、研究策略及目前研究中面臨的問題等作一綜述,為進一步在動植物領域研究lncRNA的功能和分子機制提供依據和參考。
關鍵詞長鏈非編碼RNA; 功能; 分子機制; 動物; 植物; 研究進展
在經典中心法則中,RNA被認為是連接DNA和蛋白質的紐帶和橋梁。2002年在小鼠cDNA文庫測序中首次發現了長鏈非編碼RNA(long non-coding RNA, lncRNA)的存在[1]。起初也認為lncRNA只是RNA聚合酶II轉錄的副產物,并沒有生物學功能[2]。而人類DNA元件百科全書計劃(encyclopedia of DNA elements, ENCODE)發現只有2%的基因能編碼蛋白質,90%以上則為非編碼RNA(non-coding RNA, ncRNA),其中lncRNA占總RNA的比例達4%~9%[3],這一發現讓人們認識到了lncRNA的重要性。所謂lncRNA是一類轉錄本長度大于200 nt的RNA,其缺少完整的開放閱讀框,本身不編碼或很少編碼蛋白質,在大部分真核生物基因組被轉錄。與mRNA相比,lncRNA表達豐度一般較低,且比mRNA具有更強的組織和細胞表達特異性,它們通過轉錄、轉錄后、表觀遺傳等多個水平調控蛋白質編碼基因的表達,廣泛參與X染色體沉默、基因組印跡、染色體修飾、轉錄激活、轉錄干擾和核內運輸等過程的調控,從而作為功能調控元件在真核生物細胞分化、個體發育等生命過程的基因表達調控中起著極其重要的作用[2,4]。
lncRNA位于細胞核內或胞漿中,與mRNA具有類似的結構特征,具有5′帽子、3′polyA尾巴及選擇性剪接位點等特點[5]。生物體內lncRNA含量豐富、種類繁多,根據其與鄰近蛋白質編碼基因在基因組上的位置和相對方向,將lncRNA分為5類:同義lncRNA、反義lncRNA、雙向lncRNA、內含子lncRNA和基因間lncRNA[6]。目前,短鏈非編碼小RNA(如microRNA、siRNA、piRNA等)的功能和作用機制已經比較清晰,但關于lncRNA特別是植物中lncRNA的研究仍然較少。因此,本文圍繞近幾年國內外對lncRNA的最新研究成果,就其在動物和植物中參與的生物學過程和功能進行比較,對其作用方式、基因表達調控的分子機制、研究策略及目前研究中面臨的問題等作一綜述,希望為后人研究提供參考。
1lncRNA參與的生物學過程和功能
1.1lncRNA參與動物的生物學過程和功能
目前,對動物中lncRNA的研究主要集中在人以及大鼠、小鼠和線蟲等模式生物上。lncRNA廣泛參與動物的發育和疾病產生等生物學過程中,它們通過轉錄水平(如轉錄激活、轉錄干擾等)、轉錄后水平(如核內運輸、與microRNA相互作用等)和表觀遺傳水平(如X染色體沉默、基因組印跡、染色體修飾等)層次影響著細胞分化、個體發育和人類疾病發生等過程。
1.1.1lncRNA參與動物細胞增殖、分化和個體發育
在動物中,lncRNA可以作為激活子或者抑制子參與細胞的增殖和個體發育過程。研究表明,兩類lncRNA能在肝再生中對肝臟細胞增殖和分化發揮重要作用,其中H19-lncRNA能通過其5′端與hnRNP蛋白結合,增強下游c-myc mRNA的穩定性并使之上調表達,形成myc自反饋環路從而促進肝細胞的增殖。而LALR1-lncRNA則通過激活Wnt/β-Catenin信號通路促進肝細胞的增殖[7]。
除了參與細胞增殖外,lncRNA還在胚胎干細胞、神經細胞、肌肉細胞、表皮細胞、成骨細胞和脂肪細胞等多種細胞的分化中起重要作用。研究人員在干細胞研究中發現lncRNA對維持干細胞的多潛能性有重要影響。在小鼠胚胎干細胞的分化過程中lncRNA呈現差異表達,一旦它們的表達被抑制,則會影響胚胎干細胞的整體基因表達譜[8]。在表皮祖細胞向角質細胞分化過程中,ANCR-lncRNA表達量逐漸降低,而把該lncRNA敲除后可以誘導皮膚特異性分化基因的表達[9]。如果抑制紅系祖細胞和神經干細胞中lncRNA的表達,則能夠抑制相應紅細胞和神經干細胞的分化[10]。在肌原細胞向肌細胞的分化過程中,MD1-lncRNA通過與micorRNA-133和micorRNA-135序列的結合,上調這兩個micorRNA的靶基因表達,從而促進肌原細胞向肌細胞的分化。同時,降低MD1-lncRNA表達量也能抑制相應細胞的分化[11]。說明lncRNA的差異表達對維持胚胎干細胞的多功能性有重要影響。此外,在lncRNA對胚胎干細胞分化的調控網絡中發現,lncRNA的表達還受轉錄因子的調節,這些lncRNA進一步與染色質蛋白作用,再調控靶基因的表達和維持胚胎干細胞的多功能性[8]。說明lncRNA與染色質蛋白相互作用也有利于維持胚胎干細胞的多功能性。
lncRNA廣泛參與器官和個體發育的調節。例如大腦中lncRNA呈高水平表達,它們一方面調控著大腦的基因表達,另一方面還調控著其他神經細胞的發育過程。腦源性神經營養因子(brain-derived neurotrophic factor,BDNF)基因在人腦中與TUG1-lncRNA結合,形成雙鏈RNA結構。而TUG1-lncRNA對人眼睛發育過程具有重要作用,一旦其表達被抑制,則會引起視網膜光感受器缺失或外部畸形[12]。lncRNA的表達不但具有細胞和組織特異性,也存在發育階段特異性,僅僅在生物發育過程的特定階段表達。原位雜交分析發現,33個mRNA-like lncRNA在黑腹果蠅胚胎發育過程中呈現高表達狀態,其中16個lncRNA僅在中樞神經或外周神經系統中表達[13]。線蟲發育過程中lncRNA的表達與之類似[14]。說明lncRNA在線蟲和果蠅發育過程中呈現動態表達變化,具有精確的時間和空間表達模式。在胚胎發育研究中,發現一個lncRNA在中胚層向心臟發育過程中起重要的調控作用,它通過表觀遺傳方式調控和維持新生心肌細胞的正常狀態[15]。在生殖細胞的發育中,lncRNA還可通過調控特定基因的開關在復雜的表觀遺傳過程中發揮關鍵作用[16]。
1.1.2lncRNA與人類疾病
截至目前,對動物lncRNA的研究絕大多數集中在人類疾病的相關領域。研究發現,lncRNA序列結構、表達、功能的異常與人類疾病的發生密切相關,包括多種重大疾病,如癌癥、退行性神經疾病等。β-分泌酶(β-secreatase 1, BACE1)是阿爾茨默癥發生過程中的一個關鍵酶,其反義BACE1-AS-lncRNA通過調節bace1表達水平啟動阿爾茨默癥的發生[17]。當與心血管疾病相關的ANRIL-lncRNA表達發生變化時,人類則容易發生冠心病、顱內動脈瘤、2型糖尿病、腫瘤等多種疾病[18]。
lncRNA廣泛涉及很多腫瘤的發生,同一lncRNA又往往與多種腫瘤的發生有關,例如,在人類lncRNA 疾病數據庫(http://202.38.126.151/hmdd/html/tools/lncrnadisease)中顯示HOTAIR-lncRNA能夠參與乳腺癌、結腸癌、肝細胞癌和胃腸間質瘤等腫瘤的發生。一些lncRNA的作用機制也較為清楚,如印跡基因H19-lncRNA具有雙重功能,既有致癌作用,也有抑癌作用,該基因在很多癌癥(如結腸癌、肝癌、膀胱癌、乳腺癌等)都呈現高表達。其中,結腸癌中H19-lncRNA被原癌基因c-myc激活后,能調控c-myc下游基因的表達,同時H19的第一個外顯子轉錄出microRNA-675,又可降低腫瘤抑制基因rb1的表達,最終導致腫瘤的產生[19],但目前對lncRNA的這種雙重作用的產生機制尚不清楚,可能與自身特性或環境因素有關。在對前列腺癌的研究中,發現ANRIL-lncRNA的表達水平與前列腺癌發生呈正相關[20],表明ANRIL-lncRNA可能是前列腺癌產生的一個誘導因子。與之相似,HOTAIR-lncRNA在乳腺癌組織中的表達水平是正常乳腺組織的2 000倍[21],說明該lncRNA的超高水平表達可能與乳腺癌細胞的遷移率和存活率有關。通常,MALAT1-lncRNA在人類正常組織中維持低表達水平,而在乳腺癌、前列腺癌、結腸癌、肝癌和子宮頸癌等腫瘤中均上調表達[22]。上述這些結果表明lncRNA在組織中的異常表達代表了人類疾病構架的一個新層面,將來可能會成為疾病的診斷和治療的一個指標和手段。
1.2lncRNA參與植物的生物學過程和功能
與動物相比,植物lncRNA的研究目前仍然處于起步階段。迄今為止,只在擬南芥、小麥、玉米、大豆和水稻等幾種植物中發現了近10 000多個lncRNA,占總已發現lncRNA的1%,它們在指導生殖發育、生長發育、逆境脅迫響應、染色體修飾以及與小RNA關系中均起著重要作用。
1.2.1lncRNA參與植物的生殖發育
lncRNA可以影響植物的生殖發育,主要表現在影響植物開花、雌雄分化以及花粉發育等的過程。成花轉變是植物生殖發育的關鍵階段,受春化途徑等多種因素的影響。在春化途徑中,目前研究最清楚的是開花抑制因子(flowering locus C, FLC)- lncRNA,它是了解植物lncRNA功能的主要來源。FLC能夠抑制植物開花基因的表達,春化過程誘導該基因產生兩個lncRNA:COOLAIR和COLDAIR,其中,前者為flc的天然反義轉錄本,在春化初期表達迅速上升。后者則由flc基因的第一個內含子轉錄,在春化開始后的低溫環境下表達水平持續升高。COOLAIR-lncRNA與其他蛋白(如CSTF77和CSTF64等)相互作用沉默flc正向轉錄本的轉錄,從而抑制flc的表達促進植物開花。COLDAIR-lncRNA的作用機制與動物中HOTAIR-lncRNA相似,能夠招募甲基轉移酶PRC2到flc,維持flc處于沉默狀態,從而使光周期途徑順利進行并誘導快速開花[23]。上述結果說明COOLAIR和COLDAIR這兩個lncRNA在植物春化過程的不同階段對成花產生影響。同時暗示,依賴于一定條件或發育階段的作用方式中,通過基因3′端反義轉錄調控相應的正義轉錄,可能是lncRNA一種普遍存在的作用機制。在水稻RNA-Seq數據中,前人發現2 063個lncRNA中的大多數在水稻生殖過程中均優先表達,部分lncRNA還能誘導水稻產生生殖缺陷[24]。黃瓜中CSM10-lncRNA只在雄株中具有表達優勢,說明它可能在雄性分化中起作用[25]。高粱中ZM401-lncRNA主要在花藥(特別是絨氈層細胞及小孢子)中表達,一旦把該基因敲除后,則能夠顯著影響花藥發育相關基因的表達[26]。
1.2.2lncRNA參與植物的生長發育
研究表明,lncRNA與植物的發育過程密切相關,很多lncRNA在植物器官發育的特定階段產生,具有強烈的組織和細胞特異性。GMENOD40-lncRNA被發現在豆科植物根瘤和水稻莖中特異表達,它分別參與豆科植物根瘤的形成以及水稻器官的分化和微管組織的形成[27]。CSM10-lncRNA則在黃瓜不同組織、不同發育階段和不同光照周期都有差異表達,可能參與這些組織生長和發育過程的調控[25]。本課題組從胡楊異形葉RNA-Seq測序數據中,發現并鑒定了3 013個在胡楊披針形和寬卵圓形葉發生中差異表達的lncRNA,進一步功能分析發現這些lncRNA與調節葉片長度和寬度相關基因的表達密切相關,說明lncRNA在胡楊異形葉發生過程中起著重要的調控作用。這些結果暗示lncRNA在植物器官的生長發育過程中發揮著非常重要的調控作用。
1.2.3lncRNA與植物的脅迫響應
在植物對不良環境因素脅迫響應過程中,lncRNA發揮著重要作用,它參與生物脅迫(如病原體感染)和非生物脅迫響應。在生物脅迫響應方面,目前小麥中已經鑒定出125個參與白粉菌感染和熱脅迫響應相關的lncRNA,它們與擬南芥中lncRNA作用相似,在小麥對生物和非生物脅迫中起重要作用[28]。對擬南芥進行干旱、寒冷、高鹽或脫落酸等處理后, 1832個lncRNA被發現其表達量較對照組發生了顯著改變,甚至比對照組上調22倍[29],說明lncRNA在植物非生物脅迫應答中起重要作用。在非生物脅迫響應方面,目前在擬南芥中發現主要有IPS1、AT4和NPC536等幾個lncRNA參與非生物脅迫的應答反應。其中,當磷酸鹽饑餓時能誘導IPS1-lncRNA和AT4-lncRNA的表達,它們作為誘導物可以結合ath-miR399干擾ath-miR399與其靶基因pho2的結合,從而抑制該microRNA對pho2的降解作用,并調節磷酸含量的動態平衡[30]。當受磷酸鹽饑餓和鹽脅迫的誘導時,根部和葉中NPC536-lncRNA的表達量都會升高,其中鹽脅迫時NPC536-lncRNA的上調表達能夠促進擬南芥主根系和次生根長度的生長[31]。說明這些lncRNA是植物非生物脅迫響應中重要的調節因子,使植物能夠適應不良的生存環境。
2lncRNA調控基因表達的分子機制
lncRNA能夠參與生物體各種生命活動過程中,其通過多種作用方式調控基因的表達,主要表現在調控網絡覆蓋轉錄水平、轉錄后水平、翻譯水平以及表觀遺傳水平等方面(圖1)[32]。

圖1 LncRNA功能的作用機制
2.1lncRNA對轉錄水平的調控
2.1.1lncRNA調控鄰近基因的轉錄
當基因組中lncRNA在與下游基因位置鄰近時,依賴其與下游基因相對位置或序列特征,當lncRNA自身轉錄時,能夠穿過下游靶基因啟動子區,干擾轉錄因子與啟動子的結合,從而以順式作用方式調控靶基因的轉錄。例如,酵母中SRG1-lncRNA在轉錄延伸時橫跨ser3的啟動子序列,占據啟動子與RNA聚合酶II的結合空間,從而抑制ser3的表達[33]。
2.1.2lncRNA與轉錄因子的相互作用
生物體內lncRNA和轉錄因子相互作用的方式有多種,它們能夠通過激活轉錄因子、招募轉錄因子至靶基因啟動子、促進轉錄因子寡聚成復合物或改變轉錄因子的亞細胞定位等方式調控靶基因的轉錄。例如,p21-lncRNA可以通過與p53共激活因子hnRNPK的結合,抑制其靶基因的表達[34]。活化的T細胞核因子(nuclear factor of activated T cell, NFAT)通常位于細胞質中,當鈣依賴信號通過NFAT的非編碼抑制因子(noncoding repressor of NFAT, NRON)-lncRNA內高度保守的莖環結構把NFAT從細胞質導入細胞核內后,NFAT能夠激活靶基因的轉錄[31]。
2.1.3lncRNA作為增強子進行調控
在人類細胞系研究中,發現lncRNA還具有類似增強子的功能,其轉錄可以促進相應基因的表達,這些lncRNA被稱為增強子RNA(enhancer RNA, eRNA)。如人類CCAT1-L-lncRNA位于myc基因上游515kb區域,當該lncRNA被轉錄時能夠遠程顯著增強myc的轉錄[35]。
2.2lncRNA對轉錄后水平的調控
2.2.1lncRNA作為小RNA的前體
lncRNA可以通過加工剪切產生非編碼小RNA(短鏈非編碼RNA)。除snRNA外所有種類的小分子RNA都富含lncRNA的外顯子,特別是snoRNA,證明lncRNA可能是功能小RNA的前體,例如H19-lncRNA是調控抑癌基因(retinoblastoma, RB)miR-675的前體[36]。
2.2.2lncRNA參與RNA的剪切加工
除作為非編碼小RNA前體外,lncRNA還影響其他RNA的加工過程,如參與mRNA前體的剪切,對mRNA加工過程進行轉錄后調控。如MALAT1-lncRNA可以通過影響絲氨酸/精氨酸剪切因子(serine/arginine splicing factors, SR)的定位和磷酸化方式調控mRNA前體的可變剪切[37]。
2.2.3lncRNA吸附microRNA
lncRNA其中一個重要的功能是與microRNA結合,抑制后者發揮作用,從而保護相應靶mRNA免受microRNA介導的抑制或降解,這類lncRNA被稱為內源性競爭RNA(endogenous competing RNA, ceRNA)。目前越來越多的lncRNA被發現能夠作為ceRNA對基因表達發揮調控作用。如肝癌中高表達的lncRNA可與microRNA-372結合,抑制其靶基因cAMP依賴蛋白激酶β(protein kinase, cAMP-dependent, catalytic, beta, PRKACB)的表達,影響cAMP反應元件結合蛋白(cAMP-response element binding protein, CREB)的磷酸化[38]。IPS1-lncRNA與microRNA相互作用,可競爭性抑制microRNA對其靶基因的降解[39]。
2.2.4lncRNA影響mRNA的穩定性和降解
最近研究表明,lncRNA對mRNA的穩定性和降解起著輔助作用。細胞質中lncRNA識別并影響mRNA包括半衰期和翻譯等的生命活動周期。例如,lncRNA可以和Staufen1蛋白(STAU1)相互作用促進mRNA的降解[40]。
2.3lncRNA對翻譯水平的調控
人們在研究lncRNA對蛋白質翻譯的影響時發現,lncRNA可以輔助mRNA翻譯或輔助抑制翻譯。如反義UCHL1-lncRNA的表達能提高UCHL1的蛋白含量,但不改變mRNA的表達水平。p21-lncRNA被發現能通過抑制RNA穩定蛋白Hu抗原R(Hu antigen R, HuR)的活性,從而抑制其靶基因jun b原癌基因(jun B proto-oncogene, JUNB)和鈣黏著相關蛋白(cadherin-associated protein, CTNNB1)mRNA的翻譯[40]。
2.4lncRNA對表觀遺傳水平的調控
lncRNA對表觀遺傳水平的調控最早是在女性X染色體隨機失活現象中發現的[33]。現在研究表明,lncRNA在組蛋白修飾、DNA甲基化和染色體重塑等表觀遺傳修飾過程均起著重要作用,它們通過結合并募集特定表觀修飾酶復合物至靶基因區域,改變靶基因染色質或DNA修飾狀態從而影響靶基因的表達。
2.4.1lncRNA參與組蛋白修飾
組蛋白修飾修飾方式有多種,如組蛋白甲基化、乙酰化、磷酸化、糖基化和泛素化等,不同修飾方式對基因表達的影響不同。例如,父源染色體特異表達的AIR-lncRNA能夠聚集在其上游溶質載體22家族成員3(solute carrier family 22 member 3, SLC22α3)基因的啟動子區,招募H3組蛋白第9位賴氨酸(histone H3 lysine K9, H3K9)特異性甲基轉移酶G9a,使H3K9甲基化,導致染色質濃縮形成異染色質,導致與RNA聚合酶II的結合能力降低,使父源染色體上的等位基因slc22α3、slc22α2和ig/2r沉默[41]。又如HOTAIR-lncRNA的5′端和3′端可以分別結合不同組蛋白修飾復合物PRC2和LSC1,前者促進組蛋白甲基化,后者則使組蛋白脫甲基化,它們分別決定著不同靶基因特異性組蛋白的修飾模式[42](圖2)。

圖2 HOTAIR-lncRNA調控組蛋白甲基化和去甲基化狀態 HOTAIR表示HOTAIR-lncRNA。
2.4.2lncRNA與DNA甲基化
lncRNA在轉錄水平對表觀遺傳學的影響除了對染色質修飾外,還表現在通過使DNA甲基化抑制基因的表達。如核糖體DNA(rDNA)中一些拷貝具有轉錄活性,而另一些拷貝由于DNA的甲基化則處于沉默狀態。由rRNA基因間隔區轉錄成的pRNA(promoter RNA)又結合到rDNA的啟動子區,形成RNA/DNA/DNA三聯體復合物,該復合物能夠招募DNA甲基化酶3(DNA methyltransferase 3, DNMT3),作用于lncRNA使DNA發生甲基化,從而抑制基因的表達[4]。
2.4.3 lncRNA與染色體重塑
lncRNA在轉錄水平能夠作為招募染色質修飾物的支架,與染色體修飾復合物相互作用引起染色體重塑,導致表觀遺傳學沉默,這也是導致X-染色體失活的主要原因。目前發現,在人類3 300個基因間lncRNA中,約20%能與染色質修飾復合物結合,調控染色質重塑、影響基因表達和參與體內其他多種生命活動過程。例如長度約17kb的XIST-lncRNA,其5′端含有高度保守的repa序列,當XIST-lncRNA表達上調時,repa序列能夠招募大量的染色體重塑復合物PRC2沿X染色體擴展,最終覆蓋整條染色體基因表達的關鍵位點,導致基因表達沉默[43]。
3lncRNA的研究策略和方法
與蛋白質和DNA相比,lncRNA的穩定性較差、易降解,且表達豐度也遠低于mRNA。而與microRNA相比,lncRNA長度則更長,并存在二級結構,功能發揮方式更復雜。因此為了揭示lncRNA的分子作用機制,除了常規方法外,近年來逐漸發展和建立了lncRNA特有的實驗技術和相關數據分析方法。
以目前lncRNA研究較多的動物和醫學領域為例,其lncRNA的基本策略有3個步驟:(1)lncRNA鑒定和表達的高通量分析。其中,微陣列芯片和RNA-seq是使用較多的兩種成熟技術,依賴現有的lncRNA數據庫(如目前注釋最全的NONCODE數據庫),對lncRNA進行表達差異、共表達、新lncRNA預測以及lncRNA生物學功能預測等生物信息學分析;(2)高通量分析所得lncRNA表達結果的驗證。利用Northern blot、實時熒光定量PCR(qRT-PCR)、RNA熒光原位雜交、RNA干擾和免疫共沉淀等常規技術對lncRNA表達進行驗證;(3)目標lncRNA的生物學功能和作用機制研究,包括功能獲得性研究和功能缺失性研究。相比之下,lncRNA在植物領域的研究策略和方法相對較為滯后,目前只在擬南芥、蒺藜苜蓿、水稻、玉米中進行了全基因組lncRNA的檢索、鑒定和相關研究,其中利用表達譜芯片、RNA-seq和qRT-PCR等技術在擬南芥中鑒定出成6 000多個lncRNA,并對這些lncRNA在不同環境和發育階段的表達譜進行分析,確定了特定lncRNA在特定環境和階段的特定功能[44]。這一研究策略為在其他物種中鑒定lncRNA提供很好的借鑒。
4lncRNA目前研究中面臨的問題
由于lncRNA在生物體內結構特征和作用機制的多樣性和復雜性,目前對lncRNA功能和分子機制的研究仍然只是冰山一角,特別是植物lncRNA的研究還處于探索和起步階段,面臨著許多亟待解決的問題,主要表現以下幾個方面:(1)lncRNA的定義仍存在爭議。一般認為長度大于200nt的非編碼RNA即為lncRNA,但有學者認為生物體內小于200nt的非編碼RNA有很多,它們既不屬于小RNA,也不屬于結構RNA,對其歸類仍不清楚[45];(2)對lncRNA生物學功能的闡明并非易事。由于lncRNA種類和功能的多樣性,使得不同lncRNA的研究結果相互借鑒的可能性較小。另外功能性和非功能性lncRNA的區分也存在困難,而且對功能研究的思路尚不成熟;(3)lncRNA尚無統一的命名原則。對目前發現的lncRNA只是根據其功能、結構特征、作用方式等進行命名。現在lncRNA仍然沒有一個國際規范的命名方法和原則;(4)lncRNA數據庫不夠完善。對lncRNA的研究相比其他非編碼RNA研究相對較晚,目前lncRNA相關數據庫內容和注釋尚不健全,特別是植物lncRNA相關數據更是寥寥無幾;(5)目前開發的lncRNA功能預測工具不多,特別是針對其二級結構和靶基因預測的工具極少;(6)針對lncRNA研究的新技術和獨特技術較少,極大限制了目前lncRNA的研究;(7)對lncRNA的研究領域有待拓展。如前所述,目前對lncRNA的研究主要集中在動物的腫瘤和發育領域,植物的生長發育及抗逆性等領域,其中腫瘤領域更是占全部lncRNA研究的60%以上,而在其他領域的研究極少。因此,針對不同lncRNA的結構特征和作用機制,建立更多、更有效的技術體系是今后一段時間系統研究lncRNA的一個重要研究方向。
參考文獻
[1]Okazaki Y, Furuno M, Kasukawa T, et al. Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs[J]. Nature, 2003, 420(6915): 563-573.
[2]Rinn J L, Chang H Y. Genome regulation by long noncoding RNA[J]. Annual Review of Biochemstry, 2012, 81: 145-166.
[3]Birney E, Stamatoyannopoulos J A, Dutta A, et al. Indentification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project [J]. Nature, 2007, 447(7146): 799-816.
[4]Batista P J, Chang H Y. Long noncoding RNA: cellular address codes in development and disease [J]. Cell, 2013, 152(6): 1298-1307.
[5]Krell J, Frampton A E, Mirnezami R, et al. Growth arrest-specific transcript 5 associated snoRNA levels are related to p53 expression and DNA damage in colorectal cancers[J]. PLoS One, 2014, 9(6): e98561.
[6]Ponting C P, Oliver P L, Reik W. Evolution and functions of long noncoding RNA [J]. Cell, 2009, 136(4): 629-641.
[7]徐丹. 肝再生過程中LncRNA調控肝細胞增殖的機制研究[D]. 上海: 第二軍醫大學基礎部, 2013.
[8]Guttman M, Donaghey J, Carey B W, et al. lincRNA act in the circuitry controlling pluripotency and differentiation[J]. Nature, 2011, 477(7364): 295-300.
[9]Kretz M, Siprashvili Z, Chu C, et al. Control of somatic tissue differentiation by the long non-coding RNA TINCR[J]. Nature, 2013, 493(7431): 231-235.
[10]Ng S Y, Johnson R, Stanton L W. Human long non-coding RNA promote pluripotency and neuronal differentiation by association with chromation modifiers and transcription factor[J]. EMBO J, 2012, 31(3): 522-533.
[11]Cesana M, Cacchiarelli D, Legnini I, et al. A long noncoding RNA controls muscle differentiation by functioning as a competing endogenous RNA[J]. Cell, 2011, 147(2): 358-369.
[12]Pruunsild P, Kazantseva A, Aid T, et al. Dissecting the human BDNF locus: bidirectional transcription, complex splicing, and multiple promoters[J]. Genomics, 2007, 90(3): 397-406.
[13]Inagaki S, Numata K, Kondo T, et al. Identification and expression analysis of putative mRNA-like non-coding RNA in Drosophila[J]. Genes Cells, 2005, 10(12): 1163-1173.
[14]Deng X X, Meller V H. Non-coding RNA in fly dosage compensation[J]. Trends Biochem Sci, 2006, 31(9): 526-532.
[15]Klattenhoff C A, Scheuermann J C, Surface L E, et al. Braveheart, a long noncoding RNA required for cardiovascular lineage commitment[J]. Cell, 2013, 152(3): 570-583.
[16]Sasaki H, Matsui Y. Epigentic events in mammalian germ-cell development: reprogramming and beyond[J]. Nat Rev Genet, 2008, 9(2): 129-140.
[17]Faghihi M A, Modarresi F, Khalil A M, et al. Expression of noncoding RNA is elevated in Alzheimer’s disease and drives rapid feed-forward regulation of β-secretase[J]. Nat Med, 2008, 14(7): 723-730.
[18]Ahmed W, Ali I S, Riaz M, et al. Association of ANRIL polymorphism (rs1333049:C﹥G) with myocardial infarction and its pharmacogenomic role in hypercholesterolemia[J]. Gene, 2013, 515(2): 416-420.
[19]Gibb E A, Brown C J, Lam W L. The functional role of long non-coding RNA in human carcinomas[J]. Mol Cancer, 2011, 10(1): 38.
[20]Yap K L, Li S D, Munoz-Cabello A M, et al. Molecular interplay of the noncoding RNA ANRIL and methylated histone H3 lysine 27 by polycomb CBX7 in transcriptional silencing of INK4α[J]. Mol Cell, 2010, 38(5): 662-674.
[21]Gupta R A, Shah N, Wang K C, et al. Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J]. Nature, 2010, 464(7291): 1071-1076.
[22]Tano K, Mizuno R, Okada T, et al. MALAT-1 enhances cell motility of lung adenocarcimoma cells by influencing the expression of motility-related genes[J]. FEBS Lett, 2010, 584(22): 4575-4580.
[23]Kim D H, Sung S. Environmentally coordinated epigenetic silencing of FLC by protein and long noncoding RNA components[J]. Current Opinion in Plant Biology, 2012, 15(1): 51-56.
[24]Zhang Y C, Chen Y Q. Long noncoding RNA: new regulators in plant development[J]. Biochem Biophys Res Commun, 2013, 436(2): 111-114.
[25]Cho J, Koo D H, Nam Y W, et al. Isolation and characterization of cDNA clones expressed under male sex expression conditions in a monoecious cucumber plant (Cucumis sativus L. cv. Winter Long) [J]. Euphytica, 2005, 146(3): 271-281.
[26]Ma J, Yan B, Qu Y, et al. Zm401, a short-open reading-frame mRNA or noncoding RNA, is essential for tapetum and microspore development and can regulate the floret formation in maize[J]. J Cell Biochem, 2008, 105(1): 136-146.
[27]Heo J B, Lee Y S, Sung S. Epigenetic regulation by long noncoding RNA in plant[J]. Chromosome Research, 2013, 21(6-7): 685-693.
[28]Xin M, Wang Y, Yao Y, et al. Identification and characterization of wheat long non-protein coding RNA responsive to powdery mildew infection and heat stress by using microarray analysis and SBS sequencing[J]. BMC Plant Biol, 2011, 11: 61.
[29]Liu J, Jung C, Xu J, et al. Genome-wide analysis uncovers regulation of long intergenic noncoding RNA in Arabidopsis[J]. The Plant Cell Online, 2012, 24(11): 4333-4345.
[30]Li L, Eichten S T, Shimizu R, et al. Genome-wide discovery and characterization of maize long non-coding RNA[J]. Genome Biology, 2014, 15(2): R40.
[31]Willingham A T, Orth A P, Batalov S, et al. A strategy for probing the function of noncoding RNA finds a repressor of NFAT[J]. Science, 2005, 309(5740): 1570-1573.
[32]Ogawa Y, Sun B K, Lee, J T. Intersection of the RNA interference and X-inactivation pathways[J]. Science, 2008, 320: 1336-1341.
[33]Pruneski J A, Hainer S J, Petrov K O, et al. The Pafl complex represses SER3 transcription in Saccharomyces cerevisiae by facilitating intergenic transcription-dependent nuclesosome occupancy of the SER3 promoter[J]. Eukaryot Cell, 2011, 10(10): 1283-1294.
[34]Huarte M, Guttman M, Feldser D, et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response[J]. Cell, 2010, 142(3): 409-419.
[35]Xiang J F, Yin Q F, Chen T, et al. Human colorectal cancer-specific CCAT1-L lncRNA regulates long-range chromatin interactions at the MYC locus[J]. Cell Res, 2014, 24(5): 513-531.
[36]Tsang W P, Ng E K, Ng S S, et al. Oncofetal H19-derived miR-675 regulates tumor suppressor RB in human colorectal cancer[J]. Carcinogenesis, 2010, 31(3): 350-358.
[37]Tripathi V, Ellis J D, Shen Z, et al. The nuclear-retained noncoding RNA MALAT1 regulates alternative splicing by modulating SR splicing factor phosphorylation[J]. Mol Cell, 2010, 39(6): 925-938.
[38]Wang J, Liu X, Wu H, et al. CREB up-regulated long non-coding RNA, HULC expression through interaction with microRNA-372 in liver cancer[J]. Nucleic Acids Res, 2010, 38(16): 5366-5383.
[39]Fatica A, Bozzoni I. Long non-coding RNA: new player in cell differentiation and development[J]. Nature Reviews Genetics, 2014, 15(1): 7-21.
[40]Hadjiargyrou M, Delihas N. The intertwining of transposable elements and non-coding RNA[J]. Int J Mol Sci, 2013, 14(7): 13307-13328.
[41]Magistri M, Faghihi M A, St Laurent G 3rd, et al. Regulation of chromatin structure by long noncoding RNA: focus on natural antisense transcripts[J]. Trends Genet, 2012, 28(8): 389-396.
[42]Tsai M C, Manor O, Wan Y, et al. Long noncoding RNA as modular scaffold of histone modification complexes[J]. Science, 2010, 329(5992): 689-693.
[43]Johnsson P, Lipovich L, Grander D, et al. Evolutionary conservation of long non-coding RNA: sequence, structure, function[J]. Biochimica et Biophysica Acta(BBA) -General Subjects, 2014, 1840(3): 1063-1071.
[44]Wang H, Chung P J, Liu J, et al. Genome-wide indentification of long noncoding natural antisense transcripts and their responses to light in Arabidopsis[J]. Genome Res, 2014, 24(3): 444-453.
[45]Spizzo R, Almeida M I, Colombatti A, et al. Long non-coding RNA and cancer: a new frontier of translational research[J] Oncogene, 2012, 31(43): 4577-4587.
The Latest Research Progress of Long Non-coding RNA in Animals and Plants
Qin Shaowei1Lu Mengting1Zhou Yuanyuan1
LüJianbing1Wang Fukang1Wen Yongqiang1Zhao Lifeng1,2*(1 College of Life Sciences, Tarim University, Alar, Xinjiang 843300)(2 Key laboratory of protection and utilization of biological resources in Tarim Basin,Tarim University, Alar, Xinjiang 843300)
AbstractLong non-coding RNA (lncRNA) is an important non-coding transcript larger than 200nt in length and have extremely low protein-coding ability or without protein-coding ability. LncRNA can regulate gene expression at transcription and post-transcription, epigenetic level, and plays an important role in a wide ranges of biological processes such as genomic imprinting, chromatin remodeling, transcriptional activation, transcriptional interference and cell cycle. It become the current hot topics in the study of molecular biology and genetics. Based on the latest research progress on lncRNA in recent years, the biological processes involved in animals and plants were compared in this review. Advance are highlighted according to molecular mechanism, functions, research strategies of lncRNA and problems faced in the present study, which providing a guide for further study of functions and molecular mechanism of lncRNA in animals and plants.
Key wordslong non-coding RNA; function; molecular mechanism; animals; plants; research progress
中圖分類號:Q7
文獻標識碼:A
DOI:10.3969/j.issn.1009-0568.2016.02.018
文章編號:①1009-0568(2016)02-0103-10
作者簡介:秦少偉(1974-),男,實驗師,研究方向為功能基因組學、LncRNA的生物學研究。E-mail:qinshaowei@126.com*為通訊作者E-mail:lifengz2011@126.com
基金項目:國家自然科學基金項目(31260275);塔里木大學校長基金博士項目(TDZKBS201501)。
收稿日期:①2015-10-13