郭紅媛,賈舉慶,段 娜,張怡晴,舒國平,陳瀟灑
(山西農業大學農學院,山西太谷030801)
microRNAs(miRNA)是在真核生物中發現的一類內源性且具有調控功能的非編碼單鏈RNA,大小約為22個核苷酸。其主要參與發育、病毒防御、信號轉導等多種調控[1-3]。成熟miRNA識別靶基因位點后,可與靶基因位點緊密結合,破壞或阻遏蛋白質翻譯機制。由于序列微小,因此,一般極難檢測。現在已發現大量的miRNAs,新的miRNAs也正陸續被發現。miRNA通常可以控制多個靶位點,它們可以與多達1 000種甚至更多不同的靶位點結合,有時基因也可能受到多個miRNA調控,因此,難以了解其復雜的相互作用。
目前,研究miRNA表達量和表達位點可采用分子生物學和生物信息學等方法。其中,分子生物學法可以特異性地鑒定miRNAs,但依賴于極強的技術能力,且耗時耗力,成本高[4]。隨著新一代測序技術的發展,small RNA測序技術為發現miRNAs提供了強有力的手段。此外,根據miRNAs在植物物種中的高度保守性,利用比較基因組學和生物信息學方法可以從大量已測序的EST和GSS等數據庫中挖掘、鑒定miRNAs,了解miRNA群或其結構信息并獲取更多的細胞功能分析。
目前,利用生物信息學方法已在玉米、小麥、高粱等植物中有效地預測到大量的miRNA[5-8]。燕麥是一種糧、經、飼、藥兼用的世界分布型植物,因其營養價值高而且具有抗病、耐瘠、抗旱等優良性狀而引起了眾多研究者的關注[9-11],公共數據庫中也積累了大量的EST和GSS序列,這為研究燕麥提供了很好的可利用資源。目前,對燕麥miRNA的鑒定以及對靶基因調控方面的研究尚未見報道。
本研究根據miRNA序列的保守性,用大麥、小麥、二穗短柄草等植物miRNAs序列在燕麥EST數據庫和GSS數據庫中進行檢索和篩選,預測得到燕麥miRNA及其靶基因,補充了燕麥miRNA數據,并為燕麥miRNA對抗旱性調控等研究方面奠定了一定的基礎。
根據序列在進化方面的保守性,采用同源性搜索方法,從miRNA數據庫miRBase(http://www.mirbase.org/index.shtml)下載已登記的1 910條miRNA序列。在美國國家生物技術信息中心(NCBI)收錄的燕麥EST數據庫和概覽序列(GSS)數據庫中,將1 910條miRNA序列去重復后用來檢索潛在的燕麥miRNA序列。
從miRNA數據庫中下載已有植物miRNA序列,用多序列比對軟件ClustalW2(http://www.ebi.ac.uk/Tools/msa/clustalw2/)比對后去除重復序列;用這些序列進行BLAST(http://blast.ncbi.nlm.nih.gov/Blast.cgi)在線比對,檢索NCBI中的燕麥EST和GSS數據庫,將少于4個堿基錯配的同源序列作為重復序列去除;再與NCBI數據庫中進行BLASTX比對,去除燕麥蛋白質編碼序列后,將剩余序列作為燕麥候選miRNA序列。
將所得序列用Mfold 3.2軟件(http://mfold.rit.albany.edu/?q=mfold/RNA-Folding-Form)預測其二級結構,根據對miRNA的篩選標準[12-13]進行預測、鑒定。用psRNATarget(http://plantgrn.noble.org/psRNATarget/)對符合miRNA二級結構標準的序列進行靶基因預測。
從 miRBase下載山羊草(2)、二穗短柄草(464)、油棕(6)、高羊茅(15)、大麥(69)、水稻(713)、高粱(241)、甘蔗(36)、小麥(43)和玉米(321)已登記的miRNA序列,截至2013年10月共1 910條。對其進行多序列比對后,將重復序列只保留1條。用留下來的序列檢索NCBI中的燕麥EST和GSS數據庫,檢索到的序列經多序列比對,重復序列保留1條。然后,將留下來的序列在燕麥的蛋白質數據庫中進行BLASTX比對(以去除其中編碼序列),結果共獲得143條非編碼的候選燕麥miRNA序列,對143條pre-miRNA的統計分析得到的參數(前體序列長度L>60 nt;GC含量為30%<CG<71%;二級結構生成自由能△G<-41.18 kJ/mol)進行進一步篩選,若符合所有條件的片段則作為候選,不符合這些條件的片段則棄之。之后,對候選序列用Mfold
根據預測miRNA二級結構的標準,miRNA前體結構中具有莖環結構,且成熟的miRNA盡量位于莖環結構的臂上;miRNA與互補鏈間錯配應少于5個堿基;miRNA互補鏈上不能有大的突起或缺口;以最小折疊自由能系數(MFEI)大于8.5來判斷所預測的序列是否為符合二級結構的miRNA序列(圖1)。

經分析、篩選,共有46條序列符合miRNA鑒定標準,表1列出了其中的10條。
經psRNATarget在線預測所得的46條符合鑒定標準的燕麥miRNA序列的靶基因,預測時選擇期望值為3.0,允許不配對的最大能量(UPE)小于25.0,其余參數為默認值。結果共找到61個靶基因,部分序列的功能信息列于表2。

表1 預測到的燕麥miRNAs

表2 預測到的燕麥miRNA靶基因
本研究預測的燕麥miRNAs序列,首先其前體序列必須具有重要特征——發卡結構,而且預測的成熟miRNA序列要盡量位于其前體序列二級結構的“臂”上,避免處于“環”結構中;如不能避免,其與“環”結構最多有4 nt配對。為與其他類型的RNAs進行區分,又采用了2個鑒定miRNA的重要參數,即最小折疊自由能(MFE)和最小折疊自由能系數(MFEI),研究發現,MFE與前體序列的長度和GC含量有關,燕麥miRNA前體的MFEI平均值為1.06,高于 mRNA(0.62~0.66),rRNA(0.59)和 tRNA(0.64)[14],也高于前人的研究結論 0.85,結果證實,MFEI為預測miRNA的重要且可靠參數。
在預測到的靶基因中,絕大多數是編碼與生長發育有關的蛋白質,參與新陳代謝,編碼轉錄因子調控生長、發育以及其他生理代謝過程,如膜蛋白相關的物質運輸、細胞信號轉導等。這些靶基因分別屬于不同的基因家族,部分靶基因編碼的蛋白功能未知。本研究預測的miRNAs前體序列中有的具有多個成熟的miRNA序列,前體序列長度為107~315 nt。預測的成熟miRNAs的位置有的位于3'端,有的位于5'端。所預測的所有miRNA前體序列在長度和二級結構方面雖各不相同,但都分別可折疊成標準的miRNA二級結構。在預測的燕麥miRNA序列中大多是編碼與生長發育相關的蛋白質,可能參與燕麥生長中的新陳代謝活動,有一些是與信號傳導相關的,還有一些可能是編碼轉錄因子的。但由于目前燕麥基因組信息在網上公布信息的不完全,本研究對部分預測的miRNA序列仍未能預測到其功能。目前,有許多軟件可對RNA功能進行預測,如:TargetScan(http://www.targetscan.org/),PicTar(http://pictar.mdc-berlin.de/),MiRscan(http://genes.mit.edu/mirscan/)等。想要得到準確的預測結果,可以用多種軟件反復預測、比較,但預測結果最終需經實驗進一步驗證。
miRNAs作為一種非編碼的基因表達調控因子,雖已有在小麥、水稻、玉米、棉花、花生、煙草等[15-17]方面的研究,但目前對燕麥miRNAs生物學功能及調控機理的研究還不多。本研究預測了燕麥miRNAs序列及其靶基因,為進一步研究燕麥miRNAs的功能奠定了基礎(可為開展具體的實驗驗證提供依據,從而對燕麥miRNAs生物學功能注釋縮小范圍)。相信隨著生物信息學的發展,會有更多、更全面的基因組序列公布于網上,會發現更多的燕麥miRNAs。
[1]段成國,王春晗,郭惠珊.MicroRNA對植物生長發育和病毒侵染的調控[J].科學通報,2006,51(4):371-375.
[2]郭曉琴,孫紅正.microRNA靶基因檢測技術研究進展[J].河南農業科學,2013,42(4):11-13.
[3]耿銳梅,楊宏偉,曹長代,等.植物MicroRNA研究進展及其在植物與病原菌互作中的作用 [J].浙江農業科學,2011(5):1092-1094.
[4]蘇小茜,張清政,姜楓,等.MicroRNA研究方法進展[J].上海畜牧獸醫通訊,2008(5):2-4.
[5]李婧,熊莉麗,胡久梅,等.基于EST和GSS序列的玉米未知微RNA的數據挖掘[J].生物技術通報,2011(12):108-112.
[6]韓友生,欒福磊,朱洪亮,等.生物信息學方法挖掘小麥microRNAs及其靶基因[J].中國科學,2009,39(6):585-595.
[7]杜江峰,武永軍,方曉峰,等.生物信息方法預測高粱miRNA及其靶基因[J].科學通報,2010,55(7):553-561.
[8]蔡斌,李成慧,彭日荷,等.葡萄microRNA的計算識別[J].華北農學報,2008,23(S2):213-216.
[9]周建萍,劉龍龍,崔林.山西省燕麥育種現狀及資源特點[J].山西農業科學,2010,38(11):6-9.
[10]劉龍龍,崔林,劉根科,等.山西省燕麥產業現狀及技術發展需求[J].山西農業科學,2010,38(8):3-5.
[11]劉龍龍,崔林,周建萍,等.利用核不育燕麥新種質選育新品種品燕 2號[J].山西農業科學,2012,40(5):445-446.
[12]Zuker M.Mfold web server for nucleic acid folding and hybridization prediction[J].Nucleic Acids Res,2003,31(13):3406-3415.
[13]張磊,曹江濤,崔萌萌.茄子microRNAs與其靶基因的生物信息學預測[J].遺傳,2011,33(7):776-784.
[14]Zhang B H,Pan X P,Cox B,et al.Evidence that miRNAs are different from other RNAs[J].Cell Mol Life Sci,2006,63(2):246-254.
[15]潘玉欣,劉恒蔚.花生miRNA與其靶基因的生物信息學預測[J].中國油糧作物學報,2010,32(2):290-294.
[16]金偉波,李楠楠,吳方麗,等.水稻MicroRNA的預測及實驗驗證[J].中國生物化學與分子生物學報,2007,23(9):743-750.
[17]Frazier TP,Xie FL,Freistaedter A,et al.Identification and characterization of microRNAsand their target genesin bobacco(Nicotiana tabacum)[J].Planta,2010,232(6):1289-1308.