羅岸
(長江大學生命科學學院,荊州 434023)
煙草遠緣雜種合子中父本特異表達基因EB30的克隆與分析
羅岸
(長江大學生命科學學院,荊州 434023)
已知煙草遠緣雜種的合子中EB30基因(EST序列號EB426694)的表達具有父本特異性。參考NCBI的EST序列設計引物,克隆得到該基因的CDS序列,并對其編碼的蛋白進行生物信息學分析。使用染色體步移和hiTAIR-PCR技術獲取EB30基因的5'側翼序列(啟動子和5' UTR)。構建由該基因5'側翼序列驅動的EB30-EGFP融合蛋白表達載體并轉化煙草。結果表明,EB30蛋白由211個氨基酸組成,蛋白分子量為22.616 2 kD,等電點pI 為5.63。該蛋白具有親水性,可能定位于線粒體中。煙草EB30蛋白與同屬茄科的番茄和馬鈴薯的蛋白序列相似度最高,約為73%。不同物種的同源蛋白的N端和C端都具有一段較為保守的序列區段。觀察轉基因植株合子和二胞原胚能檢測到較強熒光,證實所獲EB30基因的5'側翼序列在早期胚胎發生時期具有啟動子活性。
煙草;遠緣雜交;早期胚胎發生;父本特異表達;基因克隆
父本轉錄本是否參與了植物早期胚胎發生這一問題曾引起過巨大的爭議。早前的研究認為,受精前即存儲于卵細胞中的母本轉錄本主導著胚胎的早期發育[1-5]。但對擬南芥和玉米等植物中父本信號的檢測暗示父本轉錄本可能也參與了植物的早期胚胎發生[6-8]。隨后父母雙方轉錄本的相對表達水平首次在玉米不同自交系的雜種合子中被量化,試驗結果清楚地表明,父母雙方的遺傳信息對于合子的發育具有同等作用,且父本轉錄本的高活性也印證了所觀察到的雜種優勢[9]。利用深度測序技術,最新的工作系統分析了擬南芥早期胚胎中存在的轉錄本的父母本來源[10,11]。兩項研究都證實某些父本的轉錄本單獨存在于胚胎的早期發育時期。因此父本轉錄本在植物早期胚胎發生中可能扮演重要角色。但至今,對這類轉錄本的生物學意義仍知之甚少。
雜種優勢在自然界中普遍存在,它是指雜種F1代與其親本相比,在抗逆、抗病蟲或產量等方面表現出更優良的性狀。雜種優勢一般在成熟植株中表現明顯,但某些時候在胚胎和幼苗時期就已出現[9,12]。除不同品種和品系的雜交,跨越種屬的遠緣雜交也是制造雜種優勢,創造新品種的重要手段。雖然雜種優勢早已被廣泛應用于生產,但對其分子調控機制的認識卻一直裹足不前。如今研究者發現,在玉米雜種中有些基因的表達呈現出等位基因的差異化[13,14],暗示等位基因的差異表達可能也反映了雜種優勢的一種調控途徑。因此對在雜種早期胚胎發生中單一親本來源的轉錄本的研究十分必要。
通過之前的工作可知EB30基因在煙草遠緣雜種的合子中呈父本特異表達[15]。本研究利用NCBI的EST數據庫獲得該基因的CDS全長序列,并運用生物信息學軟件加以分析。通過染色體步移和hiTAIR-PCR技術獲得EB30 基因的5'側翼序列(啟動子和5'UTR),分析新獲得的序列在早期胚胎發生時期的啟動子活性情況,旨在為進一步研究EB30基因的生物學功能奠定良好基礎。
1.1 材料
1.1.1 菌株與質粒 GFP融合蛋白表達載體在pART27載體上改造而成,由武漢大學彭雄波副教授提供。大腸桿菌DH5α和農桿菌GV3101感受態為武漢大學植物生殖發育教育部重點實驗室自制。
1.1.2 植物材料 試驗材料為野生型煙草(Nicotiana tabacum var. SR1),陰性對照植株為攜帶有花粉特異啟動子Lat52驅動的EGFP蛋白的轉基因SR1植株(武漢大學植物生殖發育教育部重點實驗室自制),種植于長江大學生命科學學院所屬溫室內,室溫25℃,光照16 h。
1.1.3 主要試劑 普通DNA片段回收試劑盒,瓊脂糖凝膠回收試劑盒,質粒小提試劑盒購自天根生化科技有限公司,DNeasy Plant Mini Kit試劑盒購自QIAGEN公司,Universal Genome Walker Kit試劑盒購自Clontech公司,DNA聚合酶Ex Taq購自Ta-KaRa公司,DNA聚合酶Phusion High-Fidelity DNA Polymerasehe,限制性內切酶購自NEB公司,T4 DNA lignase購自Fermentas公司,pGEM-T Easy vector購自Promega公司。
1.2 方法
1.2.1 煙草基因組的提取及染色體步移文庫的構建 取100 mg幼葉,在液氮中碾碎后按照DNeasy Plant Mini Kit 試劑盒的要求進行操作。使用分光光度計將獲得的基因組DNA稀釋至Universal Genome Walker Kit試劑盒要求的濃度。建庫所需的4種平末端內切酶分別選用EcoR V、Dra I、Ssp I 和Xmn I,酶切時間分別為Dra I 和Ssp I 10 min,EcoR V 48 h,Xmn I 12 h。酶切完成后電泳檢測,合格后按照試劑盒要求完成后續步驟。
1.2.2 EB30基因CDS區的克隆 根據NCBI提供的EST序列設計CDS引物(表1)。使用該引物在預制備的煙草合子cDNA pool中擴增,以獲得煙草品種SR1的EB30基因的CDS序列[15]。PCR擴增程序:98℃預變性1 min;98℃變性10 s,60℃退火20 s,72℃延伸1 min,30個循環。Pushion高保真酶擴增。回收目的條帶,送樣測序。

表1 CDS擴增所需引物
1.2.3 EB30基因5'側翼區的克隆 按照Universal Genome Walker Kit試劑盒的要求設計GSP引物。反應體系和反應條件參照試劑盒要求,引物退火溫度靈活掌握,得到目的片段后送樣測序。獲得一定長度的未知序列后,通過染色體步移技術無法繼續向5'上游擴增,故使用hiTAIR-PCR技術繼續擴增。按照文獻[16]的要求設計引物,反應體系和反應條件參照文獻要求,退火溫度靈活掌握,得到目的片段后送樣測序。引物序列見表2。
1.2.4 生物信息學分析 使用Omiga分析EST序列的開放閱讀框。利用ExPASy(http:/ /web.expasy.org)的Protparam和ProtScale預測蛋白質的氨基酸組成和理論等電點等基本理化性質,并通過SOPMA預測其二級結構。采用PSORT(http://psort.hgc. jp/form.html)預測蛋白質的亞細胞定位。利用NCBI的blastx搜索EB30蛋白的同源氨基酸序列,利用軟件Clustalx 1.83進行同源比對,并用MEGA 4構建系統進化樹。
極限求解過程中,若需要運用等價無窮小替換計算極限,首先需要掌握等價替換定理(等價無窮小替換定理:α~α′,β~β′,則 )和熟記幾個常用的等價無窮小替換公式(x→0時,sin x~x,tan x~x,arctan x~x,arcsin x~x,ln(1+x)~x,ex-1~x,1-cos在了解和掌握等價無窮小替換后,例1中運用等價無窮小替換計算極限方法如下:

表2 5'側翼區擴增所需引物
1.2.5 GFP融合蛋白表達載體的構建 依據已知序列,分別設計用于擴增EB30基因的5'側翼區和CDS的引物,并在5'端添加酶切位點,引物序列見表3。用CDS-F2/CDS-R2在預制備的煙草合子cDNA pool中擴增CDS序列[12],反應條件和程序同1.2.2。用PRO-F/PRO-R在煙草基因組中擴增啟動子和5'UTR,反應條件和程序同1.2.2。對目的條帶回收后進行雙酶切,并依次連入GFP融合蛋白表達載體,送樣測序。

表3 載體構建所需引物
1.2.6 煙草葉盤轉化 應用電轉法將構建好的GFP融合蛋白表達載體轉入農桿菌GV3101,采用葉盤法進行轉基因。植株成熟后使用熒光觀察以篩選陽性苗。
1.2.7 煙草早期胚胎分離與觀察 取人工授粉后96 h和108 h左右的子房用于胚胎分離。采用酶解-研磨法分離得到胚囊,將胚囊繼續短時間酶解,然后用自制的微型玻璃吸管小心吹打分離出合子和2胞原胚[17,18]。將得到的胚胎置于微滴中觀察。
2.1 EB30基因CDS區的克隆
NCBI數據庫中的EST序列為738 bp。Omiga軟件預測其可能包含一個633 bp的CDS編碼區(圖1,紅色條段)。以此CDS序列為模板設計引物,可在預制備的煙草合子cDNA Pool中擴增到相應條帶。測序結果表明,所獲序列與數據庫相比有兩個堿基的差異。但分析圖1的紅色條段可知,其顯示的CDS的起始密碼子ATG之前還可能存在新的起始密碼子。后續試驗將結合新擴增序列對EB30的CDS全長進行確定。
2.2 步移文庫的構建及EB30基因5'側翼區的克隆和CDS完整性的驗證
染色體步移文庫的構建見圖2-A。因EST序列較完整,故直接使用染色體步移技術來獲取EB30基因的5'側翼序列。第一次向序列的5'端延伸了637 bp,其中247 bp的序列與原CDS序列完全匹配。之后由于使用染色體步移技術無法再次延伸序列,故選用hiTAIR-PCR技術來繼續獲取未知序列。第一次獲得了1 296 bp,第二次獲得了901 bp。之后無論利用染色體步移或hiTAIR-PCR技術均無法再繼續獲得新序列。將3次延伸獲得的序列進行拼接,發現在圖1紅色條段所示CDS的起始密碼子ATG之前共存在2 406 bp序列(圖2-B和圖3)。同時將拼接序列進行分析,發現圖1的紅色條帶所示的CDS起始密碼子之前96 bp處存在一個終止子TAA,說明圖1中紅色條段所示即為完整CDS。

圖1 EB30 EST開放閱讀框分析
使用在線的Protparam和ProtScale工具對EB30蛋白進行生物信息學分析,結果(表2)表明,該蛋白的分子量為22.616 2 kD,pI5.63,屬酸性蛋白。該蛋白由211個氨基酸組成,包含20 種基本氨基酸類型,其中Gly 和Ser含量最為豐富(各占12.3%)。EB30蛋白的正、負電荷殘基分別為20和26個,脂肪系數78.44,不穩定性指數64.69,屬不穩定蛋白。分析顯示EB30蛋白的平均總疏水性為-0.406,屬親水性蛋白。

圖2 染色體步移文庫構建(A)及EB30基因5'側翼區和CDS的克隆(B)

圖3 EB30基因5'側翼區序列

表 2 EB30基因編碼氨基酸一級結構預測分析
2.4 EB30蛋白的亞細胞定位分析
構建由EB30基因5'側翼序列驅動的EB30-EGFP融合蛋白表達載體并轉基因。使用Confocal對融合蛋白植株的花粉粒和花粉管的熒光進行掃描,發現EB30-EGFP蛋白在細胞質中呈現點狀聚集,而在陰性對照植株的花粉中EGFP蛋白則彌散分布(圖4)。這暗示EB30蛋白可能定位于某種細胞器,從而在胚胎發生過程中發揮作用。軟件預測的結果也顯示EB30蛋白定位于線粒體中的可能性最大。
2.5 EB30蛋白二級結構的預測
蛋白質的二級結構主要由α-螺旋、β-折疊等組成。二級結構折疊形成正確的三級結構是蛋白質發揮正常的生物學功能的基礎。分析顯示EB30蛋白的二級結構由4 種形式組成,其中α-螺旋占34.60%,無規則卷曲占49.29%,延伸鏈和β-轉角較少,分別占11.85%和4.27%(表3和圖5)。由此可知,無規則卷曲在EB30蛋白二級結構中最多,而α-螺旋和延伸鏈分散于整個蛋白中。

圖4 EB30-EGFP融合蛋白的亞細胞定位

表3 EB30蛋白二級結構的預測

圖5 EB30蛋白二級結構預測
2.6 EB30蛋白氨基酸序列同源比對和系統進化分析
利用Blastx搜索煙草EB30蛋白的同源序列,發現在高粱、玉米、粟米、葡萄、番茄和馬鈴薯等農作物中都存在與之類似的蛋白序列。其中煙草與同屬茄科的番茄和馬鈴薯的序列相似度最高,達到73%(圖6)。搜索結果還顯示該蛋白無任何功能注釋,這表明EB30基因是一種未被研究過的基因,編碼一種新型的蛋白。對不同物種中EB30蛋白的氨基酸序列進行比對,發現這些序列的C端和N端附近都各自擁有一段較為保守的區段,這可能與其執行的功能有密切關系。但是在氨基酸序列的其他部分,不同物種間的序列差別較大,說明這些區域進化速度較快。選取不同物種的EB30同源蛋白構建系統進化樹(圖7),發現同屬茄科的番茄、馬鈴薯和煙草屬于同一分支,單子葉植物高粱、玉米和粟米則親緣關系較近。
2.7 EB30基因的5'側翼序列在早期胚胎時期的活性
利用2.4中所獲得的轉基因植株,采用人工授粉的方法取得授粉后96 h和108 h的胚珠。利用二次酶解法獲得合子和二胞原胚后利用普通熒光顯微鏡進行觀察,熒光清晰可辨(圖8),表明獲基因的5'側翼序列在早期胚胎發生階段有較強的啟動子活性。
現有的科學研究表明,在植物早期胚胎發生中來自父母雙方的轉錄本都參與了胚胎的發育,且有些發育事件或是由父本或母本轉錄本主導調控[9-11]。如在擬南芥中發現SHORT SUSPENSOR(SSP)基因的父本轉錄本可以控制胚胎的模式形成[19],以及NIMNA基因(NMA)的父本等位基因的突變會更明顯地導致胚胎發育遲滯[20]。但目前對父本轉錄本在胚胎發生中的生物學功能還只有零星報道,而對單一親本來源的轉錄本在遠緣雜種早期胚胎中的具體功能的研究則尚未見諸報端。

圖6 EB30蛋白氨基酸序列比對分析

圖7 煙草與其他物種的EB30蛋白的進化樹分析

圖8 EB30-EGFP融合蛋白在早期胚胎中的表達
EB30基因是在煙草遠緣雜種的合子中父本特異表達的基因。其作為一種未知功能的新型蛋白廣泛存在于高粱、玉米、粟米、葡萄、番茄和馬鈴薯等農作物中。盡管單子葉植物高粱、玉米和粟米中的EB30和同屬茄科的煙草、番茄和馬鈴薯的EB30的氨基酸序列處于不同的進化支,但是不同物種的同源蛋白在靠近C端和N端的位置都有相對保守的序列區段。這暗示了該蛋白的非核心區進化速度較快,而核心區的進化則相對保守。本研究借助已知的EST序列信息,結合染色體步移和hiTAIR-PCR技術成功獲得了EB30基因的5'上游側翼序列。染色體步移是獲取未知基因序列較常用的技術。但由于序列特異性等原因,常常遇到序列延伸困難等問題。而Liu等[16]在 TAIR-PCR技術的基礎上經重新設計隨機引物和改善擴增條件推出了hiTAIR-PCR技術,其只需要簡單的基因組模板即可進行試驗。本研究通過這兩種技術的綜合運用獲得了EB30基因起始密碼子ATG之前2 046 bp的上游序列,包括啟動子和5' UTR。一般認為起始密碼子上游2 000 bp的序列已足以調控基因的表達,故構建了由EB30基因啟動子和5' UTR驅動的EB30-EGFP融合蛋白表達載體并轉化煙草。觀察轉基因植株的合子和2胞原胚發現有明顯的熒光信號,說明本研究所獲得的EB30基因的5'側翼序列在早期胚胎發育時期有較強啟動子活性。這為以后利用RNA干擾等技術對EB30基因進行功能分析奠定了良好的基礎。
在煙草遠緣雜種的合子中父本特異表達的EB30基因含有633 bp的CDS區,其編碼的蛋白質分子量為22.616 2 kD,pI 值5.63,屬酸性蛋白。該蛋白不穩定,具有親水性,且可能定位于線粒體中。其二級結構中無規則卷曲含量最高,其次為α-螺旋。EB30蛋白作為一種未知功能的新型蛋白存在于許多雙子葉和單子葉的農作物中,且有較為保守的序列區段。新獲得的EB30基因的5'側翼序列在早期胚胎發生時期有較強啟動子活性。
[1]Vielle-Calzada JP, Baskar R, Grossniklaus U. Delayed activation of the paternal genome during seed development[J]. Nature, 2000,404(6773):91-94.
[2]Grimanelli D, Perotti E, Ramirez J, Leblanc O. Timing of the maternalto-zygotic transition during early seed development in maize[J]. Plant Cell, 2005(4):1061-1072.
[3]Golden TA, Schauer SE, Lang JD, et al. Short integuments1/ suspensor1/carpel factory, a dicer homolog, is a maternal effect gene required for embryo development in Arabidopsis[J]. Plant Phys,2002, 130(2):808-822.
[4]Baroux C, Blanvillain R, Gallois P. Paternally inherited transgenes are down-regulated but retain low activity during early embryogenesis in Arabidopsis[J]. FEBS Lett, 2001, 509(1):11-16.
[5]Pillot M, Baroux C, Vazquez MA, et al. Embryo and endosperm inherit distinct chromatin and transcriptional states from the female gametes in Arabidopsis[J]. Plant Cell, 2010, 22:307-320.
[6]Weijers D, Geldner N, Offringa R, Jurgens G. Seed development:Early paternal gene activity in Arabidopsis[J]. Nature, 2001, 414(6865):709-710.
[7]Scholten S, Loerz H, Kranz E. Paternal mRNA and protein synthesis coincides with male chromatin decondensation in maize zygotes[J]. Plant J, 2002, 32:221-231.
[8] Sheldon CC, Hills MJ, Lister C, et al. Resetting of FLOWERING LOCUS C expression after epigenetic repression by vernalization[J]. Proc Natl Acad Sci USA, 2008, 105:2214-2249.
[9] Meyer S, Scholten S. Equivalent parental contribution to early plant zygotic development[J]. Current Biology, 2007, 17(19):1686-1691.
[10] Autran D, Baroux C, Raissig MT, et al. Maternal epigenetic pathways control parental contributions to Arabidopsis early embryogenesis[J]. Cell, 2011, 145(5):707-719.
[11] Nodine MD, Bartel DP. Maternal and paternal genomes contribute equally to the trascriptome of early plant embryos[J]. Natrue,2012, 482(7383):94-97.
[12] Hoecker N, Keller B, Piepho HP, Hochholdinger F. Manifestation of heterosis during early maize(Zea mays L.)root development[J]. Theor Appl Genet, 2006, 112(3):421-429.
[13]Stupar RM, Springer NM. Cis-transcriptional variation in maize inbred lines B73 and Mo17 leads to additive expression patterns in the F1 hybrid[J]. Genetics, 2006, 173(4):2199-2210.
[14]Guo M, Rupe MA, Zinselmeier C, et al. Allelic variation of gene expression in maize hybrids[J]. Plant Cell, 2004, 16(7):1707-1716.
[15]Zhang JE, Luo A, Xin HP, et al. Genes of both parental origins are differentially involved in early embryogenesis of a tobacco interspecies hybrid[J]. PLoS One, 2011, 6(8):e23153.
[16]Liu YG, Chen Y. High-efficiency thermal asymmetric interlaced PCR for amplification of unknown flanking sequences[J]. Biotechniques, 2007, 43(5):649-650.
[17]Sun MX, Yang HY, Zhou C. A new method for embryo sac isolation and in situ fusion of egg and synergid protoplasts in Nicotiana tubacum[J]. Acta Bot Sin, 1993, 35:893-900.
[18]Fu CM, Sun MX, Zhou C, Yang HY. Isolation of fertilized embryo sacs and zygotes and triggering of zygote division in vitro in Nicotiana tabacum[J]. Acta Bot Sin, 1996, 38:262-267.
[19]Bayer M, Nawy T, Giglione C, et al. Paternal control of embryonic patterning in Arabidopsis thaliana[J]. Science, 2009, 323(5920):1485-1488.
[20] Babu Y, Musielak T, Henschen A, Bayer M. Suspensor len gth determines developmental progression of the embryo in Arabidopsis[J]. Plant Physiol, 2013, 162(3):1448-1458.
(責任編輯 馬鑫)
Cloning and Analysis of Paternally Expressed Gene EB30 in Zygote of a Tobacco Interspecies Hybrid
Luo An
(College of Life Science,Yangtze University,Jingzhou 434023)
As known that EB30(EST accession number EB426694)paternally expressed in zygote of a tobacco interspecies hybrid,its CDS sequence was then cloned by using the EST database of NCBI. Also some characters of EB30 protein were analyzed by the methods of bioinformatics. Genome walking and hiTAIR-PCR were used to obtain the 5' flanking region of EB30 including the promoter and 5'UTR. The EB30-EGFP fusion protein expression vector driven by the 5' flanking region of EB30 was constructed and transformed into the tobacco. The results showed that EB30 gene encoded 211 amino-acid residues with a molecular weight 22.616 2 kD and pI5.63. This protein was hydrophilic,and predicted to locate in the mitochondrion. The phylogenetic tree showed that EB30 protein of tobacco was so closed to the tomato and potato,the amino acid homology was about 73%. There were two conserved regions near the N-terminal and C-terminal in homologous proteins from different species. Finally, the 5' flanking region of EB30 was proved to have a promoter activity in the early embryogenesis by fluorescence observation in the zygote and 2-celled proembryo from transgenic plants.
tobacco;interspecies hybrid;early embryogenesis;paternal expression;cloning
10.13560/j.cnki.biotech.bull.1985.2015.01.018
2014-05-04
長江大學博士科研啟動基金項目(2014NSFY023)
羅岸,男,博士,講師,研究方向:植物生殖發育;E-mail:anluo@whu.edu.cn