朱曉林 魏小紅 王寶強 馮悅 趙耀東



摘?要:該試驗旨在通過生物信息學方法分析沙特番茄黃化曲葉病毒AC2基因編碼的轉錄激活蛋白TrAP(transcriptional activator protein)的結構及功能。該文通過在線軟件預測和分析了番茄中AC2基因編碼蛋白的一級結構、二級結構、磷酸位點、糖基位點、三級結構及其重要的功能;通過最大似然法對不同物種 AC2基因編碼蛋白序列構建系統發育樹,進行系統發育分析。結果表明:番茄中AC2基因共編碼135個氨基酸,且編碼蛋白屬于不穩定的親水性蛋白質;二級結構以無規則卷曲折疊為主,比例為58.52%;該蛋白不存在跨膜結構域,屬非跨膜蛋白且不存在信號肽;該蛋白1~129個氨基酸區域為雙生病毒超基因家族 (Gemini_AL2 superfamily) 結構域;系統進化情況和植物分類學基本一致,沙特番茄雙生病毒AC2基因與南非木薯間的親緣關系最近。該基因編碼蛋白結構與功能的分析為進一步研究AC2雙生病毒基因家族奠定了基礎,同時為番茄抗病在病蟲害防治方面提供一種可行的思路。
關鍵詞:沙特番茄黃化曲葉病毒, AC2基因, 轉錄激活蛋白, 生物信息學
中圖分類號:Q943
文獻標識碼:A
文章編號:1000-3142(2020)12-1773-08
Abstract:This experiment aimed to analyze the structure and function of the transcriptional activator protein transcriptal activator protein (TrAP) encoded by the AC2 gene of the Saudi tomato yellow leaf curl virus by bioinformatics.In this study, primary structure, secondary structure, phosphate site, glycosylation site, tertiary structure and important functions of the protein encoded by AC2 gene in tomato were predicted and analyzed by online software.Phylogenetic trees were constructed by maximal likelihood method for the encoded protein sequences of AC2 genes from different species for phylogenetic analysis.The results were as follows:The AC2 gene encoded a total of 135 amino acids in tomato, and the encoded protein belonged to an unstable hydrophilic protein; The secondary structure was dominated by random coil folding, with a ratio of 58.52%; The protein did not have a transmembrane domain,?it belonged to non-transmembrane protein and had no signal peptide; The 1-129 amino acid region of this protein was the Gemini_AL2 superfamily domain; The phylogenetics and plant taxonomy were basically the same, and the relationship between Saudi tomato yellow leaf curl virus AC2 gene and the South African cassava is recent.The analysis of the structure and function of the encoded protein provides a basis for further understanding of the AC2 geminivirus gene family, and provides a feasible approach for tomato disease resistance in pest control.
Key words:Saudi tomato yellow leaf curl virus, AC2 gene, transcriptional activator protein,?bioinformatics
番茄(Solanum lycopersicum)果實營養豐富、風味獨特、富含維生素等,能有效降低消化道癌、前列腺癌等多種疾病發生的幾率,是深受人們喜愛的蔬菜,在全世界種植廣泛(曹玉鑫等,2018)。隨著種植面積、復種指數不斷增加,各種病害也接踵而至。
番茄黃化曲葉病作為蔬菜作物生產中最具毀滅性的病害,其致病因子是黃化曲葉病病毒。屬于雙生病毒科,是一個大型的單鏈DNA病毒家族,它在重要的經濟作物上感染并造成毀滅性疾病(Sung & Coutts, 1996)。該病菌由煙粉虱(Bamesiatabasi)傳播,其病毒可以是單鏈DNA(ssDNA))或二份[(兩個相等)ssDNA稱為DNA A和B](Zerbini et al., 2017)。DNA A編碼互補的4~5個開放閱讀框(ORF)方向(AC1/C1,AC2/C2,AC3/C3,AC4/C4和AC5/C5)和兩個病毒感染的ORF(AV1/V1,AV2/V2)參與反式激活,復制和反應的方向封裝(Hanley et al., 2013)。它們被細分為九個屬,該病毒屬的成員編碼稱為AC2/C2的致病蛋白,該類轉錄激活蛋白是能與啟動子中特定DNA序列結合并激活基因轉錄反應的蛋白質分子,其相互作用使許多植物蛋白失活并通過C-末端反式激活結構域反式激活許多宿主基因(Babu et al., 2018)。同時TrAP激活葉肉細胞和原生質體中病毒外殼蛋白(CP)和BR1運動基因啟動子的表達,并起到抑制植物組織中CP啟動子的作用(Rajeswaran et al., 2007)。謝迎秋等(2001)對棉花曲葉病病毒AC2 功能進行了初步探究,揭示了AC2基因編碼的蛋白在寄主植物中反式激活病毒鏈基因啟動子的奇異現象,其為研究病毒與植物間的相互作用的分子機理提供了新依據。
目前國內在番茄抗黃化曲葉病方面,主要集中于抗病基因的研究,對入侵病毒本身基因方面研究較少,尤其對病毒AC2基因的研究還鮮有報道,而當今控制番茄黃化曲葉病病毒迫在眉睫。因此,完成對AC2 基因編碼的轉錄激活蛋白進行全面的生物信息學分析,有助于理解病毒如何成功感染宿主,同時可通過分子手段抑制該基因的表達,從而為以后番茄在防治黃化曲葉病以及抵制抗病方面提供參考價值。
1?材料與方法
1.1 序列來源
利用NCBI數據庫獲取不同物種病毒基因AC2編碼的TrAP氨基酸序列及其他信息。
1.2 蛋白質結構分析預測
1.2.1 一級結構?通過Expasy平臺,根據Relative mutability參數、 Zimmerman方案、 Hopp & Woods方案、Bulkiness參數、Average flexibility參數、Janin方案預測蛋白的相對突變性、極性、親水性、松散性、柔韌性、可及性理化性質等一級結構。
1.2.2 二級結構?通過法國里昂CNRS的SOPMA 軟件(https://npsa-prabi.ibcp.fr/cgi -bin/npsa_automat.pl? page = npsa_sopma.html)) 預測該基因編碼蛋白的二級結構; 利用CBS 系統中 SignalP5.0 server 平臺(http:/ / www.cbs.dtu.dk/services/SignalP/) 預測沙特番茄黃化曲葉病毒TrAP蛋白信號肽序列(李玩生等,2010);利用Scratch Predict Protein 在線軟件(徐慶剛等,2010)對該基因編碼產物進行二硫鍵結合的預測與分析;利用 CBS 系統中TMHMM Server v.2.0平臺(http://www.cbs.dtu.dk/services/TMHMM/)進行蛋白跨膜區域的預測(Sonnhammer et al., 1998)。
1.2.3 磷酸化位點和糖基化位點預測?利用 CBS 系統中 NetPhos 3.1平臺(http://www.cbs.dtu.dk/services/NetPhosK)以及NetOGlyc 4.0進行蛋白磷酸位點與糖基位點的預測。
1.2.4 結構域預測?NCBI中的 CDD 數據庫(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 預測蛋白質功能結構域。
1.2.5 三級結構?通過 SWISSMODEL(Lin et al., 2018)對沙特番茄黃化曲葉病病毒基因AC2編碼蛋白的三維結構進行同源建模。
1.3 系統發育樹的構建
通過NCBI對 13個物種AC2基因編碼蛋白序列進行同源比對分析,再利用MEGA X(Wang et al., 2017)軟件中的鄰接法(neighbor-joining method,NJ)構建系統發育樹。
2?結果與分析
2.1 沙特番茄黃化曲葉病毒TrAP氨基酸序列
沙特番茄黃化曲葉病毒AC2基因GenBank登錄號為 NC_022229.1,其編碼的蛋白TrAP氨基酸序列為MQPSSPSTSHCSQVPIKVQHKLAKKKIIRRR
RLDLDCGCSYYLHINCTNHGFTHRGTHHCSSGNEWRFYLGDKQSPLFQDHQPQREATQHEQRHNFNTNPIQSQHQEGVGDSQMFSQLPNLDDLTASDWSFLKSI。對沙特番茄黃化曲葉病毒AC2基因完整編碼蛋白序列進行 BLAST 分析,將其與同源性較高的從NCBI里下載的卷心菜( 序列號:NP_620887.1)、南非木薯 (序列號:NP_620664.1)、棉花(序列號:CDO50035.1)、云南煙草 (序列號:NP_722555.1)、甘薯 (序列號:NP_808770.1)、胡椒(序列號:NP_050016.1)、臺灣番茄(序列號:YP_001950236.1)、豆類(序列號:NP_612596.1)、土豆(序列號:NP_808757.1)、海南番茄(序列號:YP_003104749.1)、番木瓜 (序列號:NP_689460.1) 和云南番茄(序列號:YP_008060401.1)等序列構建系統發育樹。
2.2 蛋白結構分析
2.2.1 一級結構?預測結果顯示,該蛋白共含135個氨基酸,其分子量為15 640.38,等電點為8.67,帶負電荷氨基酸殘基數為(Asp + Glu)12個,帶正電荷殘基數為(Arg + Lys)15個;分子式為C676H1037N211O206S7,原子總數為2 137個;不穩定指數為61.37;消光系數為15 470 mol·L-1, 對應吸光值是0.989。脂肪族氨基酸指數為54.89;各個氨基酸組成如圖1所示,其中絲氨酸、谷氨酰胺的比例最高,分別為11.1%、10.4%,蛋氨酸、色氨酸的比例最低,均為1.5%。
Expasy平臺預測結果顯示Relative mutability參數(圖2:A)得分位于53.000~100.556間,即該蛋白高突變區位于95~103位氨基酸間;Zimmerman方案(圖2:B)評分位于1.748~39.640間,因此可預測該蛋白高極性區位于21~34位氨基酸間;Hopp & Woods方案(圖2:C)評分表明其最大值為1.933,最小值為-1.156,因此該蛋白高親水性區域位于21~35位氨基酸間;Bulkiness參數(圖2:D)位于10.574~18.103之間,其蛋白的高松散區域位于12~33位氨基酸間;Average flexibility參數(圖2:E)得分位于0.397~0.494間,因此其高柔韌性區域在25~37位氨基酸之間;Janin方案(圖2:F)評分位于-1.067~0.256間,其高可及性區位于36~44位氨基酸間。
2.2.2 二級結構分析預測?由圖3可知,無規則卷曲在整個多肽鏈主鏈骨架上所占比例最大,為58.52%,由79個氨基酸構成,且其較為突出的區域是1~15、71~83、95~111,其次為α-螺旋,為25.19%,由34個氨基酸構成,其較突出部位為16~34、84~94,而該氨基酸序列無β-轉角與β-折疊,而延伸鏈占16.30%。則該番茄蛋白主要二級結構元件為無規則卷曲與α-螺旋。按照蛋白質二級結構劃分標準來看,沙特番茄黃化曲葉病毒基因編碼產物在結構上屬于混合型(Skolnick & Fetrow, 2000; 曹建等,2012)。
如圖4所示, 經預測, TrAP的1~135位氨基酸均位于細胞膜表面(圖4:A),由此可以推斷該蛋白無跨膜區域的形成。同時該蛋白也無信號肽的存在(圖4:B)。運用 Scratch Protein Predictor軟件對該蛋白的二硫鍵進行預測,結果顯示,預測沙特番茄黃化曲葉病毒TrAP蛋白5個 Cys 中,2個 Cys 形成 1對二硫鍵,預計在第37、39、47、60位間形成。
2.2.3 磷酸化位點和糖基化位點預測?運用NetPhos 3.1在線軟件對番茄 TrAP蛋白磷酸化位點進行預測,由圖5可知,該蛋白的氨基酸序列包含24個磷酸化位點,且其磷酸化位點分別位于絲氨酸 (Ser)、蘇氨酸 ( Thr)?和酪氨酸 ( Tyr) 殘基上。絲氨酸磷酸化位點15個、蘇氨酸磷酸化位點7個以及酪氨酸磷酸化位點2個,多磷酸化位點在蛋白質翻譯后修飾水平上發揮著重大作用。而NetOGlyc 4.0預測結果表明該蛋白含有9個糖基化位點。
2.2.4 結構域預測?應用NCBI 中的CDD 數據庫( http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 預測蛋白質功能結構域。預測結果如圖6所示,結果表明沙特番茄黃化曲葉病病毒基因AC2轉錄激活蛋白的1~129 個氨基酸區域為雙生病毒超家族 (Gemini_AL2 superfamily) 結構域,該結構域對該編碼蛋白功能發揮有極其重要的作用。
2.2.5 三級結構?通過同源建模方法構建的沙特番茄黃化曲葉病毒基因AC2編碼蛋白的三級結構,結果如圖7所示。該蛋白結構較為簡單,卷曲鏈與折疊鏈結構較少,蛋白質的三級結構對其生物學功能的發揮具有極其重要的作用,因此預測該蛋白功能相對單一。
2.3 AC基因編碼蛋白的系統發育樹構建
從圖8可以看出,在通過系統發育樹構建的13個物種中,沙特番茄黃化曲葉病毒與南非木薯間的親緣關系最近,其次是棉花、番木瓜、海南番茄、胡椒、云南番茄、臺灣番茄、云南煙草、土豆、豆類、卷心菜、甘薯。
3?討論
煙粉虱作為黃化曲葉病病毒的攜帶者,可操縱植物防御信號。在病蟲害侵染后,植物體內主要進化出兩種防衛反應機制,水平抗性與垂直抗性。植物首先動員水楊酸(SA)依賴的水平抗性防御,其主要針對病原體。垂直抗性是植物在長期抵制病原菌的過程中形成的專一抗性,通過進化出專一抗性基因來抵抗病毒(Gill et al., 2019), 而部分番茄品種體內不存在抗病基因,因此以病毒基因自身結構作為一個切入點,利用RNA干擾沉默病毒AC2基因有助于病害的防御。黃化曲葉病病毒作為危害番茄產量最主要的病害,由雙生病毒引起,其該病毒不僅可作為表達載體在植物中直接表達外源基因,還可提供分離的調控元件,調控植物體的生理生化過程。研究表明,在AC2基因不存在時, ACMV病毒鏈基因啟動子表達活性較低,AC2 基因存在時,病毒鏈基因啟動子活性顯著增強,從而使病毒高效復制(Brough et al., 1992)。同時導致AC2激活病毒鏈基因啟動子復雜性的另一個可能因素是病毒鏈基因啟動子的活性受時空調控,具有發育階段特異性和組織特異性(Sunter & Bisaro, 1997) 。而在該病毒入侵植物時,AC2基因編碼的轉錄激活蛋白在其病毒自我復制中發揮了很重要的作用,已發現在煙草中AC2基因能產生嚴重的影響,使煙草屬植物的葉組織發育不全(Siddiqui et al., 2008)。AC2編碼的蛋白可作為植物體內寄主RNA沉默的抑制子,而寄主RNA沉默是植物抵御病毒入侵的有效手段,因此抑制AC2基因編碼產物是防止病毒在植物體內傳播的有效途徑。本研究對沙特番茄黃化曲葉病毒基因編碼的TrAP蛋白序列的一級、二級、三級結構以及功能分類等進行預測及分析,該結果為研究AC2基因及其編碼產物的結構和功能提供了更多的信息,同時對AC2基因進行全面的生物信息學分析,以期通過分子手段抑制其基因的表達,為番茄抗病育種提供可行的思路。
本研究中AC2 基因編碼產物共含135個氨基酸,其中絲氨酸含量最高,該氨基酸含量的高低與蛋白親水性有密切關聯,同時該蛋白不穩定系數高達61.37,因此其屬于不穩定的親水性蛋白質。AC2 基因編碼蛋白的二級結構以α-螺旋和無規卷曲為主,存在2個二硫鍵,這與該蛋白分子對抗外界因素影響的不穩定性有很大關系。該基因編碼蛋白是一種轉錄激活因子,其結構不存在跨膜區,即不屬于定位于生物膜的膜蛋白。該編碼蛋白含有1個雙生病毒超家族結構域,其在細胞被運輸以及結合嘌呤和嘧啶中起關鍵的作用,同時在細胞信號轉導中發揮作用。沙特番茄黃化曲葉病毒基因與南非木薯間的親緣關系最為密切,其次是棉花、番木瓜、海南番茄、胡椒、云南番茄、臺灣番茄、云南煙草、土豆、豆類、卷心菜、甘薯。由各物種同源性高于 25% 就可判斷其功能上的相似性(Garnier et al., 1996)。 這種同源性一方面體現出各物種間的親緣關系,另一方面也表明各個物種的AC2基因編碼產物在結構特征中的相對穩定性,同時表明AC2基因編碼蛋白在漫長的生物演變過程中更多地受凈化選擇作用的束縛,其保守性較強。
4?結論
本研究通過生物信息學方法對沙特番茄黃化曲葉病毒AC2基因編碼的轉錄激活蛋白進行預測和分析。結果表明,沙特番茄黃化曲葉病毒AC2主要編碼病毒轉錄激活蛋白,其在病毒入侵番茄的過程中發揮極其重要的作用,對病毒在植物體內的繁殖起關鍵作用。該編碼蛋白由135個氨基酸組成, 是一種相對不穩定的親水性蛋白;二級結構以無規則卷曲與α-螺旋為主,該蛋白無信號肽與跨膜結構域,但存在二硫鍵;三級結構預測模型較為簡單;其蛋白1~129 個氨基酸區域為雙生病毒超家族 (Gemini_AL2 superfamily) 結構域。利用鄰接法對AC2基因進行系統發育分析,發現沙特番茄黃化曲葉病毒AC2與南非木薯間的親緣關系最近,與卷心菜、甘薯之間的親緣關系最遠。
參考文獻:
BABU KSD, MANOHARAN P, PANDI G, 2018.Computational studies on begomoviral AC2/C2 proteins[J].Bioinformation, 14:294-303.
BROUGH CL, SUNTER G, GARDINER WE, et al., 1992.Kinetics of tomato golden mosaic virus DNA replication and coat protein promoter activity in Nicotiana tabacum protoplasts[J].Virology, 187:1-9.
CAO J, LUO YZ, HU J, et al., 2012.Polymorphism and bioinformatics analysis of CDS in H-FABP gene in Gannan yak[J].J Gansu Agric Univ, 47 (4) :20-26.[曹建,羅玉柱,胡江,等, 2015.甘南牦牛H-FABP 基因 CDS 區多態 性及生物信息學分析[J].甘肅農業大學學報,47(4):20-26.]
CAO YX, CAO HX, WANG P, et al., 2018.Effects of nutrient solution concentration on growth, quality and storability of tomato[J].Food Sci, 39(7):63-70.[曹玉鑫,曹紅霞,王萍,等,2018.營養液濃度對番茄生長、品質以及耐貯性的影響[J].食品科學,39(7):63-70.]
GILL U, SCOTT JW, SHEKASTEBAND R, et al., 2019.Ty-6, a major begomovirus resistance gene on chromosome 10, is effective against tomato yellow leaf curl virus and tomato mottle virus[J].Theor Appl Genet, 132:1543-1554.
GARNIER J, GIBRAT JF, ROBSON B,1996.Method for predicting protein secondary structure from amino acid sequence[J].Method Enzymol, 266:540-553.
HANLEY BL, BEJARANO ER, ROBERTSON D, et al., 2013.Geminiviruses masters at redirecting and reprogramming plant processes[J].Nat Rev Microbiol, 11:777-788.
LI YS, LIU L, FENG HY, et al., 2010.Cloning and bioinformatics analysis of porcine T cell receptor beta chain gene[J].J Gansu Agric Univ, 45(3):1-6.[李玩生, 劉磊, 馮海燕, 等, 2010.豬T細胞受體β 鏈基因的克隆及生物信息學分析[J].甘肅農業大學學報, 45(3):1-6.]
LIN YM, LIN CM, LIN WH, et al., 2018.Mild clinical features of isolated methylmalonic acidemia associated with a novel variant in the MMAA gene in two Chinese siblings[J].Bmc Med Genet, 19:114.
RAJESWARAN R, SUNITHA S, SHIVAPRASAD PV, et al., 2007.The mungbean yellow mosaic begomovirus transcriptional activator protein transactivates the viral promoter-driven transgene and causes toxicity in transgenic tobacco plants[J] .Mol Plant Microbe Interact, 20:1545-1554.
SONNHAMMER EL, HEIJNE G, KROGH A, 1998.Ahidden markov model for predicting transmembrane helices in protein sequences[J].Proc Int ConfIntell Syst Mol Biol, 6:175-182.
SUNG YK, COUTTS RH, 1996.Potato yellow mosaic geminivirus AC2 protein is a sequence non-specific DNA binding protein[J].Febs Lett, 383:51-54.
SUNTER G, BISARO DM, 1997.Regulation of a geminivirus coat protein promoter by AL2 protein ( TrAP):Evidence for activation and depression mechanisms[J].Virology, 232:269-280.
SIDDIQUI SA, SARMIENTO C, TRUVE E, et al., 2008.Phenotypes and functional effects caused ntabacum[J].Mol Plant Microbe Interact, 21:178-187.
SKOLNICK J,?FETROW JS, 2000.From genes to protein structure and function:Novel applications of computational approaches in the genomic era[J].Trends Biotechnol,?18(1): 34-39.
WANG XD, MA DH, HUANG XW, et al., 2017.Complete genome analysis of dengue virus type 3 isolated from the 2013 dengue outbreak in Yunnan, China[J].Virus Res, 238:164-170.
XIE YQ, MENG M, ZHU Z, et al., 2001.Preliminary functional studies on AC2, a novel trans-acting factor from cotton leaf curl virus[J].Bull Bot, 32(5):517-521.[謝迎秋, 孟蒙, 朱禎, 等, 2001.棉花曲葉病毒反式作用因子AC2的功能初探[J].植物學報, 32(5):517-521.]
XU QG, LU J, ZHENG JZ, et al., 2010.Characterization and bioinformatics analysis of 4SNc-Tudor domain protein of Takifugurubripes[J].J Anhui Agric Sci, 38(3):1163-1166.[徐慶剛, 陸健, 鄭建洲, 等, 2010.河豚 4SNc-Tudor 蛋白的鑒定及生物信息分析[J].安徽農業科學, 38(3):1163-1166.]
ZERBINI FM, BRIDDON RW, IDRIS A, et al., 2017.ICTV virus taxonomy profile:geminiviridae[J].J Gen Virol, 98:131-133.
(責任編輯?周翠鳴)