李雁斌,靳雙珍,楊玉坤,王德勛,戶艷霞,范志勇,蘇家恩
(1.云南省煙草公司大理州公司,云南 大理 671000;2.云南省煙草公司大理州公司劍川縣分公司,云南 大理 671300)
煙草精氨酸脫羧酶的蛋白質特性分析
李雁斌1,靳雙珍1,楊玉坤2,王德勛1,戶艷霞1,范志勇1,蘇家恩1
(1.云南省煙草公司大理州公司,云南 大理 671000;2.云南省煙草公司大理州公司劍川縣分公司,云南 大理 671300)
為了研究參與煙草多胺合成的精氨酸脫羧酶的蛋白特性,運用生物信息學的方法分析了煙草精氨酸脫羧酶的理化特性、系統進化、氨基酸序列、保守區域和二級結構。結果表明:煙草精氨酸脫羧酶的等電點為4.99~6.78,氨基酸數為558~733,疏水性為-0.050~0.079,脂肪指數為88.04~92.08,不穩定指數為39.54~44.14;經進化樹分析,煙草精氨酸脫羧酶分為2組,組1為NtCAD1、NtCAD2和NtCAD5,組2為NtCAD3和NtCAD4;經序列比對分析,NtCAD1、NtCAD2和NtCAD5的同源性較高,NtCAD3和NtCAD4的同源性較高,且組2均具有1個精氨酸脫羧酶保守序列和2個丙氨酸消旋酶/Ⅳ組脫羧酶保守序列;煙草精氨酸脫氫酶各成員的二級結構所占比例均為α-螺旋>無規則卷曲>β-折疊>β-轉角。
煙草;精氨酸脫羧酶;蛋白特性;生物信息學
煙草是以收獲煙葉組織為主的經濟產物,煙葉在整個煙草植株上相對敏感的部位,易受到生物和非生物脅迫的危害,影響其產量與質量,進而損害煙農的經濟收益。在生物或非生物脅迫條件下,多胺在植物防御反應中發揮了重要作用。例如,多胺具有調節離子平衡的作用,主要為K+、Na+、Ca+等離子[1];多胺可通過與核酸物質的結合,調節應激蛋白的翻譯和轉錄,參與氨基酸序列空間結構的穩定[2]。從原始底物精氨酸到生成多胺需要經過多步酶促反應,精氨酸脫氫酶是多胺合成反應的第一個限速酶[3]。目前,關于精氨酸脫羧酶的研究,主要集中在康乃馨[4]、桃樹[5]、水稻[6]、棉花[3]等植物上,對于煙草精氨酸脫羧酶的研究,尤其是分子水平的研究報道較為鮮見。筆者從煙草精氨酸脫羧酶的理化特性、系統進化、氨基酸序列、保守區域和二級結構等方面進行分析,以期揭示煙草精氨酸脫羧酶的蛋白特性,為探索該蛋白的結構功能奠定基礎。
在Pfam[7]的數據庫中獲取具有精氨酸脫氫酶的序列文件(PF06314),且在NCBI[8]的蛋白數據庫檢索煙草精氨酸脫氫酶的氨基酸序列。以PF06314文件為參考,運用HMMER[9]程序篩選已獲取的氨基酸序列,并除去重復序列,確定煙草精氨酸脫氫酶基因家族成員。
采用protParam[10]的理化特性分析工具,分析煙草精氨酸脫羧酶各成員的等電點、氨基酸數、親水性、脂肪指數和不穩定指數。利用ProbCons 1.12[11]在線服務,對煙草精氨酸脫氫酶的氨基酸序列進行分析,并通過PhyML 3.1[12]工具將解析后的數據進行聚類分析,其迭代次數為100,獲得進化樹。以Clustal[13]軟件對精氨酸脫氫酶的氨基酸序列進行多序列比對,并根據MEME[14]工具分析保守區域在序列上的分布。通過SOPMA[15]分析蛋白質結構的組成及其比例。
通過在線工具分析煙草精氨酸脫氫酶,結果表明如表1所示。煙草精氨酸脫氫酶具有5個家族成員,其等電點均小于7,以NtCAD4的等電點最大,為6.78,而NtCAD1的值最小,為4.99;各成員蛋白序列的氨基酸數目波動范圍較大,處于558(NtCAD3)至733(NtCAD1)之間;NtCAD1、NtCAD2和NtCAD5的親水性均小于0,表明這3個蛋白質具有親水性,NtCAD3和NtCAD4的親水性大于0,說明這2個蛋白具有疏水性;NtCAD3和NtCAD4的脂肪指數相對較大,具有較高耐熱性;因NtCAD2和NtCAD5的不穩定指數小于40,屬于穩定性蛋白,而NtCAD1、NtCAD3和NtCAD4的不穩定指數大于40。各成員蛋白質的氨基酸組成以絲氨酸(Ser)所占比例較大(除NtCAD1外)。綜上所述,煙草精氨酸脫氫酶各成員的理化特性存在差異,但NtCAD1、NtCAD2和NtCAD5較為相似,NtCAD3和NtCAD4較為相似。

表1 煙草精氨酸脫氫酶蛋白家族成員的信息
以擬南芥的NP_195197和NP_179243蛋白序列,水稻的 XP_015631971、XP_015631972、XP_015631973、XP_015633833和XP_015643038蛋白序列與煙草精氨酸脫氫酶各成員的蛋白序列進行同源比較,通過PhyML進行聚類,結果如圖1所示。依據進化樹的排布,將煙草精氨酸脫氫酶成員劃分為兩組,1組的成員為NtCAD1、NtCAD2和NtCAD5,2組成員為NtCAD3和NtCAD4;依據各分支的親緣關系,1組的煙草精氨酸脫氫酶與擬南芥的親緣關系較近,可信度為64%;2組的成員與水稻的親緣關系較近,可信度的100%。煙草精氨酸脫氫酶在單子葉植物和雙子葉植物植物中均有分布,說明該蛋白的分化較早,分化時間先于單子葉和雙子葉。

圖1 煙草精氨酸脫氫酶的系統進化樹
將煙草精氨酸脫氫酶的5個成員進行序列比對,結果如圖2所示。5個成員的蛋白序列中,既含有相同的氨基酸殘基,又存在氨基酸殘基數量和排列順序的差異,以NtCAD1、NtCAD2和NtCAD5的同源性較高,NtCAD3和NtCAD4的同源性較高。通過對序列保守區域的進一步分析,每個序列均至少含有3種保守基序,分別為A、B和C;其中,NtCAD1、NtCAD2和NtCAD5蛋白的保守區域A位于68~107,保守區域B位于223~272,保守區域C位于490~540;而NtCAD2和NtCAD5的保守區域a位于601~648、保守區域b位于258~309,保守區域c位于355~409;保守區域A、C、a和c均具有丙氨酸消旋酶/Ⅳ組脫羧酶,保守區域B和b為精氨酸脫羧酶保守結構域。NtCAD1、NtCAD2和NtCAD5的丙氨酸消旋酶/Ⅳ組脫羧酶保守區域分別分布在蛋白序列的兩端,即A保守域位于N-端,C保守域為C-端,而NtCAD3和NtCAD4 的保守域均位于C-端,且保守域a位于C-末端。
蛋白二級結構的組成為蛋白三維結構及功能奠定基礎,因此采用在線工具分別預測煙草精氨酸脫氫酶β-轉角、無規則卷曲、α-螺旋和β-折疊的二級結構,結果如表2、圖3所示。NtCAD1、NtCAD2和NtCAD5的N-端二級結構主要為無規則卷曲,NtCAD1的C-端以α-螺旋為主,NtCAD2和NtCAD5的C-端二級結構的排布無明顯規律;NtCAD3和NtCAD4蛋白序列的N-端二級結構主要為α-螺旋,C-端以β-折疊為主。由表2可知,煙草精氨酸脫氫酶各成員的二級結構所占比例均為α-螺旋>無規則卷曲>β-折疊>β-轉角,而α-螺旋多集中在蛋白序列中部。

表2 煙草精氨酸脫氫酶各二級結構的比例 (%)

圖2 煙草精氨酸脫氫酶的序列比對
研究了煙草精氨酸脫氫酶的理化特性、進化樹、氨斟酸序列、二級結構,結果顯示,煙草精氨酸脫氫酶成員NtCAD1、NtCAD2和NtCAD5為一組,NtCAD3和NtCAD4為另外一組,盡管如此,各成員的功能和特異性表達仍存在差異[3]。經比對序列的保守區域分析,各成員蛋白序列除具有精氨酸脫羧酶保守結構域外,同時具有丙氨酸消旋酶/Ⅳ組脫羧酶的保守結構域。因此,該成員也屬于磷酸吡哆醛(PLP)依賴型家族,參與丙氨酸空間結構的轉化[16-17]。經二級結構分析,煙草精氨酸脫氫酶成員的二級結構既有共性也存在差異,使煙草精氨酸脫氫酶的功能具備多樣性[18]。

圖3 煙草精氨酸脫氫酶的二級結構
[1] Alcázar R,Tiburcio A F. Polyamines:molecules with regulatory functions in plant abiotic stress tolerance[J]. Planta,2010,231(6):1237-1249.
[2] Walters D. Resistance to plant pathogens:possible roles for free polyamines and polyamine catabolism[J]. New Phytologist,2010,159(1):109-115.
[3] 李亞棟,默輝娟,王省芬,等. 棉花精氨酸脫羧酶基因GhADC1克隆與表達分析[J]. 棉花學報,2013,25(4):291-299.
[4] Chang K S,Sun H L,Hwang S B,et al. Characterization and translational regulation of the arginine decarboxylase gene in carnation(Dianthus caryophyllus L.)[J]. Plant Journal for Cell & Molecular Biology,2000,24(1):45-56.
[5] Liu J H,Ban Y,Wen X P,et al. Molecular cloning and expression analysis of an arginine decarboxylase gene from peach(Prunus persica)[J]. Gene,2009,429(1-2):10-17.
[6] Akiyama T,Jin S. Molecular cloning and characterization of an arginine decarboxylase gene up-regulated by chilling stress in rice seedlings[J].Journal of Plant Physiology,2007,164(5):645-654.
[7] Finn R D,Coggill P,Eberhardt R Y,et al. The Pfam protein families database: towards a more sustainable future [J]. Nucleic Acids Research,2016,44(D1):279-285.
[8] Edgar R,Domrachev M,Lash A E. Gene Expression omnibus:NCBI gene expression and hybridization array data repository[J]. Nucleic Acids Research,2002,30(1):207-210.
[9] Marchin M,Kelly P T,Fang J. Tracker:continuous HMMER and BLAST searching[J]. Bioinformatics,2005,21(3):388-389.
[10] Liu S,Zhao Y,Zhang X,et al. Bioinformatic analysis of fanction and structure of putative nucleocapsid protein sequences of SARS-CoV[J].Progress in Biotechnology,2003,40(6):454.
[11] Do C B,Brudno M,Batzoglou S. PROBCONS:probabilistic consistency-based multiple alignment of amino acid sequences[J].Genome Research,2004,15(2):330-340.
[12] Guindon S. PHYML online—a web server for fast maximum likelihoodbased phylogenetic inference[J]. Nucleic Acids Research,2005,33(Web Server issue):557-559.
[13] Larkin M A,Blackshields G,Brown N P,et al. Clustal W and Clustal X version 2.0[J]. Bioinformatics,2007,23(21):2947-2948.
[14] Bailey T L,Elkan C. The value of prior knowledge in discovering motifs with MEME[J]. Proc Int Conf Intell Syst Mol Biol,1995,(Bailey):21-29.
[15] Geourjon C,Deléage G. SOPMA :significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer Applications in the Biosciences Cabios,1995,11(6):681-684.
[16] Mo H,Pua E. Up-regulation of arginine decarboxylase gene expression and accumulation of polyamines in mustard(Brassica juncea)in response to stress[J]. Physiologia Plantarum,2002,114(3):439-449.
[17] Hao Y J,Kitashiba H,Honda C,et al. Expression of arginine decarboxylase and ornithine decarboxylase genes in apple cells and stressed shoots[J]. Journal of Experimental Botany,2005,56(414):1105-1115.
[18] Hummel I,Bourdais G,Gouesbet G,et al. Differential gene expression of ARGININE DECARBOXYLASE ADC1 and ADC2 in Arabidopsis thaliana:characterization of transcriptional regulation during seed germination and seedling development[J]. New Phytologist,2004,163(3):519-531.
Analysis of Protein Characteristics of Arginine Decarboxylase in Tobacco
LI Yan-bin1,JIN Shuang-zhen1,YANG Yu-kun2,WANG De-xun1,HU Yan-xia1,FAN Zhi-yong1,SU Jia-en1
(1. Dali Tobacco Company, Yunnan Tobacco Corporation, Dali 671000, PRC; 2. Jianchuan Tobacco Branch Company,Dali Tobacco Company, Yunnan Tobacco Corporation, Dali 671300, PRC)
In order to test the protein properties of arginine decarboxylase involved in tobacco polyam ine synthesis, the bio-informatics method was used in this study to analyze the physicochemical properties, phylogenetics, amino acid sequence alignment, conservative region and secondary structure of arginine decarboxylase in tobacco. The results showed that, in tobacco arginine decarboxylase, the isoelectric point was 4.99 to 6.78, the number of amino acids was 558 to 733, the hydrophobicity was -0.050 to 0.079, the fat index was 88.04 to 92.08, and the instability index was 39.54 to 44.14; in analysis of the phylogenetic tree, tobacco arginine decarboxylase divided into 2 groups, group 1 was NtCAD1,NtCAD2 and NtCAD5, and group 2 was NtCAD3 and NtCAD4; the sequence homology among NtCAD1, NtCAD2 and NtCAD5 was higher, the sequence homology between NtCAD3 and NtCAD4 was higher, and the two groups had one arginine decarboxylase conserved sequence and two alanine racemase/IVgroup decarboxylase conservative sequences; and the proportion of secondary structure of each member of arginine dehydrogenase in tobacco was that of α-helix > that of random curl > that of β-sheet > that of β-turn.
tobacco; arginine decarboxylase; protein property; bio-informatics
Q557
A
1006-060X(2017)10-0001-05
10.16498/j.cnki.hnnykx.2017.010.001
2017-08-18
中國煙草總公司云南省公司資助項目(2015YN20;2016 YN10)
李雁斌(1987-),女,云南南澗縣人,助理農藝師,主要從事煙葉生產工作。
蘇家恩
(責任編輯:成 平)