馬馨馨 許洋 趙歡歡 火兆燕 王樹彬 鐘鳳林
(福建農林大學園藝學院,福州 350002)
番茄(Solanum lycopersicum L.)深受人們喜愛,但在種植過程中,各種生物脅迫及干旱、鹽堿、肥料等非生物脅迫都會對番茄的生長發育造成不良影響,進而影響番茄的品質和產量。在實驗室前期的研究中發現不同濃度的氮素處理下番茄葉片苯丙烷生物合成通路的最終產物多酚、類黃酮和木質素等物質含量具有顯著性差異。氮素處理下,飛機草[1]、小麥[2]、香蕉[3]等作物的木質素、類黃酮等均會發生相應的變化,從而進一步影響植株生長與防御以及不同次生代謝物合成途徑之間的分配,以此來增加病蟲害的抵御能力[4-5]。苯丙烷代謝途徑是植物體內重要的次生代謝途徑之一,每個細胞中至少有20% 的代謝途徑以此為基礎,其最終可以生成參與植物防御反應的酚類、類黃酮、和生物堿等,使植物對外界環境具有一定的抵抗性[6-9]。4香豆酸輔酶A連接酶(4CL)是苯丙烷生物合成通路中起關鍵作用的催化酶,作用于苯丙烷生物合成途徑的最后一步,將各種羥基肉桂酸(香豆酸、咖啡酸和阿魏酸)催化為相應的硫酯,進一步調控木質素、類黃酮、多酚等次生代謝物質的合成[10-13]。因此,對苯丙烷生物合成途徑的關鍵基因4CL基因家族進行生信分析,初步探究番茄4CL基因家族成員的作用機理至關重要。
本研究通過生信分析,對番茄4CL基因家族成員進行蛋白結構域、基因結構、蛋白保守基序、啟動子順式作用元件以及進化樹的分析,以期闡明番茄4CL家族成員的理化性質與基本功能,同時在不同濃度氮素處理下檢測其家族成員的表達量,進一步探究不同濃度氮素對4CL基因家族成員表達量的影響,為苯丙烷生物合成通路關鍵基因4CL響應氮素調控提供理論依據。
供試材料為‘Micro Tom’番茄。采用穴盤育苗,待幼苗長至5葉1心時,進行水培緩苗,緩苗3 d后采用霍格蘭營養液配方進行水培,其中控制氮素的濃度分別為:5.6 mg/L、22.4 mg/L、112 mg/L(正常氮素濃度)、224 mg/L、336 mg/L,每3 d更換一次營養液,在第9天進行相關試驗。
1.2.1 數據下載與番茄4CL基因家族成員鑒定與命名 利用番茄轉錄組數據獲取4CL基因家族成員,將所獲成員與Ensembl數據庫官網下載的番茄數據庫進行比對,最終確定番茄4CL基因家族成員。文中所使用的擬南芥數據和水稻數據均從UniProt數據庫官網(https://www.uniprot.org/)下載。參考已公布的其他物種對4CL基因的命名方式,本研究將這類基因統稱為“4CL”,其前綴加上代表物種的特異性字母,根據基因座位置將番茄4CL基因命名為“Sl4CL”。
1.2.2 番茄4CL基因家族成員理化性質分析 利用在線網站對番茄4CL基因家族成員進行理化性質分析。其中Expasy網站(https://web.expasy.org)分析氨基酸分子量、等電點、不穩定指數、親疏水性、原子總數;NovoPro網站(https://www.novopro.cn)進行蛋白信號肽的預測;Cell-PLoc 2.0(www.csbio.sjtu.edu.cn)進行亞細胞定位的預測。
1.2.3 番茄4CL基因家族成員二級結構、三級結構預測 利用Prabi(https://npsa-prabi.ibcp.fr)進行二級結構預測,利用Swiss-model(https://swissmodel.expasy.org)進行三級結構預測。
1.2.4 番茄4CL基因家族成員染色體定位分析 利用Ensembl數據庫官網獲得番茄4CL基因家族成員的位置信息,利用Tbtools進行作圖。
1.2.5 番茄4CL基因家族成員基因結構分析 利用Tbtools軟件分析番茄4CL基因家族成員的基因結構(內含子和外顯子)信息,利用NCBI的Batch CD-Search獲取Moain進行蛋白結構域的分析,利用MEME網站(https://meme-suite.org)設定搜索15個Motif,獲取番茄4CL不同成員氨基酸序列的Motif,利用Tbtools工具進行作圖。
1.2.6 番茄4CL基因家族成員的進化樹分析 利用MEGA7軟件對番茄、擬南芥、水稻的4CL基因家族做多序列比對,采用臨近法(NJ)Boostrap=1 000進一步構建進化樹,利用iTOL網頁(https://itol.embl.de/itol.cgi)進行進化樹的美化。
1.2.7 番茄4CL基因家族成員啟動子順式作用原件分析 利用Tbtools從番茄基因組數據庫中獲取啟動子(ATG)上游2 000 bp的序列,利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)獲取啟動子TF結合位點的信息,利用PlantTFDB(http://planttfdb.gao-lab.org/prediction.php)獲得啟動子順式作用元件信息,最后利用Excel進行統計和作圖。
1.2.8 番茄4CL基因家族成員在氮素脅迫下的表達分析 在水培第9天分別取樣進行RNA的提取、逆轉錄、熒光定量的測定。對番茄葉片進行RNA提取的試劑盒購于上海普洛麥格生物產品有限公司;逆轉錄試劑盒購買于天根生化科技(北京)有限公司;熒光定量試劑盒購買于諾唯贊生物科技股份有限公司。引物(表1)由福州尚亞生物技術有限公司合成。以Actin為內參基因對氮素處理下的4CL基因的表達量進行驗證,每個處理3個重復,根據單內參算法2-ΔΔCt計算4CL基因的相對表達量,運用Microsoft Excel 2010和GraphPad Prism 8.0.2軟件對數據進行統計分析。

表1 PCR所用到的引物Table 1 Primers for PCR
1.2.9 番茄Sl4CL03過表達載體的構建 利用DANMAN8軟件設計基因上下游引物,加上pCAMBIA-1302載體接頭(F:GGACTCTTGACCATGG;R:CTTCTCCTTTACTAGT),進行目的基因片段擴增,反應體系為 25 μL:2×Phanta Max Buffer 12.5 μL;dNTP Mix 0.5 μL ;Phanta Max Super Fidelity DNA Polymerase 0.5 μL ;上游引物和下游引物各 1 μL ;cDNA 1 μL;ddH2O 8.5 μL。PCR反應程序:95℃預變性3 min;95℃變性15 s,58℃退火15 s,72℃延伸1 min 40 s,共35個循環;72℃延伸5 min,將PCR產物進行膠回收。利用賽默飛世爾科技公司的NcoI和BcuI酶將pCAMBIA1302質粒進行雙酶切,利用諾唯贊生物科技股份有限公司的ClonExpress? II One Step Cloning Kit試劑將其與pCAMBIA1302線性化載體進行連接,轉入DH5α大腸桿菌感受態,涂板倒置37℃培養12 h,挑單克隆菌落進行菌液PCR,將陽性菌落大搖提質粒送福州鉑尚生物技術有限公司進行測序。將重組質粒通過凍融法轉入農桿菌GV3101感受態細胞。
1.2.10 番茄Sl4CL03蛋白的亞細胞定位 將農桿菌菌液在5 000 r/min離心3 min,去掉上清,用一定體積的重懸液重懸沉淀,使OD600nm=0.6-0.8,靜置3 h,用1 mL注射器輕輕抵在煙草葉片背部,避開葉脈進行注射,避光12 h,24 h后用激光共聚焦顯微鏡觀察熒光。用含有pCAMBIA1302空載的農桿菌作為對照。
蛋白的理化性質分析可以了解蛋白質的特性,對番茄4CL基因家族進行基本理化性質分析,結果如表2所示,6個家族成員氨基酸個數在538和957之間,分子量為58 930.46-102 255.02,有5個氨基酸的等電點小于7,為酸性氨基酸,僅有Sl4CL05為堿性氨基酸。6個基因的不穩定指數均小于40,均為穩定蛋白,且在6個基因中均無檢測出信號肽。此外,6個基因中有4個為疏水氨基酸,在亞細胞定位中預測到6個基因均在過氧化物酶體中表達,但Sl4CL01除了在過氧化物酶體外還可以在葉綠體中表達。6個家族成員均無信號肽。

表2 番茄4CL基因家族蛋白理化性質Table 2 Physico-chemical properties of 4CL family proteins in tomato(Solanum lycopersicum)
蛋白質的序列結構可以反映蛋白的功能,為蛋白三級結構模式奠定基礎,對番茄4CL蛋白的二級結構預測分析(表3)發現,番茄4CL蛋白二級結構均由α-螺旋、延伸鏈、β-轉角和無規則卷曲四部分構成,其中α-螺旋和無規則卷曲所占比例最大,分別為30.67%-41.69%和34.8%-42.28%,接下來依次為延伸鏈(15.57%-20.71%)和β-轉角(6.84%-9.01%)。在二級結構分析的基礎上進一步分析三級結構(圖1),結構表明Sl4CL01、Sl4CL02、Sl4CL03、Sl4CL05和Sl4CL06均以5bsr.1.A為模型,其相似度 分 別 為 63.02%、89.29%、91.13%、40.68%和81.48%,僅Sl4CL04以5bsw.1.A為模型,相似度為37.07%。

圖1 番茄4CL基因家族三級結構Fig.1 Tertiary structure of tomato 4CL gene family

表3 番茄4CL基因家族二級結構Table 3 Secondary structure of tomato 4CL gene family
為更好的探究番茄4CL基因家族的發展,用番茄4CL基因家族的6條基因,擬南芥的20條基因,水稻的7條基因構建系統發育樹(圖2),結果顯示33條4CL基因共分為三大亞族,番茄4CL基因均在第Ⅲ亞族,番茄Sl4CL01與擬南芥At1g65060、水稻Os02g46970親緣性較近,Sl4CL05與At4g05160,Sl4CL04與At4g19010均具有較近的親緣關系,Sl4CL01、Sl4CL02和Sl4CL06與擬南芥的At3g21240、At1g51540親緣性較近,且三者相互之間具有較高的同源性,而第 I和第 II亞族的水稻、擬南芥和番茄4CL的親緣關系較遠。

圖2 番茄、擬南芥和水稻4CL基因家族成員系統發育樹Fig.2 Phylogenetic tree of 4CL gene family in Solanum lycopersicum,Arabidopsis thaliana and Oryza sativa
對番茄4CL基因家族進行染色體定位分析,結果如圖3所示:6條基因共分布到5條染色體上,數量最多的是3號染色體,共有2條基因,分別為Sl4CL01和Sl4CL02。剩余4條基因分別位于6號、8號、11號、12號染色體上。在染色體的定位圖上可以發現4CL基因多分布于染色體的3′端,且所有的染色體上均無基因簇存在。

圖3 番茄4CL基因家族成員染色體定位Fig.3 Localization of 4CL in chromosomes of tomato
為進一步分析番茄4CL基因家族的基因結構特征,了解其生物學功能,對番茄的6條基因進行相關內含子、外顯子的分析。結果如圖4所示,所有4CL基因的核苷酸序列基本可以分為3個部分:內含子、外顯子以及UTR區。所有基因序列的第一個內含子均位于成熟編碼序列內部,有利于區別信號序列和編碼序列。番茄4CL基因家族中4個成員具有5個內含子,Sl4CL02和Sl4CL04分別有6個內含子和11個內含子,且Sl4CL02無3′端UTR。利用MEME網頁,采用15個Motif對基因序列進行蛋白質保守基序分析,6個家族成員里Motif的個數為 11-14,且 Sl4CL01、Sl4CL02、Sl4CL03和Sl4CL06的Motif排列順序較為固定,均為Motif5、7、11、12、3、13、8、10、6、4、1、2, 但 是 在Sl4CL02的3′端具有Motif15,說明其均有高度的保守性。Sl4CL04的5′端具有Motif15基序,3′端缺少了Motif9,在Motif7和Motif3之間缺少了Motif11和Motif12,由Motif14代替了Motif6,在Sl4CL05的Motif7和Motif12之間缺少了Motif11,Motif3和Motif8之間缺少了Motif13,同時和Sl4CL04一樣由Motif14代替了Motif6。但是在所有的成員中均發現了AMP-binding enzyme。番茄4CL家族成員中共有5個結構域,其中PLN02246最多,分別存在于Sl4CL01、Sl4CL02、Sl4CL03和Sl4CL06中,但只有Sl4CL02的3′端有2個IBR結構域。Sl4CL04的結構域為AFD-class-I superfamily,Sl4CL05的結構域為4CL。此外,我們發現,4CL基因家族中的結構域成員為單個結構域的占66.7%(4條),通過上述結果,我們猜測番茄4CL基因家族具有較高的脅迫響應機制。

圖4 番茄4CL基因家族基因結構、保守結構域分布分析Fig.4 Gene structure and conserved domain analysis of 4CL gene family in tomato
獲取番茄4CL基因家族成員起始密碼子ATG上游2 000 bp序列對啟動子轉錄起始位點進行預測以及對環境脅迫和激素調控的TF結合位點分析,鑒定參與多重脅迫的順式作用元件,結果(圖5)顯示4CL家族共檢測出19種核心啟動子原件,分別為AP2、ARF、BBR-BPC、bHLH、bZIP、C2H2、CPP、Dof、E2F/DP、GATA、HD-ZIP、HSF、MIKC_MADS、MYB、MYB_related、NAC、NF-YB、Trihelix和WRKY,其中MYB的含量最多,共有80個,占所有作用元件的36.1%,接下來分布最多的依次是Dof、MIKC_MADS,分別為49個和20個,HDZIP、HSF、MYB_related和Trihelix次之,數量均為2個。數量最少的為ARF、BBR-BPC、CPP、E2F/DP、GATA和NF-YB,均為1個。對番茄4CL基因家族進行順式作用元件分析發現4CL基因家族在光照、干旱、防御和應激反應、晝夜節律、厭氧誘導;脫落酸、生長素、赤霉素、茉莉酸;胚乳表達、玉米醇溶蛋白代謝等方面均可以產生響應,6個基因家族成員均可以對光照進行響應,且在Sl4CL03中具有9個光響應的元件,防御和應激反應在Sl4CL01發現,響應水楊酸的元件僅在Sl4CL02中發現,胚乳表達僅在Sl4CL03中發現,晝夜節律控制僅在Sl4CL04中發現,玉米醇溶蛋白代謝僅在Sl4CL05中發現,其他順式作用元件則會在2個以上基因中發現。

圖5 番茄4CL基因家族啟動子順式調控元件類型和數量Fig.5 Type and number of cis-regulatory elements in the promoter of tomato 4CL gene family
由圖6可知,6個4CL基因在不同濃度的氮素處理下均呈現出差異表達,其中Sl4CL01、Sl4CL03、Sl4CL04和Sl4CL05隨著氮素濃度的升高而升高,四者均在氮素濃度224 mg/L時表達量最高,到氮素濃度為336 mg/L時顯著下降,但與其他3個處理存在明顯的差異,說明Sl4CL02基因在氮素濃度過高時能促進其表達,對氮素脅迫具有較強的抵抗能力。Sl4CL06基因在低氮(22.4 mg/L)和高氮(224 mg/L)處理下表達量均顯著高于5.6 mg/L、112 mg/L和336 mg/L,說明其基因在受到高、低濃度的氮素脅迫均能夠提高表達量。以上分析表明6個番茄4CL基因對苯丙烷生物合成有顯著的影響。

圖6 番茄4CL基因在不同濃度氮素下的表達模式Fig.6 Expression patterns of tomato 4CL genes under different concentrations of nitrogen
以番茄葉片cDNA為模板,擴增得到Sl4CL03的CDs全長1 683 bp(圖7-A),將目的基因膠回收后與pCAMBIA1302線性化載體進行連接轉化,挑選單克隆菌落利用基因上游引物和載體下游引物進行PCR鑒定,結果符合試驗預期,說明載體構建成功。將含有重組載體的農桿菌注射煙草葉片觀察亞細胞定位,結果(圖8)表明:轉入pCAMBIA1302空載的對照組GFP熒光信號在細胞膜和細胞核上均可觀察到,pCAMBIA1302-35S-Sl4CL03-GFP融合蛋白可以在過氧化物酶體、細胞膜中進行表達,此外,綠色熒光信號與葉綠體自發產生的紅色熒光信號重疊,說明Sl4CL03還可以在葉綠體中進行表達。

圖7 Sl4CL03基因的克?。ˋ)及Sl4CL03基因大腸桿菌菌液PCR(B)Fig.7 Cloning of Sl4CL03 gene(A)and Escherichia coli bacteria liquid PCR of Sl4CL03 gene(B)

圖8 Sl4CL03蛋白在煙草葉片細胞的亞細胞定位Fig.8 Subcellular localization of Sl4CL03 in Nicotiana tabacum leaf cells
隨著基因組學的發展,4CL基因家族成員已在毛竹[14]、龍眼[15]、苧麻[16]、柑橘[17]、煙草[18]、梨[19]、苜蓿[20]、陸地棉[21]等作物中有一定的研究,碭山酥梨4CL基因家族被鑒定出29個成員,陸地棉基因組中被鑒定到34個成員,龍眼體胚被鑒定出43個成員,煙草中被鑒定出20個成員,但是在番茄的轉錄組中僅鑒定出6個4CL基因家族成員,這說明了在不同物種間4CL基因家族數目確實存在較大差異。一個物種中4CL基因家族核酸的分化有效地防止了交叉雜交,特異性表達模式和低信使豐度有效地阻止了基因家族的鑒定,甚至人們幾乎知道擬南芥全部基因組序列,但4CL基因家族的真正范圍仍未可知[22]。
根據4CL基因家族所編碼蛋白的功能可以將其分為兩組:Class I和Class II,其中Class I與木質素合成有關,Class II與類黃酮的生物合成有關[23],將番茄的4CL基因家族與擬南芥、水稻的進行進化樹構建發現番茄的6個家族成員均在同一大類中,說明其6個成員在番茄的生長發育過程中可能存在功能冗余但并不明晰其所編碼蛋白的功能。對蛋白Motif進一步分析表明,所有的成員中都發現了Box I(AMP-binding enzyme結構域),所有已知的4CL氨基酸序列中BoxI(SSGTTGLPKGV)在4CL蛋白質序列中絕對保守,編碼AMP-binding enzyme結構域的基序是決定這些蛋白功能的主要結構域,同時Box I作為底物結合區域(SBP)參與了底物的識別[22]。此外,所有成員中也發現了作為酶催化位點的BoxII,多肽序列BoxII(GEICIRG)在所有4CL中絕對保守,其中心的Cys殘基被認為直接參與催化,說明4CL家族成員均可以直接參與催化反應。
4CL基因在植物的生長發育中起著至關重要的作用,在植物的不同部位以及不同時期具有不同的表達模式。有研究表明boxP(CCTTCACCAACCCCC)、boxA(CCGTTC)、boxL(TCTCACCAACC) 這3個是決定木質部特異性定位表達所必須的調控元件,在對番茄4CL基因家族啟動子順式作用元件分析時發現,Sl4CL02中含有boxL(TCTCACCAACC)的結合位點MYB,Sl4CL03中含有boxA(CCGTTC),而在進化樹中發現這兩個成員的同源性較近,因此,推測這兩個基因可能會在木質部特異性表達。沈晚霞[17]對柑橘的3個4CL家族成員研究發現其均在細胞質中進行表達,灰氈毛忍冬的兩個4CL基因分別在內質網和葉綠體類囊體進行表達,馬鈴薯中的4CL主要分布在葉綠體的類囊體膜上,說明4CL基因在不同植物中可以在不同部位進行表達[24-25]。亞細胞定位預測結果表明,所有番茄4CL家族成員在過氧化物酶體中進行表達,通過煙草瞬時轉化對Sl4CL03蛋白進行亞細胞定位驗證,發現除了在過氧化物酶體還可以在細胞質和葉綠體中進行表達。過氧化物酶體存在于一切真核細胞內,含有豐富的酶類,可以調節氧濃度、氧化脂肪酸、參與氮物質的代謝,這很好的說明了番茄4CL可以對氮素進行響應,在不同濃度氮素的處理下,4CL基因家族成員表達量均發生明顯的差異,同時定位于葉綠體也表明Sl4CL03蛋白在番茄中可以進行光響應,這與啟動子順式作用元件的結果相一致。
番茄4CL基因家族成員具有不同種類和數目的作用元件,從而導致不同成員間功能的差異性和復雜性。該家族可以響應多種植物激素元件、光響應元件,這些對植物的生長發育和生殖發育具有調控作用,湯崴[26]、王星淇[27]、Park 等[28]分別對葡萄、非洲菊、柳樹進行研究,結果均表明4CL基因在不同部位具有不同的表達量。此外,番茄4CL基因家族還有較多的防御和應激作用元件,這與植物抵抗非生物脅迫能力有著直接或間接的關系。Muna Alariqi[29]研究發現,Gh4CL3超表達株系對真菌的抗性增強,Sun Shichao的研究發現陸地棉Gh4CL7基因在耐干旱脅迫中起著積極的作用,擬南芥At4CL基因的表達也可被創傷、紫外線、致病菌感染等脅迫所激活[21,30-31]。在本試驗中不同濃度氮素處理下4CL家族成員產生了顯著的變化表明4CL基因家族可以對氮素脅迫進行響應。
從番茄全基因組中共鑒定出6個番茄4CL家族成員,不同成員間具有較高的同源性。在不同濃度氮素處理下,所有成員表達量均具有顯著性差異,對Sl4CL03蛋白進行亞細胞定位發現其可以在過氧化物酶體、葉綠體和細胞質中進行表達,4CL基因家族在番茄的生長發育過程中具有重要的作用。