張安寧,毛慶豐,孫浩楠,申 晴,李志剛,劉中奇
(內蒙古民族大學農學院,內蒙古 通遼 028043)
大豆(Glycine max)起源于中國[1],已有5 000多年的栽培歷史[2],春大豆主產區包括黑龍江、吉林、遼寧和內蒙古四省(區)[3]。大豆屬于一年生草本植物[4],具有很高的蛋白質含量與油含量[5-6],是人類主要的糧食作物之一[7]。同時,大豆不僅可以作為食品的原材料,還可用于食用油的加工,并且加工所剩的豆餅可用于制作肥料[8-10]。大豆生長發育過程中需要芳香族類物質,而莽草酸途徑作為芳香族類物質合成的必要途徑,對大豆生長發育有重要作用。DHQ-SDH 是植物體內合成的、調節莽草酸途徑的關鍵酶。一方面,可催化3-脫氫奎尼酸脫水形成莽草酸,另一方面,在NADP+存在的條件下催化3-脫氫莽草酸和莽草酸之間的可逆反應[11]。截至目前,已有學者對DHQ-SDH基因家族進行了相關研究。SINGH等[12]研究表明,擬南芥體內的DHQ-SDH蛋白為莽草酸途徑中的代謝物分配提供了額外的調節水平,從而使代謝物從DHQ區域轉移到SDH區域的效率提高。HAN等[13]首次報道冷脅迫對淡水綠藻DHQ-SDH基因的調控。目前,有關大豆DHQ-SDH基因家族的研究少有報道,筆者通過生物信息學方法,對大豆DHQSDH基因家族成員的理化性質、基因架構、保守基序、系統發育進化樹等進行了預測與分析,旨為日后大豆DHQ-SDH基因的研究提供理論依據。
所使用的擬南芥DHQ-SDH蛋白序列、番茄DHQ-SDH蛋白序列以及大豆全基因組Glycine maxv2.1數據均來源于Ensembl(http://plants.ensembl.org/index.html)數據庫[14]。
將擬南芥DHQ-SDH序列作為對照,利用Tbtools軟件[15]進行blast比對,將篩選得到的候選序列上傳至在線網站Pfam(http://pfam.xfam.org/)[16]檢查是否含有DHQas_1序列,最終得到全部大豆DHQ-SDH基因家族成員。使用Expasy(https://web.expasy.org/protparam/)在線軟件[17]預測家族成員蛋白質的理化性質,利用WoLF PSORT(https://wolfpsort.hgc.jp/)在線網站[18]對其家族成員蛋白質進行亞細胞定位預測。
根據大豆基因注釋文件可獲得GmDHQ-SDH家族的13個成員在染色體上的位置信息及基因結構信息,使用Tbtools軟件[15]實現染色體定位與基因結構的可視化。
使用SOPMA(https://hfffg35d63ad69a164cc2swoc6n65wcbov6k6vfgfy.eds.tju.edu.cn/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)網站[19]和SWISS-MODEL(https://swissmodel.expasy.org/)網站[20]預測大豆DHQSDH基因家族成員蛋白質的二級結構以及三級結構,通過PROCHECK軟件[21]完成三級結構可靠性的檢測。
利用Tbtools[15]軟件預測大豆DHQ-SDH蛋白的保守基序,并進行可視化。
于Ensemble(http://plants.ensembl.org/index.html)數據庫[14]下載擬南芥和番茄的DHQ-SDH蛋白質序列(分別為1 個和2 個),將擬南芥和番茄2 個物種的DHQ-SDH 蛋白質序列(3 個)與所提取到的大豆DHQ-SDH蛋白質序列通過MEGA11軟件[22]進行系統發育樹的構建,并使用iTOL(https://itol.embl.de/)在線網站[23]美化進化樹。
利用Tbtools[15]篩選大豆DHQ-SDH基因家族成員的CDS 序列,將篩選出的序列上傳至psRNATarget(https://www.zhaolab.org/psRNATarget/home)在線軟件[24],預測大豆GmDHQ-SDH基因的miRNA。
通過Tbtools軟件[15]從基因組文件中提取得到GmDHQ-SDH基因家族成員的上游2kb序列。將提取得到的序列上傳至PlantCARE(https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)網站[25]進行分析,最終使用Tbtools軟件[15]進行啟動子順式作用元件分布的可視化。
共鑒定出DHQ-SDH基因家族成員13個,將其命名為GmDHQ-SDH1至GmDHQ-SDH13。并對家族成員進行蛋白質理化性質分析,其中,氨基酸數量位于409~577之間;分子量為44.36~62.98 kD;不穩定系數介于23.32~32.03 之間;等電點為5.26~6.77;除GmDHQ-SDH1、GmDHQ-SDH3、GmDHQ-SDH13 外,其余蛋白均屬于疏水蛋白,而且,大豆DHQ-SDH家族成員均具有較好的熱穩定性,分別位于葉綠體、過氧物酶體與胞液中。

表1 GmDHQ-SDHs蛋白理化性質及亞細胞定位Tab.1 Physicochemical properties and subcellular localization by GmDHQ-SDHs protein
GmDHQ-SDHs家族成員共分布在5條染色體上,且分布具有隨機性。GmDHQ-SDH13與GmDHQ-SDH12分布在1號染色體上,GmDHQ-SDH2位于19號染色體,GmDHQ-SDH1位于20號染色體,GmDHQ-SDH3分布在8號染色體上,分布在3號染色體上的基因最多,為GmDHQ-SDH4~GmDHQ-SDH11(圖1)。

圖1 大豆GmDHQ-SDHs基因染色體定位Fig.1 Chromosome localization of GmDHQ-SDHs gene in soybean
GmDHQ-SDH4、GmDHQ-SDH5、GmDHQ-SDH6、GmDHQ-SDH7、GmDHQ-SDH12以及GmDHQ-SDH13均含有上下游非編碼區域,GmDHQ-SDH1具有下游非編碼區域,而其他GmDHQ-SDHs家族成員不具備上下游編碼區域。同時,該家族成員所包含的內含子數量介于7~11 個之間,表明其在結構上很保守,其中,GmDHQ-SDH3的內含子最長(圖2)。

圖2 GmDHQ-SDHs基因家族染色體結構圖Fig.2 Chromosome structure of GmDHQ-SDHs gene family
大豆DHQ-SDH基因家族成員蛋白質的二級結構中含有α-螺旋、β-折疊、延伸鏈與隨機卷曲。所有成員均以α-螺旋為主,其中,GmDHQ-SDH9中的α-螺旋所占比例最大,為48.33%;隨機卷曲為第二主要結構,所占比例介于29.76%~34.84%之間(表2)。GmDHQSDH基因家族13 個家族成員的三級結構具有很高的相似性,而且均以α-螺旋為主(圖3)。GmDHQ-SDH1至GmDHQ-SDH13的模型氨基酸在最佳允許區和次允許區的比例介于97.7%~100%之間,所以構建的GmDHQ-SDH1~GmDHQ-SDH13的蛋白三級結構符合立體化學規則。

圖3 大豆DHQ-SDH基因家族三級結構預測圖Fig.3 The tertiary structure prediction map of DHQ-SDH gene family in soybean

表2 GmDHQ-SDHs基因家族二級結構Tab.2 Secondary structure of GmDHQ-SDHs gene family
GmDHQ-SDHs家族成員共分為4個組(分別為Group1~Group4)。Group1中GmDHQ-SDH4和GmDHQSDH5親緣關系較近,GmDHQ-SDH8和GmDHQ-SDH9親緣關系較近;Group2中,GmDHQ-SDH7與GmDHQ-SDH11親緣關系較近;Group4中,GmDHQ-SDH12和GmDHQ-SDH13親緣關系較近。見圖4(A)。

圖4 GmDHQ-SDHs基因家族保守基序Fig.4 Conserved motifs of GmDHQ-SDHs gene family
GmDHQ-SDHs家族成員蛋白均包含Motif1~Motif6,而且Motif1~Motif6 共同組成了DHQas_1 結構域。同時,GmDHQ-SDH10、GmDHQ-SDH8、GmDHQ-SDH9、GmDHQ-SDH11和GmDHQ-SDH3不具有構成SDH_C結構域的Motif9,見圖4(B)、圖4(C)。
使用2個擬南芥DHQ-SDH蛋白序列、2個番茄DHQ-SDH蛋白序列與13個大豆DHQ-SDH蛋白序列構建系統發育樹(圖5)。其中,Group2 由At3g06350、Solyc01g067750、GmDHQ-SDH1、GmDHQ-SDH3、GmDHQSDH12、GmDHQ-SDH13構成,由此說明,這6條蛋白序列具有很高的保守性。而在Group3中,GmDHQ-SDH2、GmDHQ- SDH4、GmDHQ- SDH5、GmDHQ- SDH6、GmDHQ- SDH7、GmDHQ- SDH8、GmDHQ- SDH9、GmDHQ-SDH10、GmDHQ-SDH11聚在一起,說明這些蛋白序列親緣關系較近。

圖5 擬南芥、番茄、大豆DHQ-SDH基因家族進化分析Fig.5 Phylogenetic analysis of DHQ-SDH gene family in arabidopsis,tomato and soybean
使用psRNATarget(https://www.zhaolab.org/psRNATarget/home)在線軟件預測大豆GmDHQ-SDH基因的miRNA,結果得到127 對調控關系,共有2 種抑制靶基因的方式,分別為剪切和翻譯,其中,調控GmDHQ-SDH12與GmDHQ-SDH13的miRNA 均有23 個,為所有大豆GmDHQ-SDH基因中數量最多者。調控GmDHQ-SDH3、GmDHQ-SDH4、GmDHQ-SDH6、GmDHQ-SDH9和GmDHQ-SDH11的miRNA 數量均為7個;調控GmDHQ-SDH7、GmDHQ-SDH5的miRNA為6個;調控GmDHQ-SDH1、GmDHQ-SDH8和GmDHQ-SDH10的miRNA 均為8 個;調控GmDHQ-SDH2的miRNA 數量為10 個。將數學期望值設定為5.0,共篩選得到16 對GmDHQ-SDH12、GmDHQ-SDH13和miR9746 家族之間的調控關系,miR9746 家族成員共有8 個,分別為gma-miR9746a、gma-miR9746b、gma-miR9746c、gma-miR9746d、gma-miR9746e、gma-miR9746f、gma-miR9746g 以及gma-miR9746h,8 個家族成員分別與GmDHQ-SDH12和GmDHQSDH13有1對對應關系。見表3。

表3 靶向調控大豆GmDHQ-SDH基因的miRNATab.3 miRNA targeting GmDHQ-SDH gene in soybean
13個家族成員的順式作用元件無論在類別或數量上均存在差異,其中,光響應元件在所有元件中出現的頻率最高,據此推測大豆的DHQ-SDH基因在大豆生長發育響應光調控的過程中具有重要作用。此外,鑒定出的生長發育調控響應包括胚乳表達響應元件、分生組織表達響應元件和柵欄葉肉細胞響應元件。而且,在啟動子區鑒定出了逆境脅迫響應元件,其中包括低溫響應元件、干旱響應元件、厭氧感應元件,表明在受到這些脅迫時,響應元件會提高植株自身的抵抗能力。鑒定出的激素應答響應元件共有4種,數量由多至少依次為脫落酸響應元件、茉莉酸甲酯響應元件、生長素響應元件、水楊酸響應元件。見圖6。

圖6 GmDHQ-SDHs基因啟動子區順勢作用元件分析Fig.6 Analysis of cis-acting elements in the promoter region of GmDHQ-SDHs gene
DHQ-SDH可以促進莽草酸的合成[26]。據報道,煙草DHQ-SDH基因可能參與碳源向次生代謝的運輸[27]。筆者通過生物信息學方法共鑒定出13個大豆DHQ-SDH基因家族成員,大豆DHQ-SDH基因家族成員蛋白的理化性質和亞細胞定位分析顯示,GmDHQ-SDH 蛋白均屬于穩定蛋白,且大部分為疏水蛋白,分別位于葉綠體、過氧物酶體和胞液中,該結果與王梅等[28]在巨尾桉EuDQD/SDH5中發現的類似。保守基序分析表明,大豆DHQ-SDH基因家族成員共分為4 組,因為處于同一組中的家族成員親緣關系較近,所以猜測GmDHQ-SDH4和GmDHQ-SDH5親緣關系較近,GmDHQ-SDH8和GmDHQ-SDH9親緣關系較近,GmDHQ-SDH7與GmDHQ-SDH11親緣關系較近,GmDHQ-SDH12和GmDHQ-SDH13親緣關系較近,而且,該家族成員均包含DHQas_1 結構域,說明其保守性很高,與SINGH 等[12]的研究結果相同。但是有些成員不具備構成SDH_C 結構域的Motif9,說明GmDHQ-SDH也具有很高的功能多樣性。系統進化分析結果表明,At3g06350、Solyc01g067750、GmDHQ-SDH1、GmDHQ-SDH3、GmDHQ-SDH12、GmDHQ-SDH13位于同一組別,由此推測上述基因具有相似功能。基因結構分析表明,所有家族成員含有的內含子數量為7~11 個,其中,GmDHQ-SDH3的內含子最長。順式作用元件分析表明,大豆DHQ-SDH基因家族成員啟動子區的順式作用元件共分為4類(光響應元件、逆境脅迫響應元件、激素應答響應元件、生長發育調控響應元件),其中,光響應元件出現頻率最高,據此推測大豆GmDHQ-SDH基因在大豆植株成長時對光的變化能夠迅速地做出響應。與此同時,鑒定出了逆境脅迫響應元件,HAN等[13]研究發現,低溫可誘導淡水綠藻水綿DHQ-SDH基因家族成員上調表達。該家族成員具有的激素應答響應元件能夠響應茉莉酸甲酯、脫落酸、水楊酸、赤霉素以及生長素,推測GmDHQ-SDH可以通過響應以上激素應答,參與調控非生物脅迫,從而增加植株對逆境的耐受能力。張林等[11]在煙草中發現NtDHQ-SDHs除具備上述元件外,還具有組成型原件,所以推測DHQ-SDH基因具有更豐富的功能。