秦天元,許德蓉,王一好,孫 超,畢真真,劉玉匯,張俊蓮,白江平*
(1.甘肅農業大學農學院,甘肅 蘭州 730070;2.甘肅省干旱生境作物學重點實驗室/甘肅省作物遺傳改良與栽培種創新重點實驗室,甘肅 蘭州 730070)
馬鈴薯(Solanum tuberosum L.),在生物分類學中屬于茄科(Solanaceae)龍葵亞屬(Subg.Solanum),一年生植物,是全世界第一大糧菜兼用型作物[1,2]。馬鈴薯是塊莖類作物,在整個馬鈴薯生長發育過程中,逆境脅迫能夠改變馬鈴薯生長期內的源庫關系,進而影響塊莖的形成,從而造成馬鈴薯產量降低和品質下降[3-5]。為了避免逆境脅迫造成的不利影響,植物通過調節自身細胞產生有利的化感物質或啟動相關基因的表達來響應逆境脅迫,從而形成抵抗各種脅迫的自我保護機制,維持自身正常的生長發育[6,7]。在響應逆境脅迫的機制中,植物蛋白激酶磷酸化起著非常重要的作用,其中,SnRK2蛋白激酶家族是普遍存在于植物中的一類蔗糖非酵解型蛋白激酶,其功能主要參與脫落酸(Abscisic acid,ABA)依賴及非ABA依賴的非生物脅迫,從而影響植物生長發育[8,9]。根據前人的研究,在玉米中共發現SnRK2基因家族有11個成員,其中有7個家族成員分別受NaCl、低溫和熱處理誘導表達[10,11]。此外,楊樹中SnRK2家族成員PtSnRK2.5和PtSnRK2.7在擬南芥中的過表達表明,鹽脅迫下擬南芥的葉綠素含量和根系伸長量相對于對照均保持不變,提高了植株的存活率。同時,PtSnRK2.7 或還可影響脂質代謝、類黃酮代謝相關基因、轉錄因子和一些離子轉運相關基因的表達[12];甘蔗SnRK2 家族成員SoSnRK2.1在煙草中的過量表達可以提高煙草的抗旱性[13];研究發現,擬南芥種子在萌發、生長和休眠等生育期AtSnRK2.2/3/6 基因在干旱脅迫后其表達量發生變化,表明這些基因可響應ABA 的信號轉導[14-18];此外,在水稻中關于SnRK2 家族成員的研究表明,在鹽脅迫下,SAPK4 基因可通過調節水稻體內的離子平衡,來響應逆境脅迫[19]。目前,越來越多的植物研究表明,SnRK2家族蛋白激酶可參與響應植物非生物脅迫和ABA依賴[16,20,21]。
目前,關于SnRK2家族基因已在多種作物中得到了廣泛的研究。例如小麥[22,23]、玉米[24]、水稻[19,25]、高粱[26]、煙草[27]等。馬鈴薯作為全球第四大糧食作物,研究干旱脅迫下馬鈴薯相關基因的表達模式和分子機制,對于提高馬鈴薯品質和產量具有重要意義。目前國內外關于馬鈴薯中StSnRK2基因家族成員的研究相對較少[28-30]。通過對前期在干旱條件下馬鈴薯StSnRK2基因成員表達譜的分析,發現StSnRK2家族成員中不同基因的表達存在差異。因此,本文采用比對的方法,從新發布的馬鈴薯全基因組數據庫中系統地鑒定并分析了StSnRK2 基因家族成員,并對其序列特征、染色體定位和基因復制等方面進行了綜合分析。這些結果為進一步分析馬鈴薯StSnRK2基因家族的分化過程和生物學功能奠定了基礎,同時也為馬鈴薯抗逆基因的挖掘和篩選提供理論依據。
從Spud DB數據庫下載馬鈴薯最新雜合二倍體參考基因組序列(http://solanaceae.plantbiology.msu.edu/rh_potato_download.shtml)鑒定馬鈴薯基因組中的StSnRK2基因家族成員[31]。利用SnRK2基因家族的隱馬爾可夫模型(注冊號:PF00069.25)和本地Blast等多種比對的方法進行多重搜索[32]。此外,根據NCBI數據庫(https://www.ncbi.nlm.nih.gov/)中關于擬南芥、水稻、玉米等物種的SnRK2基因序列作為種子序列,為了盡可能地搜索真正的StSnRK2基因家族成員,使用e 值≤1e-20 來基于Blast算法進行搜索。將經過多重比對后的StSnRK2家族成員的蛋白序列提交到CDD 數據庫(https://www.ncbi.nlm.nih.gov/structure/bwrpsb/bwrpsb.cgi)和Pfam數據庫(http://pfam.xfam.org/)來進一步確認符合StSnRK2保守域的最終家族基因成員[31,33,34]。
利用CDD 和Pfam 數據庫將最終鑒定到的StSnRK2基因進行系統發育分析。將所有家族成員基因的蛋白序列先使用ClustalX(版本1.83)軟件[35]結合系統默認參數進行比對。將比對后的文件保存為meg格式后,再使用MEGA7軟件[36]進行系統進化樹的構建,使用方法為最大似然數法,其中將Bootstrap 值設置為1 000,最后根據系統發育樹的拓撲結構,可以將馬鈴薯StSnRK2基因成員分為不同的亞族。ExPASy網站(http://web.expasy.org/protparam/)[31]可用來計算StSnRK2基因成員的氨基酸數量、分子量和等電點(pI)等指標。利用本地MEME工具(版本4.11.2,http://alternate.meme-suite.org/tools/meme)采用Perl 語言來搜索馬鈴薯StSnRK2 家族成員序列中的保守基序[31,37]。通過在線軟件(PG2C,http://mg2c.iask.in/mg2c_v2.1/)和(GSDS,http://gsds.cbi.pku.edu.cn/)來分別構建馬鈴薯StSnRK2家族成員基因的染色體位置圖和外顯子-內含子結構圖。采用Perl 語言編寫代碼來提取馬鈴薯StSnRK2 家族成員基因編碼區上游1.5kb的序列,并提交到在線數據庫PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)中進行該基因家族中重要的順式作用元件的鑒定。利用MCScanX[38]和Circos[39]軟件來研究馬鈴薯不同染色體間StSnRK2 基因的串聯重復和片段復制現象,并借助于煙草參考基因組來進一步探究馬鈴薯StSnRK2 基因與煙草之間的比對基因組分析[31]。
本試驗利用馬鈴薯數據庫(http://solanaceae.plantbiology.msu.edu/pgsc_download.shtml)中已上傳的關于馬鈴薯二代Illumina 的公共RNA-seq 數據,并自主進行Cufflink和Tophat的分析。具體挑選為馬鈴薯StSnRK2 基因在150 mmol/L NaCl 下處理24 h、260 μmol/L 甘露醇(Mannitol)下處理24 h、50 μmol/L ABA下處理24 h 和10 μmol/L吲哚乙酸(Indoleacetic acid,IAA)下處理24 h的FPKM值,并根據其FPKM 值進一步研究馬鈴薯StSnRK2 基因家族中不同基因的表達模式,運用R 軟件中的Heatmap包來繪制馬鈴薯StSnRK2基因家族的表達模式熱圖。
采用RNA prep Pure Plant Kit(TIANGEN)試劑盒來提取馬鈴薯的總RNA,用1%瓊脂糖凝膠電泳檢測RNA的完整性、用核酸測定儀(P100)檢測RNA的濃度與純度。檢測合格后,使用ReverTra Ace qPCR RT Master Mix(TOYOBO)反轉錄試劑盒將RNA 反轉錄為cDNA,用于后期基因表達量的測定。使用QuantStudio5 實時熒光定量PCR(ABI,美國)進行qPCR 的測定。反應體系為20 μL:SYBR Premix Ex Tap TM 10 μL,引物F(10 μmol/L)0.8 μL,引物R(10 μmol/L)0.8 μL,cDNA 2 μL,ROX Reverence Dye(2X)0.4 μL,ddH2O 6 μL。PCR 擴增程序為:95℃預變性30 s;95℃變性5 s,58℃退火34 s,40個循環;95℃變性15 s,58℃退火60 s,95℃處理15 s。試驗以肌動蛋白(actin)為內參基因,采用2-ΔΔCt法計算馬鈴薯StSnRK2 基因的相對表達量[31]。
采用本地Blast的生物信息學方法進行分析,從馬鈴薯‘RH89-039-16’全基因組中共鑒定和分析了StSnRK2基因38個StSnRK2,再通過局部保守序列的BLASTP發現28個序列。刪除兩種方法比對后的重復序列,最終保留26 個特征序列,并提交至CDD 和Pfam在線數據庫中進行保守StSnRK2蛋白結構域的確認。最后,共鑒定到23 個StSnRK2 家族成員,分別命名為StSnRK2.1~StSnRK2.23(表1)。表1 列出了基因ID、染色體位置、氨基酸數、分子量和pI。馬鈴薯中StSnRK2 家族基因長度范圍從286(RHC11H2G0520)到491 個氨基酸(RHC01H2G4721)不等。StSnRK2 的分子量為32.6(RHC11H2G0520)~55.4 kD(RHC01H2G4721)。StSnRK2 基因分布于12對馬鈴薯染色體上。StSnRK2 基因的預測等電點為4.51(RHC11H2G0520)~9.47(RHC02H2G1792)。以上結果表明,StSnRK2基因家族中,不同基因的長度相差較大,且與分子量有關。此外,大多數StSnRK2蛋白(65%)的pI小于7.0,由于pI主要取決于氨基酸中酸性氨基酸和堿性氨基酸的比值,因此推斷該家族大多數基因蛋白可能是一類酸性蛋白(表1)。

表1 馬鈴薯StSnRK2基因家族信息Table 1 Information of StSnRK2 gene family in potato
StSnRK2基因家族成員蛋白主要由2部分組成,其中70%的部分為N末端激酶結構域,另外30%的部分位于C末端。其中,能夠響應非生物脅迫的激活區域(Domain Ⅰ)和ABA激活結構域(Domain Ⅱ)的部分主要分布在C末端。對馬鈴薯23條StSnRK2氨基酸序列進行多重序列比對,發現該基因家族在N端具有較高的保守性,屬于StSnRK2基因家族成員的核心區域。C末端存在響應非生物脅迫的激活區域(Domain Ⅰ),該結構域存在于所有家族成員中。除StSnRK2.4和StSnRK2.20兩個蛋白外,其余21個StSnRK2蛋白C末端均存在能夠響應ABA的結構域(Domain Ⅱ)(圖1)。

圖1 馬鈴薯23個StSnRK2蛋白多序列比對Figure 1 Alignment of amino acid sequences of StSnRK2 in potato
為了進一步了解馬鈴薯StSnRK2基因家族成員的同源性,利用水稻、擬南芥、玉米等物種中已鑒定出的SnRK2基因為種子序列,共同構建了與馬鈴薯StSnRK2 的系統發育樹,聚類結果顯示為3 個亞族:Ⅰ、Ⅱ和Ⅲ,分別含有13、8、2個StSnRK2基因(圖2)。

圖2 馬鈴薯StSnRK2基因家族系統進化樹Figure 2 Unrooted phylogenetic tree of potato StSnRK2 gene family
馬鈴薯StSnRK2基因家族3個亞族間的基因結構有顯著差異。其中,I亞族中外顯子的數目為1~10個,且有部分基因在進化過程中可能完全丟失了內含子;II亞族為7~9個,而III亞族成員外顯子數目只有9 個(圖3A)。同一亞族的基因外顯子結構相似,但相似的外顯子長度卻有不同的基因全長,這說明內含子長度可能有很大的差異。由圖3B可知,馬鈴薯StSnRK2基因家族蛋白共鑒定獲得10個保守基序(Motif)。其中,I亞族的蛋白保守序列較II和III亞族結構相對復雜,第I亞族中包含所有保守基序為Motif 1~Motif 10,第II亞族和第III亞族中均只包含Motif 1~Motif 9,Motif 10 只特異性位于亞族Ⅰ中。這些結果表明,馬鈴薯StSnRK2 基因家族均含有Motif 1~Motif 9結構域,但部分成員的其他結構域并不完整。從3 個亞族的結構來看,I 亞族包含Motif 10的基因均不含Motif 4和Motif 8;II亞族和III亞族中Motif在各個基因上的分布基本一致。說明這些基因在遺傳進化過程中可能存在遺傳信息的遺失與改變(圖3B)。

圖3 馬鈴薯StSnRK2基因家族成員的結構特征Figure 3 A structural characteristics of StSnRK2 family in potato
為了進一步研究StSnRK2基因在非生物脅迫反應中的潛在調控機制,利用Perl 語言提取StSnRK2家族基因編碼區上游1.5 kb的序列提交到PlantCare網站進行順式元件的預測。共檢測到6個非生物脅迫響應元件,分別為脫落酸響應元件ABRE,生長素響應元件AuxRR-core,與分生組織表達有關的作用元件CAT-box,參與干旱誘導相關的作用元件MBS,赤霉素響應元件TATC-box以及參與防御和應激反應的作用元件TC-rich。通過3個亞族中不同順式元件的分布情況可知,馬鈴薯StSnRK2基因家族均含有ABRE,CAT-box,MBS和TATC-box 順式作用元件,其中Ⅰ亞族基因相對于Ⅱ亞族富含更多參與生長素響應元件AuxRR-core,而Ⅱ亞族基因相對于Ⅲ亞族富含更多參與防御和應激反應的作用元件TC-rich(圖4)。以上結果表明,StSnRK2基因的表達與這些非生物脅迫應激相關且StSnRK2基因對不同的非生物脅迫作出不同反應可能也與此相關。

圖4 馬鈴薯StSnRK2基因啟動子順式元件預測分析Figure 4 Predicted analysis of cis-elements in StSnRK2 promoters
依據馬鈴薯StSnRK2染色體位置信息,23條基因不均勻地分布在馬鈴薯其中9對染色體,共計15條染色體上(圖5)。其中4_1號染色體上分布的基因較多為3 條,其余染色體上大多分布于1 到2 條基因。3_2、4_1、7_1和11_2號染色體上的基因主要分布在其上端,1_1、1_2、2_1、5_1、5_2、8_1和8_2號染色體的基因則分布在其下端。通過3個亞族基因在染色體上分布情況比較,發現I亞族基因主要集中在1_1、1_2、2_1、2_2、3_2 和7_1 號染色體上;Ⅱ亞族基因主要集中在4_1、4_2和11_2號染色體上;Ⅲ亞族基因主要集中在8_1 和8_2 號染色體上。此外,12_1和12_2號染色體上共同含有Ⅰ亞族和Ⅱ亞族基因。在進化過程中,串聯重復和片段復制共同參與了基因家族的產生,為了進一步研究馬鈴薯StSnRK2基因家族在進化過程中遺傳信息是否發生了串聯重復或大片段基因復制現象,通過MCScanX及下游程序對該家族基因的共線性和串聯重復基因進行了分析(圖6)。結果發現,15 個基因被證實為串聯重復和片段復制基因,占StSnRK2基因家族所有基因的65.2%。其中,位于1_1、1_2、4_1、4_2、5_1、5_2、8_1 和8_2 號染色體上的8個基因為4對獨立的串聯重復基因,占所有共線性基因的53.3%,其余7 個基因不但發生了串聯重復同時也發生了片段復制,且不均勻分布于4_1、4_2、7_1、12_1 和12_2 號染色體,占所有共線基因的46.7%。根據以上結果,可以推斷,串聯重復和片段復制共同促進了馬鈴薯StSnRK2 基因家族的擴大。

圖5 StSnRK2基因在馬鈴薯染色體上的位置Figure 5 Chromosome location of StSnRK2 genes in potato

圖6 馬鈴薯StSnRK2基因家族的共線性分析與基因復制Figure 6 Collinearity analysis and gene replication of potato StSnRK2 gene family
為了更進一步研究馬鈴薯StSnRK2 基因的進化機制,基于煙草和馬鈴薯基因組數據庫構建物種間全基因組共線性關系。結果顯示(圖7),共有10 條StSnRK2 基因與5 條煙草NtStSnRK2 基因構成10 條共線性關系,其中共線性關系主要集中于馬鈴薯1、3、4、7、8 和12 這6 對染色體與煙草1、8、9和11號染色體之間。在對煙草和馬鈴薯基因組間共線性進行分析時,發現馬鈴薯StSnRK2基因與煙草之間的共線性主要集中在1 號染色體上,馬鈴薯1號、4號和12號染色體的下半部分與煙草的1號染色體上半部分同源,而7號和12號染色體上半部分與煙草的11 號染色體下半部分同源。對于上述結果中存在的同源基因對的位置及類型差異,推測可能與近緣物種的祖先分化有關,也進一步為染色體間能夠進行基因片段復制融合提供了有力證據,同時也說明同源染色體間可能還存在一些染色體間不同位置的重排現象。

圖7 煙草和馬鈴薯StSnRK2基因家族基因的比較基因組分析Figure 7 Comparative genomic analysis of StSnRK2 gene family genes in tobacco and potato
本研究中使用的馬鈴薯RNA-seq 數據為FPKM。與原始讀取計數相比,FPKM值可以更好地減少樣本差異。利用基于R語言的DESeq2軟件,分析并調取23 個馬鈴薯StSnRK2 基因在150 mmol/L NaCl下處理24 h、260 μmol/L Mannitol下處理24 h、50 μmol/L ABA下處理24 h和10 μmol/L IAA下處理24 h的FPKM值,并根據其FPKM值進行不同脅迫下的基因表達分析。結果顯示,馬鈴薯StSnRK2基因家族的3個亞族基因在不同脅迫處理下具有不同程度的表達趨勢。其中,在亞族I中的基因主要響應NaCl、甘露醇和ABA脅迫,且53.8%的基因在ABA處理24 h后表達量顯著升高;II亞族基因主要響應ABA 脅迫,87.5%的基因在ABA 處理24 h 后高表達;III亞族基因則主要響應NaCl和甘露醇脅迫,在脅迫24 h時基因表達量有明顯的上升。3個亞族內部呈現出不同的表達模式,有15 個StSnRK2 基因在ABA 脅迫24 h 時表達量發生上調,證明這部分基因對馬鈴薯響應ABA 脅迫具有重要的作用。此外干旱脅迫下的差異表達模式表明,StSnRK2 基因家族在不同脅迫條件下3 個亞族內基因具有不同的反應和調控機制(圖8)。隨后重新處理了材料,并在3個亞族內隨機選取了8個基因StSnRK2.2、StSnRK2.5、StSnRK2.6、StSnRK2.9、StSnRK2.10、StSnRK2.12、StSnRK2.16和StSnRK2.22進行qPCR驗證(圖9)。并利用qPCR結果和RNAseq 數據進行相關性分析,結果發現,qPCR與RNAseq之間具有較強的相關性,這些結果進一步證實了轉錄組測序的可靠性(圖10)。以上結果表明,StSnRK2基因家族成員可響應鹽、ABA、IAA等多種非生物脅迫。

圖8 馬鈴薯StSnRK2基因在不同脅迫下的表達模式分析Figure 8 Expression patterns of potato StSnRK2 genes under different stresses

圖9 馬鈴薯StSnRK2基因家族部分基因在不同脅迫下的基因表達Figure 9 Gene expressions of some genes in potato StSnRK2 gene family under different stresses

圖10 馬鈴薯StSnRK2基因家族部分基因qPCR和RNAseq數據間的相關性分析Figure 10 Correlation analysis between qPCR and RNAseq data of some genes in potato StSnRK2 gene family
目前,中國馬鈴薯主要種植于年平均降水量小于500 mm的干旱和半干旱地區。干旱脅迫會極大的影響馬鈴薯的植株長勢,嚴重會導致其產量的下降甚至絕收[40,41]。SnRK2是一類植物中特有的蔗糖非酵解型蛋白激酶,越來越多的研究表明StSnRK2家族成員在植物響應抗逆脅迫中發揮重要的作用[42-44]。隨著許多植物全基因組序列的獲得,SnRK2基因已經在多個物種中被鑒定出來,如擬南芥[17,28]、小麥[22,23]、玉米[24]和水稻[19,25]等。
本研究從馬鈴薯最新發表的參考基因組‘RH89-039-16’中經過Fgensh[45]和Blast[46]方法克隆得到了馬鈴薯StSnRK2基因家族中的23成員,分別命名為StSnRK2.1~StSnRK2.23。序列比對結果表明,馬鈴薯StSnRK2 基因家族成員在N 端相對保守,而在C端高度特異,這與馬宗桓等[47]在葡萄中的研究結果一致。系統發育樹顯示StSnRK2基因可分為3個不同的亞家族,而不同亞族的結構域差異又決定了其功能的多樣性,這與Li等[26]在高粱中的研究結果相似。除此之外,有研究表明植物在受到干旱等逆境脅迫時,通過調控體內信號傳遞,進而激活相應的轉錄因子并調控植物體內相關抗逆基因的轉錄表達[48]。本試驗通過對馬鈴薯StSnRK2基因家族順式作用元件分析發現3 個亞族基因中均含有ABRE,CAT-box,MBS 和TATC-box 順式作用 元件,這對研究該家族響應抗逆性順式作用元件的功能提供一定的參考。
研究發現基因家族的擴展和基因組進化機制主要取決于基因復制事件,其主要的復制模式為串聯復制和片段復制[31,49]。在本研究中,通過基因共線性分析發現,在馬鈴薯StSnRK2家族成員中共檢測到15個StSnRK2重復基因,其中包括8個串聯重復基因和7 個片段重復基因(圖6),這表明串聯重復和片段復制共同促進了馬鈴薯StSnRK2基因家族的進化,這與Qin等[50]在小麥中關于SWEET基因家族成員擴展的研究結果相似。與煙草比對基因組研究結果發現不同染色體間不僅能夠進行基因片段復制融合而且還可能存在一些染色體間不同位置的重排現象,這種復制現象在大多數植物中非常普遍,且在現代植物核型形成的重要分子機制中起著關鍵作用[51]。
SnRK2s是植物特有的能夠響應非生物脅迫的蛋白激酶家族之一,有研究表明SnRK2s能夠通過結合脫落酸反應元件(ABFs)來激活下游基因,從而激活ABA響應基因的表達[21,52]。在本研究中,發現有15個StSnRK2 基因在50 μmol/L 的ABA 處理24 h 時表達量發生明顯的上調表達,推測這些成員能夠響應ABA激素信號傳導并參與植物調控脅迫應激過程。除上述ABA誘導途徑外,SnRK2s亞家族成員對其他非生物脅迫(NaCl、Mannitol、IAA)也高度敏感。上述結果表明馬鈴薯StSnRK2基因家族成員可以通過多種途徑對逆境脅迫做出反應,進而維持植物細胞的正常代謝和生長發育。本研究為馬鈴薯StSnRK2基因家族成員提供了較全面的信息,為進一步研究該基因家族每個成員的功能和作用機理提供了理論依據。
本研究通過對馬鈴薯StSnRK2家族進行全基因組分析,最終確定出23個StSnRK2基因。基于生物信息學方法,對StSnRK2基因在基因結構、系統發育和逆境相關順式元件等方面進行了全面分析,并根據系統進化和基因結構特征將馬鈴薯StSnRK2家族基因分為3個亞族,不同亞族內基因的結構、保守Motif及順式作用元件等均不同;StSnRK2基因不均等地分布在12 對染色體上,并有多個基因發生了片段復制,且染色體間不僅能夠進行基因片段復制融合還可能存在一些染色體間不同位置的重排現象。StSnRK2 基因家族3 個亞族之間具有明顯的響應不同逆境脅迫的差異性表達,且有部分基因協同調控了馬鈴薯應對逆境脅迫的響應。