關思靜, 王楠, 徐蓉蓉, 葛甜甜, 高靜*,顏永剛, 張崗, 陳瑩, 張明英
(1.陜西中醫藥大學藥學院,陜西省秦嶺中草藥應用開發工程技術研究中心,西安712046;2.陜西中醫藥大學,陜西中藥資源產業化省部共建協同創新中心,陜西 咸陽 712083)
原核生物中廣泛存在一種信號轉導機制,即雙組分調節系統,該系統最關鍵的過程是His-ASP在HK(his-kinase)和RR(response regulator)之間的磷酸轉移反應[1]。Makino等[2]在編譯擬南芥所有RR時發現了一組基因,每一個都是編碼ARR(authentic response regulator)類蛋白質,但是這些基因卻不具有真正的RR所具有的接受磷的Asp殘基,而是被Glu取代,因此將它們命名為偽答調控(pseudo response regulator,PRR)蛋白,每個PRR都包含一個N端REC的偽響應調節受體域(pseudo-receiver domain)以及C端植物特有的CCT結構域[3]。基于結構特征,在陸生植物中PRR有3個分支,包括TOC1(PRR1)、PRR7/3和PRR5/9[4]。這5個PRR基因在擬南芥生物鐘系統中扮演著重要的角色,Matsushika等[5]研究證實,它們以PRR9→PRR7→PRR5→PRR3→PRR1的順序被轉錄翻譯。目前,PRR家族成員的分子功能尚不清楚,但其生物作用已被明確與晝夜節律相關。
晝夜節律是生活在世界上許多生物體的“時鐘或振蕩器”產生的,這種生物節律維持一個接近24 h的周期,與地球繞著地軸自轉的周期相對應,同時受到植物體內生物鐘的控制,作為一種計時機制,存在于多種生物體中,控制著生物體遺傳、代謝和生理過程的時間[6],包括光合作用[7-8]、營養生長階段的生長速度[9]、開花時間、非生物和生物脅迫反應,最具有特色的晝夜節律事件之一是花期的光周期調控[10]。目前,模式植物擬南芥生物鐘分子機制已經得到了廣泛的研究,其基本結構包含2個MYB相關的轉錄因子LHY(late elongated hypocoty)和CCA1(circadian clock-associated 1)以及中心振蕩器的另一個重要組成部分,屬于PRR蛋白的TOC1(timing of Cab expression)[11-12]。其中CCA1和LHY在早上表達,并抑制晚間表達的TOC1,而TOC1又抑制CCA1和LHY的轉錄[13-14]。除此之外,PRR家族其他成員(PRR9/7)與CCA1和LHY的啟動子結合并抑制其表達;而CCA1和LHY又通過結合啟動子直接促進PRR7和PRR9的表達[15-16]。
PRRs 在模式植物擬南芥中的研究已經相當清晰,在其他植物中PRRs的研究較少,多集中于農作物,如水稻中鑒定了5個與擬南芥同源的PRR基因,即OsPRR1、OsPRR37、OsPRR73、OsPRR59、OsPRR95[17];小麥TaPRR37編碼PRR家族蛋白,與擬南芥APRR7和水稻OsPRR37同源[18];大麥HvPRR37編碼PRR家族蛋白,與擬南芥APRR7同源[19]。甘草是常見的大宗藥材,多生長在西北干旱環境下,在甘草蛋白分子研究中,已有的工作主要集中在對活性成分合成相關基因的克隆和表達分析[20-21],而對PRR蛋白在甘草中的研究卻未見報道。為了揭示PRRs在不同脅迫下的潛在作用,本研究對甘草PRR基因家族(GuPRRgene family)進行了系統分析,并在全基因組水平上分析了PRR基因在干旱、鹽和低磷非生物脅迫下的表達模式,闡明不同脅迫條件下PRRs基因的功能,為進一步了解植物PRRs基因的進化關系提供了信息。
試驗用烏拉爾甘草(GlycyrrhizauralensisFisch.)種子購自峰華農業有限公司,種子經消毒后,于人工氣候箱(光/暗周期為12 h/12 h)中催芽1周,挑選長勢一致的幼苗采用霍格蘭營養液水培。選擇生長1月的幼苗,分別采用15%聚乙二醇(PEG-6000)進行干旱脅迫處理、150 mmol·L-1氯化鈉(NaCl)進行高鹽脅處理、10 μmol·L-1磷酸二氫鉀進行低磷(LowP)脅迫處理。對照(CK)僅用營養液培養,不做任何處理。3個生物學重復,在脅迫處理1周后采集對照和處理組的甘草幼苗地上部分和地下部分,-80 ℃冰箱保存備用。
1.2.1轉錄組測序 委托杭州景杰生物科技有限公司利用Illumina HiSeq 2000測序平臺對采集甘草樣本進行高通量測序分析。將測序得到的原始圖像數據文件經堿基識別轉化為raw Data。使用Trimmomatic軟件設置默認參數,去除Illumina平臺的FASTQ序列中的接頭,并根據堿基質量值對FASTQ進行修剪,得到clean reads,然后用TopHat2進行參考基因組比對分析。使用RPKM法對reads count進行均一化處理,評估基因的表達量。
1.2.2甘草中偽應答調控蛋白(PRR)的篩選與鑒定 甘草基因組數據來自Mochida等[22]已發表數據(http://ngs-data-archive.psc.riken.jp/Gur-genome/);以擬南芥PRR家族成員APRR1、APRR3、APRR5、APRR7、APRR9基因序列作為查詢序列,運行TBtools工具的本地檢索程序[23],篩選閾值設為1×10-5,初步獲得候選甘草PRR基因家族成員;將候選基因的蛋白序列提交到NCBI,進行在線blastp比對,根據注釋信息篩選出甘草PRR家族相關的基因;然后將二次比對得到的序列通過NCBI-CDD數據庫和pfam數據庫(https://pfam.xfam.org/)進行進一步的結構域驗證,去掉結構域不完整的蛋白序列,最終鑒定出甘草PRR家族成員。
1.2.3甘草PRR家族基因的生物信息學分析 運行TBtools軟件的Batch SMART程序,對甘草PRR蛋白保守結構域可視化;采用ExPASY-Prot Param(https://web.expasy.org/protparam/)分析篩選出的甘草PRR基因編碼蛋白的理化性質;借助Cell-PLoc2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)進行蛋白亞細胞定位預測;用SOMPA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測蛋白二級結構;同時采用SWISS-MODEL(https://swissmodel.expasy.org/)進行甘草PRR蛋白三維建模分析并用PROCHECK(https://servicesn.mbi.ucla.edu/PROCHECK/)對蛋白質三級結構檢驗;利用MEME(http://meme-suite.org/tools/meme)在線工具對甘草PRR蛋白進行保守基序分析;提取甘草PRR基因上游2 kb的序列信息,使用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測順式作用元件;通過獲得的甘草基因序列和CDS序列,利用GSDS2.0(http://gsds.cbi.pku.edu.cn/)分析甘草PRR基因結構;采用MEGA7.0軟件進行氨基酸比對和構建進化樹,并用GeneDoc軟件編輯比對后的序列。
1.2.4甘草PRR基因家族表達模式分析 利用轉錄組測序數據分析甘草PRR基因(GuPRR)的表達特征。轉錄組數據包含甘草干旱、高鹽以及低磷脅迫處理和對照的基因表達數據,以不同實驗條件下的RPKM值為表達水平,通過對數據進行對數值轉換,利用TBtools的HeatMap程序做熱圖分析。
利用TBtools和blastp兩種比對方法,從甘草基因組中鑒定出13條PRR候選蛋白序列。之后通過NCBI-CDD和pfam數據庫對13條候選蛋白序列進行保守結構域驗證,發現其中7條具有完整的REC、CCT結構域(圖1),其余6條由于結構域不完整而去除。分析這7個甘草PRR基因編碼的蛋白質理化性質和亞細胞定位(表1)發現,這些蛋白質的氨基酸大小介于553~837 aa之間;分子質量在61.930~91.683 kD之間;等電點最低為5.75(GuPRR2),最高為8.45(GuPRR4),其中等電點大于7的有4條,小于7的有3條;氨基酸不穩定系數均大于40,表明這7條甘草PRR蛋白均為不穩定蛋白質;總平均親水性均為負值,推測這7條甘草PRR蛋白均為親水蛋白質。亞細胞定位結果顯示,這7條甘草PRR蛋白均存在于細胞核中,與Fuijiwara等[24]的研究結果吻合,進一步驗證了這7個預測基因屬于PRR基因家族。

表1 GuPRR基因家族理化特性

圖1 甘草PRR蛋白保守結構域
由SOMPA預測甘草PRR蛋白二級結構,結果(表2)發現,甘草PRR蛋白二級結構由α-螺旋、β-轉角、延伸鏈以及無規則卷曲4種成分組成,其中α-螺旋與無規則卷曲為主要組成成分,β-轉角所占比例最小。隨后利用SWISS-MODEL預測甘草PRR蛋白三級結構,結果如圖2所示,這7個PRR蛋白三級結構可分為4種類型,GuPRR1含有的α-螺旋結構數量最少,卻含有最多的延伸鏈;GuPRR2和GuPRR3具有相似度較高的三維結構,α-螺旋占比高于其他GuPRR蛋白;GuPRR4和GuPRR5三級結構相似度較高,GuPRR6和GuPRR7三級結構相似度較高。為了檢驗蛋白三級構象的合理性,采用了蛋白質結構檢驗工具PROCHECK對甘草的PRR蛋白三級結構進行檢驗,發現7個甘草PPR蛋白氨基酸殘基位于最佳區和次允許區域的比例分別為98.2%、98.2%、97.8%、97.6%、96.6%、99.4%、99.4%,均超過96%,且G-factors值都大于-0.5,說明這7個PRR蛋白的三維結構是合理的。

表2 甘草PRR蛋白二級結構

圖2 甘草PRR蛋白三級結構預測
提取甘草PRR基因上游2 kb的序列,分析其順式作用元件,結果(圖3)發現,GuPRR基因上游存在4類順式作用元件:①光響應相關元件,如GT1-motif元件、G-box元件、Box4元件、GA-motif元件等;②植物激素響應相關元件,如響應SA代謝的TCA-element元件、響應ABA代謝的ABRE 元件、響應MeJA代謝的CGTCA-motif元件等;③植物生長發育響應相關元件,如分生組織表達相關的CTA-box、晝夜節律調節中的circadian元件等;④逆境脅迫響應相關元件,如干旱脅迫響應元件MBS、低溫脅迫響應元件LTR等。進一步研究發現,7條GuPRR基因中都有光響應元件,共111個,占預測順式作用元件42.7%,表明甘草PRR基因家族可能在光響應調節中扮演著重要角色。

圖3 GuPRR基因順式作用元件
為了了解甘草PRR基因家族成員的進化關系,利用雙子葉植物甘草、擬南芥、大豆、豌豆,以及單子葉植物水稻、小麥、高梁PRR基因家族的全蛋白序列構建進化樹。結果(圖4)顯示,這幾個物種的PRR蛋白被分為4個分支(圖4),甘草的PRR蛋白分成3組。進一步分析發現,GuPRR1與APRR1相近,GuPRR2與GuPRR3與APRR5/9更加相近,而GuPRR4~7則歸屬于APRR3/7一組,其中GuPRR4和GuPRR5與APRR3更為相近,GuPRR6和GuPRR7與APRR7更為接近。通過對系統進化樹分支分析發現,甘草與大豆、豌豆的進化距離較其他物種更短,說明甘草的PRR基因與同科的大豆、豌豆進化關系更為接近。

注:Gu—甘草;Ps—豌豆;Ga—大豆;A—擬南芥;Os—水稻;Ta—小麥;Sb—高粱。
利用MEME在線工具預測甘草PRR蛋白的保守基序,共預測到22個motif,結果如圖5所示,motif 1和motif 3作為REC結構域的保守基序、motif 2和motif 4作為CCT結構域的保守基序,這4個motif出現在所有甘草PRR蛋白中。此外,GuPRR2和GuPRR3、GuPRR4和GuPRR5、GuPRR6和GuPRR7具有相同的motif。為了進一步了解PRR基因的進化關系,對每個基因的內含子/外顯子結構進行分析,結果(圖6)顯示,GuPRR基因的外顯子數量8~12不等,內含子數量5~11不等。PRR家族基因成員的系統進化樹分析表明,位于同一分支的GuPRR基因具有相似的內含子/外顯子分布,如GuPRR4和GuPRR5基因都具有11個內含子和12個外顯子;不同于GuPRR4和GuPRR5所在的分支,另一分支的GuPRR2和GuPRR3具有8個內含子和10個外顯子,這表明不同的甘草PRR基因在進化過程中其結構與功能已經發生了分化。保守基序分析表明,預測的GuPRRs偽受體區域氨基酸序列與APRRs的氨基酸序列高度一致(圖7A),且它們的中心含有獨特的谷氨酸殘基(E);CCT結構域序列的預測氨基酸序列也與APRRs序列一致(圖7B),且REC結構域與CCT結構域中間的氨基酸序列具有很大的差異性。

圖5 GuPRR基因家族保守基序

圖6 GuPRR基因結構

A:偽響應調節受體域;B:CCT結構域
圖8 A所示,甘草地上部分的PRR基因在對照(CK)處理下,GuPRR1/4/5的表達量高于GuPRR2/3/6/7;鹽脅迫(NaCl)處理中,僅GuPRR1上調表達,其余GuPRRs表達量下調或未檢測到表達量;干旱脅迫(PEG)處理下,GuPRR1/2/3的表達量上調,GuPRR6/7/4/5表達量很低或表達量下調;低磷脅迫(LowP)處理下,僅GuPRR1表達量明顯下調,其余GuPRR均上調表達。甘草根PRR基因在各處理中表達模式如8B所示,對照(CK)中,7條GuPRRs均具有較高的表達量;鹽脅迫(NaCl)處理中,僅GuPRR2上調表達;干旱脅迫(PEG)與低磷脅迫(LowP)處理下,7條GuPRR基因表達量下調明顯,均低于對照(CK)處理。

A:甘草地上部分;B:甘草根
PRRs在植物中普遍存在,并已被證明在調節植物晝夜節律中發揮作用[1,3,25]。PRRs包含有2個特殊的保守結構域,分別是N端的REC和C端的CCT,這2個保守結構域被一長段不保守的可變域分隔開。研究表明,PRRs的偽響應調節受體域來自能夠磷酸化的接收域[4],這個接收域中包含1個保守的天冬氨酸-天冬氨酸-賴氨酸(DDK)基序,而在被子植物的PRRs中,第2個天冬氨酸(D)已經轉化為谷氨酸(E)[1]。本研究利用生物信息學從甘草基因組中鑒定得到7個甘草PRR基因,GuPRR1、GuPRR2、GuPRR3、GuPRR4、GuPRR5、GuPRR6、GuPRR7與擬南芥和水稻的PRR基因高度同源。7個基因編碼的蛋白都具有完整的REC和CCT保守結構域,預測的GuPRRs與APRRs的偽響應調節受體區域氨基酸序列一致,且在中心包含一個獨特的E。進化分析將這7個甘草PRR蛋白聚為3類,與擬南芥和水稻的PRR蛋白進化一致。這些結果說明7個PRR基因屬于甘草偽響應調節基因。
大部分干旱應答基因都表現出節律性表達模式,干旱引發的生理反應也受晝夜節律調節的影響[26-27]。Marcolino-Gomes等[28]采用RNA-seq和定量分析發現干旱脅迫引起大豆晝夜節律基因表達的顯著變化,其中僅有PRR3在中度干旱脅迫處理下上調表達,而PRR3/7/9均表達減弱。干旱脅迫導致水稻大部分早晨生物鐘基因表達振幅減弱,傍晚和夜晚生物鐘基因表達增強[29]。另外,鹽脅迫也會反饋調節生理時鐘的振幅和周期[11],Habte等[30]研究表明,鹽脅迫改變了大麥根部的時鐘基因表達,使大麥對逆境脅迫的響應更為靈敏。本研究結果中,由對照處理可以看出,PRR基因在甘草根中的表達量高于地上組織,但在脅迫處理中,根中的GuPRR基因僅GuPRR2在鹽脅迫處理中上調表達;而地上組織中,在不同脅迫處理下均有上調表達的GuPRR基因,如鹽脅迫處理中的GuPRR1、干旱脅迫處理中的GuPRR2/3、低磷脅迫處理下的GuPRR4等基因,這表明,不同部位甘草PRR基因在脅迫響應中存在明顯差異,推測地上組織中的PRR基因在脅迫響應中具有更明顯的正向調控作用。
生物鐘基因的轉錄調控可能通過這些基因啟動子區域中存在的順式作用元件發生,因此,本研究分析了PRRs啟動子區域,并預測到了晝夜節律和光響應元件,包括circadian(CAAAGATATC)、G-box(ACACGTGT)等,這些結果暗示了甘草PRRs可能參與晝夜節律調控。除此之外,在啟動子序列中還預測到干旱響應性元件(MBS)、低溫響應性元件、無氧誘導相關元件以及與脫落酸、水楊酸、茉莉酸甲酯、生長素等激素相關的順式反應元件。植物體內激素的合成也受晝夜節律調節。生物鐘調節組分CHE(CCA1 hiking expedition)已被證明可以與水楊酸生物合成的主要基因ICS1(isochorismate synthase 1)的啟動子元件結合,并調節水楊酸表達[31]。Li等[32]研究表明,水楊酸可顯著提高烏拉爾甘草不定根中甘草酸、甘草次酸以及多糖等有效成分的含量。Liu等[33]通過 ChIP-seq 技術發現PRR7的靶基因在其上游區域包含脫落酸響應元件(ABRE),并調控脫落酸的表達量。研究表明,干旱脅迫下甘草根脫落酸含量顯著增高,且與甘草酸的含量呈顯著正相關[34]。乙烯和生長素的生物合成也被認為受到晝夜節律的調節[35-36],二者能夠促進植物根的形成,進而提高植物的生物量以及抗脅迫能力。因此,可以推測甘草PRR基因可能通過調控水楊酸、脫落酸等激素水平影響其生長發育和次生代謝產物合成。
甘草是豆科多年生草本植物,除了重要的藥用價值,因具有抗寒、抗旱、抗鹽堿等優良特性同時也是重要的草地資源之一。當前,甘草全基因組草圖序列已經公布[22],有助于進一步通過分子育種提高生物活性性狀和生產力。PRR基因促進植物生長發育,同時也響應外界非生物脅迫,本研究獲得的7個PRR基因,從理化性質、定位、基因結構、進化分析等方面初步鑒定屬于甘草PRR基因。但PRR家族基因成員目前僅在模式植物擬南芥中研究較為廣泛,其結構、功能以及表達模式仍然需要更加系統的研究,從而更全面地揭示PRR家族基因的分子機制,為今后研究甘草生長抗逆的分子機制提供科學依據。