陳 凱,佟曉楠,張曉媛,范麗珍,鐘 靜,李興濤
(贛南師范大學 生命科學學院,國家臍橙工程技術研究中心,江西贛州 341000)
胚胎發育晚期豐富蛋白(late embryogenesis abundant protein,LEA)是植物種子發育后期積累的小分子特異性肽,在植物抵御各類非生物脅迫中發揮著重要作用[1]。LEA最初是在棉花胚芽發育后期的子葉中發現[2],其基因家族在植物中陸續發現,如黃瓜(Cucumissativus)[3]、甜瓜(melon)[4]、葡萄(grapevine)[5]和二穗短柄草(Brachypodiumdistachyon)[6]等。LEA蛋白在植物細胞中廣泛分布,不僅分布于細胞質、質膜,還存在于線粒體、葉綠體、過氧化物酶體、內質網、細胞核等多種細胞器中,這與其特定功能和作用模式相關[7]。
研究表明,LEA蛋白具有3種主要的生物功能。首先,部分LEA蛋白能夠與鈣離子和其他金屬離子結合來隔離金屬離子污染[8];其次,部分LEA蛋白在脫水過程中折疊成α-螺旋,橫向地插入到細胞膜中,以此維持細胞結構的穩定[7];最后,LEA蛋白作為分子伴侶,提供一種保護性蛋白結構,防止干燥誘導的蛋白質凝集,維持其三維結構,穩定細胞內基質的玻璃態,玻璃態是由非還原糖,如蔗糖、海藻糖在大多數缺氧生物的細胞質中脫水形成[9-10]。總體而言,LEA蛋白可以保護細胞的完整性,在維持細胞內環境的穩定中發揮著重要作用。
隨著鑒定得到的LEA蛋白序列越來越多,LEA蛋白的分類標準也不斷更新[11]。目前,通常將LEA蛋白家族分為8個不同的亞家族,分別是LEA_1、LEA_2、LEA_3、LEA_4、LEA_5、LEA_6/PvLEA18、脫水素(dehydrin,DHN)和種子成熟蛋白(seed maturation protein,SMP)[12],一些植物具有自身獨特的亞家族,如擬南芥。LEA蛋白中含有豐富的親水氨基酸,如Gly、Ala和Ser,該類蛋白被認為是親水蛋白。然而,一些亞家族(LEA_2、LEA_3和SMP)也含有疏水成員,該類蛋白被認為是非典型LEA蛋白[13]。
LEA基因家族成員在低溫、干旱以及高鹽等非生物脅迫過程中發揮重要調控作用。在低溫4 ℃脅迫處理下,檢測的18個二穗短柄草LEA基因家族成員中有4個基因表達顯著上調,其中,BdLEA062與對照相比上調5倍[6];在干旱脅迫下,26個小麥TaLEA3基因家族成員中的TaG3LEA-1、TaG3LEA-2、TaG3LEA-6、TaG3LEA-13、TaG3LEA-22和TaG3LEA-25對干旱表現敏感,呈現差異表達且隨時間推移(1~6 h)表達量顯著升高[14];過表達谷子SiLEA14擬南芥轉基因植株在高鹽和干旱脅迫條件下的生長狀態優于野生型植株,表明SiLEA14促進了轉基因植株對非生物脅迫的耐受性[15];在毛竹中,5個LEA_2亞族基因中有3個在脫水條件下表達量上調,其中2個在低溫脅迫下表達量也發生上調,表明LEA基因響應多種非生物脅迫[16];過表達玉米的ZmLEA3基因使轉基因酵母和大腸桿菌具有低溫耐受性[17];此外,低溫或干旱脅迫下部分LEA蛋白結合陰離子磷脂囊泡而具有膜穩定功能[4]。這些研究結果均說明LEA基因在抵御非生物脅迫過程中起關鍵作用,在植物抗逆性遺傳改良方面具有巨大的應用潛力。
此研究采用生物信息學方法,對枳(Poncirustrifoliata)LEA基因家族成員進行了鑒定和系統性分析,使用實時熒光定量PCR(qRT-PCR)分析其在不同非生物脅迫下的表達模式,了解PtrLEA基因家族,為進一步研究PtrLEA基因家族的生物學功能提供參考。
以一年生枳盆栽苗為試材。室溫浸種過夜,體積分數為5%的次氯酸鈉水溶液消毒15 min,體積分數為70%的乙醇消毒90 s,蒸餾水淋洗干凈,于30 ℃催芽7 d。篩選發芽一致的種子播于穴盤(草炭、蛭石、珍珠巖按體積比3∶1∶1混合),待幼苗長出5~6片真葉時,選取120株長勢一致的植株,分別在(4±1) ℃,300 mmol/L NaCl和15%PEG 6000條件下進行逆境脅迫處理。處理0、3、6和12 h后分別采集葉片,經液氮速凍后置于-80 ℃低溫保存,以上試驗均設3次生物學重復。
1.2.1 枳LEA全基因組鑒定從Citrus Pan-genome to Breeding Database(CPBD)(http://citrus.hzau.edu.cn/index.php)下載枳全基因組序列。以擬南芥數據庫(https://www.arabidopsis.org/)下載的51個AtLEA氨基酸序列作為查詢序列,利用BLAST程序搜索枳LEA蛋白。從Pfam數據庫(http://pfam.xfam.org)下載LEA基因隱馬爾科夫模型,用HMMER軟件搜索PtrLEA家族成員,通過對HMMER和BLAST結果分析,獲得PtrLEA候選基因,使用Pfam、CDD(https://www.ncbi.nlm.nih.gov/cdd/term)和InterPro(https://www.ebi.ac.uk/interpro/search/sequence/)進行蛋白質結構域驗證,剔除掉不含LEA結構域或結構域不完整的蛋白質序列,確定的枳LEA基因家族成員按照其在染色體上位置的定位命名。利用ExPASy中的ProtParam工具(https://web.expasy.org/protparam/)預測其蛋白序列的氨基酸數、分子量、等電位(pI)等理化性質[18]。通過Wolf Psorf(https://www.genscript.com/wolf-psort.html/)進行亞細胞定位預測[19]。
1.2.2 枳LEA基因家族成員的基因結構和蛋白質保守基序分析基于枳基因組注釋信息,利用在線軟件工具GSDS(http://gsds.gao-lab.org/)進行基因結構可視化。使用MEME(http://meme-suite.org)搜索PtrLEA保守基序,搜索參數:motif的最大數量為30,最小基序列寬度為6,最大基基序列寬度為50,將保存的數據使用TBtools進行可視化。
1.2.3 枳LEA基因家族成員染色體定位及系統發育分析從CPBD下載枳基因組注釋文件,使用TBtools從枳基因組注釋文件中提取染色體長度信息和基因在染色體上的位置信息,利用M2G2(http://mg2c.iask.in/mg2c_v2.0)在線繪制PtrLEA基因在染色體上的位置圖。通過MEGA7.0構建擬南芥LEA蛋白和枳LEA蛋白的系統進化樹,建樹方法為鄰接法,bootstrapping設置為1 000,其他設置均為默認值。
1.2.4 枳LEA基因家族成員啟動子順式作用元件預測使用TBtools提取PtrLEA起始密碼子上游2 000 bp的序列,將序列提交至PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進行啟動子順式作用元件預測,使用Excel統計分析數據并制圖。
1.2.5 枳LEA基因家族成員在不同組織的表達分析從NCBI Short Read Archive database(SRA)(https://www.ncbi.nlm.nih.gov/sra/)分別下載枳不同組織部位的轉錄組測序數據,使用Fastqc軟件對原始數據進行質檢,使用Trimmomatic對轉錄組數據過濾后得到clean data,使用HISAT2將clean data對比到枳的參考基因組上,統計對比結果,計算FPKM值,利用TBtools建立基因表達譜熱圖。
1.2.6 RNA提取和qRT-PCR分析使用植物總RNA試劑盒(Simgen,杭州)提取枳樣品總RNA,以cDNA第一鏈合成試劑盒(Simgen,杭州)反轉錄合成cDNA,用2×SYBR Green PCR Mix試劑(Simgen,杭州)配制qRT-PCR反應體系,儀器為Light-Cycler 480(Roche,Basel,瑞士),10 μL反應體系:cDNA和雙蒸水(ddH2O)各2 μL,上下游引物各0.5 μL,5 μL 2×SYBR Green PCR Mix。PCR程序:95 ℃ 60 s,95 ℃ 20 s,52 ℃ 20 s,72 ℃ 30 s,40個循環。
每個樣品3次重復,基因相對表達水平采用2-ΔΔCT法計算,結果用最小顯著性差異法(least-significant difference,LSD)進行差異顯著性(P<0.05)比較,具體引物序列見表1。
從枳基因組中鑒定出57個PtrLEA基因家族成員,根據其在染色體上的定位分別命名為PtrLEA1~PtrLEA57(表2)。PtrLEA基因家族成員蛋白質序列長度和理化性質差異顯著,其編碼的氨基酸數目在62~945 aa之間,等電點范圍為4.58~10.17,其中42個(73.7%)成員為堿性(pI>7),15個(26.3%)成員為酸性(pI<7)。PtrLEA10分子量最大,為104 982.71 Da,PtrLEA20分子量最小,為6 951.96 Da,平均分子量為27 500.68 Da。57個PtrLEA蛋白中,穩定蛋白約占49.12%(28個),不穩定蛋白約占50.88%(29個)。脂肪系數介于29.16~121.76之間。蛋白質疏水性表明48個PtrLEA蛋白具有高親水性,其余9個PtrLEA蛋白具有疏水性。
根據基因位置信息得到57個LEA基因在染色體上的定位圖(圖1),57個LEA基因在枳的10條染色體上呈現不均勻分布。其中6號染色體PtrLEA基因最多(11個),4號染色體基因最少(2個),染色體1、8、9和10均分布4個PtrLEA基因。總的來說,枳染色體長度與其分布的LEA基因數目沒有相關關系。

圖1 枳LEA基因的染色體定位分析Fig.1 Mapping of PtrLEA genes on chromosomes
為了解枳LEA基因家族成員的進化關系,將擬南芥和枳的LEA基因蛋白質序列合并構建系統進化樹(圖2),108個枳和擬南芥LEA基因家族成員分為9個亞家族:LEA_1、LEA_2、LEA_3、LEA_4、LEA_5、LEA_6、Dehydrin、SMP和AtM,57個PtrLEA被分為8個亞家族,分別為:LEA_1、LEA_2、LEA_3、LEA_4、LEA_5、LEA_6、Dehydrin和SMP。

圖2 枳LEA與擬南芥LEA家族系統進化分析Fig.2 Phylogenetic analysis of LEA family members in P. trifoliata (Ptr) and A. thaliana(At)
LEA_2亞族中存在的PtrLEA數量最多,為35個,LEA_1、LEA_4和LEA_6亞族中存在的PtrLEA數量最少,均為2個。擬南芥有1個額外的亞家族(AtM),由AT2G41280.1和AT2G41260.2組成,亞家族中不包含枳基因家族成員。
為探究PtrLEA的基因結構,對其基因序列的內含子和外顯子組成進行分析(圖3)。如圖所示,PtrLEA基因中內含子很少,有23個(40.35%)PtrLEA基因不包含內含子,15個(26.32%)包含1個內含子,13個(22.81%)包含2個內含子,表明PtrLEA基因結構相對保守。

圖3 枳LEA基因家族成員的基因結構Fig.3 Gene structure of PtrLEA family members
在57個含內含子的PtrLEA基因中,PtrLEA32所含的內含子數量最多,達到11個,其次是PtrLEA10,內含子數量為9個。
為了進一步探究PtrLEA蛋白的序列特征,對PtrLEA蛋白的保守基序進行了分析和比較,得到30個保守Motif(圖4)。結果表明,除PtrLEA20和PtrLEA32外,每個亞族中的基因都有特定的保守基序。不同PtrLEA蛋白的Motif數量差距較大,其中,PtrLEA2、PtrLEA24、PtrLEA40和PtrLEA45均含9個Motif,是所有PtrLEA蛋白序列中最多的。LEA_5和LEA_6亞族成員均只含1個Motif,是所有PtrLEA蛋白序列中最少的。Motif 2在大部分LEA_2亞族蛋白中都存在。總體來說,不同亞族成員的Motif組成差異較大,同一亞族的大多數成員具有相似的Motif,說明同一亞族中的基因功能相似。但是,個別亞族中不同PtrLEA所包含的保守基序也有差異,例如Dehydrin亞族中PtrLEA47多含Motif 2,說明同一亞族不同PtrLEA蛋白也可能有不同功能。最后對PtrLEA20和PtrLEA32單獨進行保守基序分析發現也各自有特定的Motif。

圖4 枳LEA基因家族成員保守基序分布Fig.4 Distribution of conserved motifs within PtrLEA family members
串聯重復和片段復制對于基因家族的進化是必要的,以適應不同環境條件。通過對枳基因組自身進行共線性分析,在57個PtrLEA基因中共檢測到7對片段復制基因(圖5),這些存在共線性關系的基因非均勻分布在chr1、chr3、chr4、chr5、chr6、chr7、chr9和chrUn上,分別是:PtrLEA2-PtrLEA40、PtrLEA16-PtrLEA52、PtrLEA17-PtrLEA51、Ptr-LEA21-PtrLEA37、PtrLEA24-PtrLEA45、PtrLEA25-PtrLEA52和PtrLEA30-PtrLEA55,在chr3和chrUn上分別存在1對串聯重復基因:PtrLEA11-PtrLEA18和PtrLEA56-PtrLEA57。通過分析PtrLEA上游2 000 bp啟動子序列中順式作用元件分布情況(圖6),發現57個PtrLEA基因的啟動子順式作用元件均與激素和逆境響應有關。

圖6 枳中LEA家族成員的順式作用元件Fig.6 Cis-acting elements in promoters of PtrLEA family members
其中,PtrLEA1、PtrLEA3、PtrLEA4、PtrLEA11、PtrLEA14、PtrLEA15、PtrLEA19、PtrLEA21、PtrLEA23、PtrLEA24、PtrLEA29、PtrLEA31、PtrLEA34、PtrLEA36、PtrLEA38、PtrLEA39、PtrLEA40、PtrLEA44、PtrLEA45、PtrLEA47、PtrLEA49、PtrLEA50、PtrLEA51、PtrLEA52、PtrLEA53和PtrLEA55都存在低溫響應元件,推測這些基因在低溫脅迫下發揮作用;PtrLEA1、PtrLEA3、PtrLEA4、PtrLEA14、PtrLEA15、PtrLEA23、PtrLEA24、PtrLEA36、PtrLEA40、PtrLEA44、PtrLEA45和PtrLEA51同時存在低溫和干旱響應元件;PtrLEA1、PtrLEA2、PtrLEA3、PtrLEA5、PtrLEA6、PtrLEA7、PtrLEA8、PtrLEA10、PtrLEA11、PtrLEA13、PtrLEA14、PtrLEA15、PtrLEA16、PtrLEA17、PtrLEA18、PtrLEA19、PtrLEA20、PtrLEA21、PtrLEA22、PtrLEA23、PtrLEA26、PtrLEA28、PtrLEA29和PtrLEA31等基因都存在激素響應元件,包括了水楊酸響應元件、赤霉素響應元件、脫落酸響應元件、生長素響應元件和茉莉酸甲酯響應元件。另外,少部分PtrLEA啟動子中還含有分生組織表達、晝夜控制和玉米醇溶蛋白代謝響應元件。這些結果均反映出PtrLEA基因家族成員通過不同的途徑對各種脅迫做出應答,在植物的生長發育過程中起到關鍵作用。
利用下載的不同枳組織轉錄組數據,對PtrLEA基因在葉、果實、根、芽和胚珠的表達水平進行分析,繪制出PtrLEA相對表達量熱圖(圖7)。

圖7 枳LEA家族成員不同組織表達模式分析Fig.7 Analysis of the expression patterns of the LEA family members in different tissues
如圖7所示,不同PtrLEA基因在枳不同組織中的表達量存在差異。PtrLEA15、PtrLEA17、PtrLEA23、PtrLEA51在所有器官中均有高表達。PtrLEA基因在胚珠中相對表達量最高的是PtrLEA15,其他基因相對表達量較低。也有一些基因在所有器官中都只是低表達,如PtrLEA1、PtrLEA43、PtrLEA48,此外PtrLEA42、PtrLEA56和PtrLEA57等在檢測的5個器官中的表達量很少,可能在其他器官中表達。這些結果表明PtrLEA在植物生長過程中可能起到不同的作用。
本研究利用qRT-PCR技術分析了不同PtrLEA成員在低溫、干旱以及高鹽脅迫下的表達模式(圖8),以此來探究不同成員的潛在功能。在低溫脅迫下PtrLEA1和PtrLEA23的相對表達量在處理12 h后與0 h相比顯著上升,表明這些基因積極響應低溫脅迫;而PtrLEA34和PtrLEA49在低溫處理12 h后分別上調1.43倍和2.41倍。在干旱脅迫下除PtrLEA50和PtrLEA51的變化顯著外,PtrLEA1、PtrLEA15、PtrLEA29和PtrLEA44等基因表達水平總體變化不明顯,可能這些基因在干旱脅迫下不發揮主導作用。在鹽脅迫下PtrLEA29、PtrLEA34、PtrLEA44、PtrLEA50和PtrLEA51的相對表達量在多個處理的時間點相較于0 h均呈現增加趨勢,此外,PtrLEA23在處理3 h時上升到峰值,說明其可能在鹽脅迫早期發揮作用。由此可見PtrLEA基因參與多種非生物脅迫的響應。

LT.(4±1) ℃低溫處理;PEG.15% PEG 6000溶液處理;NaCl.300 mmol/L NaCl溶液。不同小寫字母表示在P<0.05水平上顯著差異。圖8 枳LEA家族成員在不同非生物脅迫處理下的相對表達量LT. Low temperature (4±1) ℃; PEG. Water culture with 15%; NaCl. 300 mmol/L NaCl. Different normal letters indicate significant differences at the 0.05 level.Fig.8 Relative expression levels of PtrLEA family members under different stress treatments
在長期的自然選擇壓力下,高等植物進化出了多種應對非生物脅迫的響應機制,其中某些功能蛋白的合成可以幫助植物減少損傷和保護細胞。LEA蛋白基因家族就是其中一種重要蛋白,LEA基因在高等植物非生物脅迫下和胚胎發育過程中起著關鍵作用[20]。到目前為止,隨著擬南芥、水稻以及玉米等植物物種全基因組測序完全,LEA基因家族在越來越多的植物中被鑒定出來,然而枳基因組的LEA基因家族尚未確定,也沒有關于枳中LEA基因應對非生物脅迫的報道。本研究利用生物信息學的方法從枳中鑒定出57個LEA基因家族成員,對這些基因進行亞細胞定位預測發現,PtrLEA蛋白存在于很多細胞器中,包括細胞核、線粒體、葉綠體以及細胞質,這有利于非生物脅迫條件下抗脅迫機制的迅速建立[4]。玉米的LEA_2亞族蛋白在質膜中的分布受絲氨酸磷酸化的控制,在脫水條件下,其與糖和磷脂囊泡結合已被證明可以實現膜穩定[7-12,14-21]。此外,位于葉綠體或線粒體的LEA_3亞族蛋白在細胞器中是非結構化的,而且在干旱脅迫下轉化為α-螺旋結構[4-8]。這些結果表明,每個LEA蛋白的亞細胞定位與其在細胞器中的作用之間存在相關關系。
在本研究中,PtrLEA基因結構分析表明,大多數PtrLEA基因僅含有0~2個內含子,甚至有40.35%的PtrLEA基因不含內含子。許多植物LEA基因結構研究也發現,LEA內含子數量很少,如甜橙(83%)、甘藍型油菜(82%)和木薯(73%)的LEA基因僅有0~1個內含子[9-10,22]。由于內含子剪切需要的時間大于轉錄時間,所以轉錄速率與內含子數量呈負相關,無內含子的基因能夠更快轉錄生成蛋白質[6]。因此,大多數PtrLEA基因中內含子數量不多解釋了PtrLEA基因在非生物脅迫下能被迅速、強烈地誘導或抑制。此外,屬于同一亞族的PtrLEA基因具有相似的基因結構,這與它們的系統發育關系和亞族的分類相呼應。
基因復制是基因組結構的一個主要特征,在植物基因組和生物體的進化過程中具有重要作用,為基因突變和選擇提供了新的遺傳材料,最終導致新基因功能的出現和基因網絡的進化[23]。基因復制機制不僅能夠使基因組含量擴大,而且有助于基因功能多樣化,以確保植物具有足夠適應性[24]。在對枳LEA基因的共線性分析中,發現了7對染色體片段復制基因和2對染色體串聯重復基因,其染色體片段復制是驅動枳LEA基因家族擴張的主要機制。
順式元件在控制非生物脅迫和植物激素反應的基因轉錄調控中發揮各種關鍵作用。已經鑒定到許多與非生物脅迫相關順式元件,包括W-Box、MBS、和ABRE元件等,枳LEA基因啟動子上游亦有這些順式作用元件,所得結果與番茄[25]、棉花[26]、楊樹[27]等植物中LEA基因分析中檢測到的順式作用元件一致,枳中的9個LEA基因,大部分會受低溫、鹽、干旱等脅迫的誘導,說明PtrLEA基因也參與了非生物脅迫的應答。這為PtrLEA參與非生物脅迫響應提供了強有力的證據。枳LEA基因啟動子上游除了非生物脅迫響應元件外,還發現各種激素類響應元件,表明該基因具有復雜的調節機制。綜上所述,對枳LEA基因家族的鑒定及其表達分析,為進一步研究枳LEA基因的生物學功能、調控枳生長發育與逆境響應的分子機制奠定了一定的理論基礎。