何福林,劉 詢,張 斌(. 湖南科技學院 化學與生物工程學院,湖南省銀杏工程技術研究中心,湖南永州 4599;
2.南京農業大學 生命科學學院,南京 210095)
體細胞胚胎發生類受體激酶(Somatic embryogenesis receptor-like kinases,SERK)屬于富含亮氨酸重復序列類受體激酶(Leucine-rich repeat sequence receptor-like kinase,LRR-RLK)家族的第二亞家族,在進化上高度保守[1]。SERK蛋白編碼基因含有11個外顯子,且每個外顯子傾向于編碼一個特定的蛋白結構域[2]。SERK蛋白通常包含7個保守的結構域,從N端到C端分別為1個N端信號肽、亮氨酸拉鏈結構域、5個富含亮氨酸重復序列結構域、1個SPP(Ser-Pro-Pro)結構域、1個跨膜結構域、胞內激酶活性區域和C末端區域[3]。SERK基因最早是從胡蘿卜中分離鑒定出來的,其在體細胞胚胎形成過程中發揮重要作用。目前,已經在多種不同植物中鑒定出SERK家族基因,包括擬南芥[4]、水稻[5]、玉米[3]、小麥[6]、苜蓿[2]、蘋果[7]等。然而有研究表明,SERK基因除了參與體細胞胚胎形成過程外,在植物的整個生長周期發揮多種生物學功能,如參與植物對病原菌和真菌的防御反應、響應非生物脅迫以及調控植物衰老過程。
擬南芥AtSERK1和AtSERK2基因在莖、葉、花和果莢中均有表達,但在花和果莢中表達水平相對較高,其可參與控制孢子體分化進而影響雄配子體發育,而AtSERK3和AtSERK4則參與調節油菜素內酯非依賴性的細胞死亡途徑[8-9]。水稻OsSERK1可在幼苗葉片、莖和劍葉中表達且在劍葉中表達較高,其能被稻瘟病菌、宿主細胞死亡、防御信號分子(如水楊酸和茉莉酸)以及其他脅迫信號激活表達,過表達OsSERK1基因的轉基因水稻則對稻瘟病的抗性增強[5]。而蘋果MdSERK家族基因在根、木質部、韌皮部、葉和根尖中均有表達,其中MdSERK1、MdSERK7在根尖的表達相對較高,MdSERK2/5、MdSERK6/11在韌皮部表達較高,MdSERK4、MdSERK12在木質部和韌皮部表達較高,MdSERK3在根中的表達較高,MdSERK8、MdSERK9、MdSERK10在葉中的表達水平較高,另外,蘋果MdSERK2/5、MdSERK3、MdSERK6/11基因的表達水平在ABA處理后上調,而鹽處理能夠激活MdSERK4、MdSERK6/11、MdSERK10的表達,提高其在葉中的表達水平[7]。此外,鹽脅迫下大麥小孢子胚性愈傷組織中HvSERK家族所有基因的表達量都上調,其中HvSERK2基因在接種白粉病的大麥葉中表達水平也上調[10]。而苜蓿MtSERK1基因表達能夠響應生長素處理[2]。這說明上調SERK基因的表達,可以提高植物對生物脅迫或非生物脅迫的適應能力。
盡管很多植物SERK基因已被分離鑒定并進行深入的功能研究,Yang等[11]從栽培大豆(Glycinemax)中克隆到1個SERK基因(Genbank登陸號:EU869193,即為本研究中的GmSERK16),并對其功能進行探究,發現該基因的表達水平在甘露醇、脫落酸(ABA)、水楊酸(SA)和茉莉酸(JA)處理后均上調,說明其在植物生長發育的多個方面發揮作用。但是關于大豆SERK家族基因的全基因組鑒定及在非生物脅迫下的表達模式的研究還很少。本研究從大豆全基因組中鑒定SERK家族基因,并對基因家族成員的染色體定位、基因和蛋白結構、系統進化關系以及在不同組織中的表達模式和鹽脅迫誘導后的表達模式進行了分析,為進一步研究SERK家族基因在大豆生長發育過程和環境適應性方面的功能奠定基礎。
利用已知的擬南芥AtSERK(AtSERK1-5)蛋白序列在大豆數據庫(http://soykb.org/search/gene.php)中進行比對,下載同源性較高的序列。下載的所有蛋白序列用數據庫SMART(http://smart.embl-heidelberg.de/)和NCBI(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)檢查是否含有SERK蛋白通常具有的保守結構域,然后剔除不具備這些保守域的大豆SERK蛋白序列。大豆SERK家族基因的染色體位置信息則從Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Gmax)數據庫獲得,大豆染色體長度信息從NCBI數據庫(https://www.ncbi.nlm.nih.gov/genome/?term=Glycine+max)中獲得,利用Map Chart 2.2軟件繪制GmSERKs基因的染色體定位圖[12]。
大豆GmSERKs基因序列和CDS序列從Phytozome數據庫下載,利用在線工具GSDS(Gene Structure Display Server,http://gsds.cbi.pku.edu.cn/index.php)繪制基因結構圖,分析外顯子、內含子的數量組成。采用MEME在線工具(http://meme-suite.org/)分析氨基酸序列上的保守基序(Motif)[13],參數設置:保守基序最小長度為6,最大長度為50,最大數量設置為10。而篩選出的大豆SERK蛋白分子質量(ku)及等電點(PI)則通過在線工具ExPASy(https://web.expasy.org/protparam/)進行預測。
為了研究大豆SERKs與其他物種在進化上的關系,從TAIR數據庫(https://www.arabidopsis.org/index.jsp)下載擬南芥SERK蛋白序列,水稻SERK蛋白序列從數據庫RGAP(http://rice.plantbiology.msu.edu/)下載,玉米和苜蓿SERK蛋白序列從Phytozome數據庫(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_ZmaysPH207)下載,根據已報道的蘋果SERK基因號在數據庫(https://www.rosaceae.org/)中下載對應的蛋白序列[7]。利用Clustal X對大豆、擬南芥、水稻、玉米、苜蓿和蘋果SERK蛋白序列進行多重比較,將比對結果在MEGA 7.0軟件中打開,用鄰接法(neighbor-joining,NJ)繪制系統進化樹,參數設置:Bootstrap為1 000,其他均使用默認參數[14]。
大豆SERKs基因在不同組織和發育階段的表達數據從大豆數據庫SoyKB(http://soykb.org/)獲得(即轉錄組數據中的RPKM值,Reads Per Kilobase per Million mapped reads),共列出了基因在嫩葉、花、1 cm果莢、10DAF(花后時間,Days after flowers)果莢殼、14DAF果莢殼、10DAF種子、14DAF種子、21DAF種子、25DAF種子、28DAF種子、35DAF種子、42DAF種子、根和根瘤共13個不同組織或發育階段的表達數據。利用Heml 1.0軟件繪制基因的表達熱圖[15]。
本試驗使用的大豆為普通栽培大豆,其對應的全基因組數據庫SoyKB(http://soykb.org/)使用的材料也是栽培大豆。大豆(Glycine max)種子用蒸餾水浸泡3 h后直接播種在營養土(品氏泥炭土,10~30 mm,丹麥)中,生長環境條件設置:溫度恒溫22 ℃,濕度60%~70%,光照為長日照(晝16 h/夜8 h)。待大豆長出三出復葉后,用1/2 Hoagland營養液(CK)和含有250 mmol/L NaCl的1/2 Hoagland營養液處理,分別在處理1 h、6 h、12 h時取三出復葉的其中一個完整葉片,每個時間點取3個獨立的單株材料,用液氮速凍后暫存于超低溫冰箱備用。
使用RNA提取液TRIzol(Invitrogen)抽提大豆葉片總RNA,然后跑電泳檢測RNA提取質量。用Dnase I(TaKaRa)處理提取的總RNA以除去可能含有的DNA,避免檢測基因表達水平時產生誤差。使用反轉錄試劑盒(Thermo Fisher)合成cDNA,以合成的cDNA為模板進行qRT-PCR分析,操作步驟參照文獻[12],PCR反應總體系為20 μL:用去離子水稀釋后的cDNA 8.8 μL、正向和反向引物各0.6 μL和10 μL SYBR Green Mix(康為世紀),利用Bio-Rad CFX-96 PCR儀(美國Bio-Rad)進行PCR擴增反應,反應體系使用兩步法:95 ℃,預變性3 min;95 ℃變性10 s,60 ℃退火延伸30 s,共40個循環。基因的相對表達量的計算利用2-ΔΔCT法[16]。以GmActin基因(Genbank登陸號:KP030799)為內參基因[17],具體引物見表1。

表1 本研究中用到的引物Table 1 Primers used in this study
利用擬南芥AtSERK家族蛋白序列在大豆基因組數據庫中共篩選出25個大豆SERK基因,根據這些基因所在染色體順序及基因編號,將其命名為GmSERK1~GmSERK25。對氨基酸序列分析可知,25個大豆GmSERK基因編碼長度為596~644 aa(氨基酸,amino acids)長度的蛋白質,其中 GmSERK21蛋白序列最長(644 aa),而 GmSERK10蛋白序列最短(596 aa)。通過在線工具ExPASy對該家族基因編碼蛋白的理化性質進行分析,發現對應的蛋白質的相對分子質量為67.15~70.70,GmSERK17的相對分子質量最大(70.70),而GmSERK10的最小(67.15)。此外,蛋白質的等電點(PI)為4.95(GmSERK12)~8.15(GmSERK2)(表2)。
大豆全基因組共含有20條染色體,而25個GmSERK基因分布在其中的12條染色體上(圖1)。在第10、11、15、17、19和20號染色體上均只包含1個GmSERK基因,且主要分布在染色體靠近兩端的區域;18號染色體最長(58.02 Mb), 1號染色體次之(56.83 Mb),但在1號和18號染色體上都只有2個GmSERK基因,同樣在13號染色體上也包含2個GmSERK基因;而在2號、5號染色體上各包含4個GmSERK基因;8號染色體上GmSERK基因數量最多,共5個。
為了研究SERK家族在大豆和其他物種中的進化關系,我們根據已有報道,從數據庫下載了擬南芥、水稻、玉米、苜蓿和蘋果的SERK蛋白序列,和大豆SERK氨基酸序列一起進行多重比對后,在MEGA 7.0軟件中采用鄰接法繪制系統進化樹。根據SERK家族在蘋果中的分組方法[7],大豆SERK家族可分為4個亞家族(Ⅰ、Ⅱ、Ⅲ、Ⅳ)(圖2),第Ⅲ亞家族最大,共包含11個SERK成員,而在第Ⅱ亞家族中僅包含2個成員。大豆GmSERK14、GmSERK20基因與苜蓿MtSERK2-6在進化上關系較近,并且和蘋果MdSERK1、MdSERK8、MdSERK9以及擬南芥AtSERK3-5共同屬于第Ⅰ亞家族。大豆GmSERK4、GmSERK16、GmSERK25基因和擬南芥AtSERK1-2以及蘋果MdSERK4關系較近,同屬于第Ⅱ亞家族,且該亞族還包含玉米ZmSERK1-2基因和水稻OsSERK1-2基因。而在第Ⅲ亞家族中,大豆GmSERK1、GmSERK3與蘋果MdSERK6、MdSERK11關系較近,GmSERK6、GmSERK21與MdSERK2關系較近,GmSERK2、GmSERK5與MdSERK5、MdSERK10進化

表2 本研究鑒定出的大豆SERK家族基因Table 2 Soybean SERK genes identified in this study

左側的比例尺指示大豆染色體的長度(Mb),每條染色體左側的數字代表基因定位在染色體上的位置(Mb) The scale bar on the left indicated the length (Mb) of soybean chromosomes,the number on the left of each chromosome represents the gene positions on the chromosome
圖1 大豆SERK家族基因的染色體定位
Fig.1 Chromosomal location of SoybeanSERKgenes

進化樹中包含25個大豆SERK家族成員,6個苜蓿SERK家族成員,5個擬南芥SERK家族成員,2個水稻SERK家族成員,2個玉米SERK家族成員,12個蘋果SERK家族成員。“▲”標注的是大豆SERK家族成員,“●”標注的是擬南芥SERK家族成員 This tree includes 25 SERK proteins fromGlycinemax,6 SERK proteins fromMedicagotruncatula,5 SERK proteins fromArabidopsisthaliana,2 SERK proteins fromOryzasativa,2 SERK proteins fromZeamaysand 12 SERK proteins fromMalusdomestica. “▲”indicates members of the soybean SERK family,“●” indicates members of theArabidopsisSERK family.
圖2 大豆和其他物種SERK的系統進化樹
Fig.2 Phylogenetic tree of SERK proteins from soybean and other plants
關系較近,而大豆GmSERK15、GmSERK23、GmSERK18、GmSERK24與MdSERK3和MdSERK12的進化關系較近。
為了研究大豆SERK家族基因在進化過程中的多樣性變化,對基因結構進行分析。結果表明,大豆SERK基因在結構上較為保守,在5′末端和3′末端都含有非翻譯區,除了GmSERK10和GmSERK17分別包含10個和12個外顯子,其他基因都含有11個外顯子。并且在進化關系上較近的基因長度、外顯子分布及相同位置的外顯子長度均保持類似,如GmSERK1和GmSERK3、GmSERK2和GmSERK5、GmSERK15和GmSERK23、GmSERK16和GmSERK25以及GmSERK18和GmSERK24等(圖3)。此外,利用MEME在線工具分析了該家族基因編碼的氨基酸序列上包含的保守基序(Motif),結果顯示,所有的大豆SERK家族成員都含有10個保守的基序且長度和分布位置類似(圖4)。說明大豆SERK家族基因在進化上整體關系較近,推測可能在功能上也類似。
植物基因的表達部位往往和其發揮的功能有緊密的聯系,因此通過對大豆13個不同組織或發育階段材料的轉錄組數據分析顯示(圖5),25個大豆SERK家族基因的表達模式呈現多樣化。其中GmSERK1、GmSERK3、GmSERK4、GmSERK9、GmSERK16和GmSERK25具有類似的表達模式,在生長發育的各個階段基本都有較高的表達,說明這些基因可能在植物生長的整個過程都發揮作用。而GmSERK2、GmSERK6、GmSERK7、GmSERK8僅在特定的階段有較低的表達水平。此外,GmSERK5、GmSERK13、GmSERK14、GmSERK16、GmSERK20都在根中具有較高的表達水平,推測這5個基因可能根中發揮特定的功能。SERK家族基因在不同組織或階段具有不同的表達模式,說明在進化上也存在差異,在植物生長過程中各自行使功能。

左側為大豆SERK家族的進化樹,右側為大豆SERK家族成員對應的基因的內含子和外顯子的分布結構 Phylogenetic tree ofSERKproteins from soybean (Left),Exon-intron structure ofGmSERKgenes(Right)
圖3 大豆SERK家族基因結構及進化樹分析
Fig.3 Gene structures of soybeanSERKgenes and phylogenetic relationships

左側為大豆SERK家族的進化樹,右側為大豆SERK家族成員氨基酸序列上的保守基序分布 Phylogenetic tree of SERK proteins from soybean (Left),Arrangements of conserved motifs in the GmSERK proteins (Right)
圖4 大豆SERK蛋白的保守基序分析
Fig.4 Conserved motifs analysis in the soybean SERK proteins

圖例中不同的顏色代表不同大小的RPKM值,紅色代表的RPKM值最大,藍色最小 The different colors in the legend represent RPKM values of different sizes,with red representing the largest RPKM value and blue minimum
圖5 大豆SERK基因在不同組織中的表達模式
Fig.5 Expression pattern ofGmSERKgenes in different tissues
為了研究GmSERK基因在響應鹽脅迫中的功能,檢測部分GmSERK基因在鹽處理后在葉片中的表達情況。根據系統進化樹可知大豆GmSERK4、GmSERK16基因和蘋果MdSERK4同源性較高,GmSERK1/3與蘋果MdSERK6/11同源性較高,GmSERK2與MdSERK10同源性較高,而鹽處理能夠激活MdSERK4、MdSERK6/11、MdSERK10的表達,因此對大豆GmSERK1/3、GmSERK2、GmSERK4、GmSERK16基因在鹽處理后的表達模式進行檢測。發現GmSERK2基因表達未被誘導,而GmSERK1/3、GmSERK4、GmSERK16基因的表達水平在鹽處理1 h、6 h、12 h時均上調(圖6)。
有研究表明,SERK基因能夠參與體細胞胚胎形成、植物對病原菌的防御反應、響應非生物脅迫信號以及調節植物生長等多種生物學過程[2,6-7,18]。但是關于SERK基因家族的全基因組學分析的報道卻十分有限。之前報道的在其他物種中鑒定出的SERK家族成員數量很少,在擬南芥中有5個SERK基因[4],從水稻中鑒定出2個SERK基因[5],苜蓿中則包含6個[2],而在蘋果中共鑒定出12個SERK基因[7]。本研究利用擬南芥SERK家族蛋白序列在大豆全基因組數據庫中進行多重序列比對,最終共鑒定出25個大豆GmSERK蛋白。而大豆的這25個SERK家族基因分布在12條染色體上,且它們編碼蛋白的長度(596~644 aa)和相對分子質量(67.15~ 70.70)的差別不大。此外,通過構建系統進化樹將大豆SERK家族成員分為4個亞族,而在蘋果中的研究僅可分為3個亞族。SERK蛋白編碼基因的一個典型特征是包含11個外顯子,且每個外顯子傾向于編碼一個特定的蛋白結構域,苜蓿MtSERK1-6基因均包含11個外顯子[2]。本研究中也得到類似的結果,25個大豆GmSERK基因中,除了GmSERK10和GmSERK17分別包含10個和12個外顯子,其他基因都含有11個外顯子。通常氨基酸序列決定著蛋白質的結構,而蛋白結構又決定其發揮的生物學功能,因此,對大豆SERK蛋白家族氨基酸上的保守基序進行了分析,發現所有SERK蛋白均具有相同的保守基序且在氨基酸上的分布情況也較為一致,通過以上結果可知,大豆GmSERK蛋白在進化上比較保守,可能具有類似的結構及生物學功能。

圖6 鹽脅迫下GmSERK基因的表達模式Fig.6 Expression pattern of GmSERK genes under salt stress
大豆25個GmSERK基因在嫩葉、花、不同發育階段的果莢和種子、根和根瘤中的表達水平存在差異,如GmSERK1、GmSERK3、GmSERK4、GmSERK9、GmSERK16和GmSERK25基因的表達模式相近,都在生長發育的各個階段有較高的表達水平;而GmSERK2、GmSERK6、GmSERK7、GmSERK8僅在個別組織或階段有較低的表達;GmSERK5、GmSERK13、GmSERK14、GmSERK16、GmSERK20均在根中具有很高的表達水平,說明不同的SERK基因家族成員具有不同的表達模式,這和其他物種中SERK基因的表達模式一致。蘋果MdSERK家族成員在根、木質部、韌皮部、葉和根尖中均有表達,其中MdSERK1、MdSERK7在根尖的表達量較高,而MdSERK2/5、MdSERK6/11在韌皮部表達較高,MdSERK4、MdSERK12在木質部和韌皮部表達較高,MdSERK3在根中的表達較高,MdSERK8、MdSERK9、MdSERK10在葉中的表達水平較高[7];而擬南芥SERK家族基因AtSERK1和AtSERK2在莖、葉、花和果莢中均有表達,但在花和果莢中表達水平較高[18]。有研究表明SERK基因在植物生物和非生物脅迫調控途徑中發揮重要作用,因此本試驗分析了鹽處理后部分GmSERK基因的表達情況,發現GmSERK1/3、GmSERK4、GmSERK16基因的表達水平在鹽處理后上調,這和蘋果MdSERK4、MdSERK6/11、MdSERK10基因的表達模式一致,即MdSERK4、MdSERK6/11、MdSERK10基因也能夠被鹽脅迫誘導表達[7]。其中大豆GmSERK4、GmSERK16基因和蘋果MdSERK4在進化關系上較近,GmSERK1/3與蘋果MdSERK6/11較近。此外,與大豆GmSERK4、GmSERK16基因和蘋果MdSERK4進化關系較近的苜蓿MtSERK1基因表達水平在生長素處理后表現出上調[2],同樣蘋果MdSERK4基因表達也能被植物激素誘導[7],推測大豆GmSERK4、GmSERK16基因可能也能被激素誘導表達。這說明大豆SERK基因可能通過復雜的機制參與植物鹽脅迫適應過程。而本研究也為進一步研究SERK家族基因在大豆生長發育過程和環境適應性方面的功能奠定了基礎。