王振宇,楊 光,賽 娜,潘文秋,宋衛寧,2,聶小軍,2
(1.西北農林科技大學農學院,陜西楊凌 712100; 2.旱區作物逆境生物學國家重點實驗室,陜西楊凌 712100)
脫落酸(ABA)在植物生長發育中發揮著關鍵作用,參與細胞伸長和分裂、胚成熟、種子脫水耐性、種子休眠和萌發、葉片衰老以及誘導根生長和果實成熟等過程。此外,ABA還可以調節氣孔孔徑,在調控植物響應各種生物和非生物脅迫中具有不可或缺的重要作用。[()-]是目前已知的最大的植物激素受體基因家族。Park等利用種子萌發抑制劑Pyrabactin處理擬南芥,首次篩選出了抗Pyrabactin的突變株,并從突變株中分離得到可特異結合ABA的基因及其他13個的同源基因,將其分別命名為~。Ma等研究發現,PYL家族成員可以結合ABA,抑制A類PP2C蛋白磷酸酶ABI1或者ABI2的活性。PYL蛋白作為ABA的受體,是ABA信號通路最上游的調控因子,承擔著識別ABA信號和啟動信號轉導的作用。
鑒于基因家族的重要功能,前人對擬南芥()、水稻(L.)、玉米(L.)、大豆()、甘藍型油菜(L.)、煙草(L.)和陸地棉(spp.)中的基因家族已經進行了全基因組鑒定,部分基因的功能也已經被驗證。如在擬南芥中,、、、、、和可促進ABA誘導的種子萌發、氣孔關閉和根系生長,而和則抑制種子萌發。另外,前人還發現和與擬南芥的耐旱性相關;過表達可以增強擬南芥的耐旱性。在水稻中,過表達可促進種子萌發、幼苗生長,并增強水稻對干旱和鹽脅迫耐受性;和在水稻胚乳中特異性表達,并在水稻種子萌發時促進其對ABA的敏感性。在小麥中,基因在ABA和鹽脅迫下上調表達。這些結果都表明,基因能夠廣泛參與植物生長發育的調控以及逆境脅迫的響應。
野生二粒小麥(,2=4=28,AABB)是普通小麥(2=6=42,AABBDD)和栽培四倍體小麥(硬粒小麥)(2=4=28,AABB)A、B染色體組的祖先供體種,具有遺傳資源豐富、粒大、蛋白質含量高、抗病、耐逆、耐貧瘠等多種優良特性,一直是小麥遺傳改良的重要基因庫。但截至目前,有關野生二粒小麥基因的研究還未見報道,這限制了野生二粒小麥基因生物學功能的深入研究。野生二粒小麥參考基因組的破譯,使得在全基因組水平鑒定和分析其基因家族的組成和特征成為可能。鑒于此,本研究利用最新的野生二粒小麥參考基因組信息,基于全基因組搜索的方法,對野生二粒小麥基因家族在全基因組水平上進行了鑒定和分析,并進一步對其基因結構、保守結構域、啟動子順式作用元件以及不同組織和逆境脅迫下的表達特性進行系統分析,以期為研究野生二粒小麥基因的功能以及了解ABA信號轉導通路提供有益信息。
首先,從Ensembl Plants數據庫(http://plants.ensembl.org/index.html)中下載野生二粒小麥參考基因組注釋信息及其所有蛋白序列,將下載到的蛋白序列構建本地蛋白庫,從擬南芥基因組數據庫(TAIR, https://www.arabidopsis.org/browse/genefamily/index.jsp)下載得到的擬南芥14條PYL蛋白序列作為query序列,采用BLASTP工具進行blast比對,參數設置為1e;同時,從PFAM數據庫(http://pfam.xfam.org/)下載基因家族的profile模型(PF10604)作為搜索模型,利用HMM 3.0軟件篩選含有該結構域的蛋白序列;然后,將上述兩種方法篩選到的候選蛋白合并,用DNAMAN 5.0軟件進行多序列比對,手工去除不完整讀碼框序列和冗余序列;最后,將得到的蛋白序列提交到PFAM及NCBI-CDD在線工具檢測其保守蛋白結構域,只保留含有完整PYR-PYL-RCAR-like功能域的序列作為最終的野生二粒小麥基因;利用ExPASy(https://www.expasy.org/)在線軟件對野生二粒小麥PYL蛋白的分子量、氨基酸長度和等電點進行預測,利用CELLO軟件進行亞細胞定位。
從擬南芥基因組數據庫(https://www.arabidopsis.org/browse/genefamily/index.jsp )和水稻基因組數據庫(http://rice.plantbiology.msu.edu/)中檢索并下載擬南芥和水稻基因序列,利用Clustal_W工具將野生二粒小麥、水稻和擬南芥基因序列進行多序列比對,利用MEGA 8.0軟件的鄰接法(NJ)構建系統發育樹,Bootstrap參數設置為1 000;根據野生二粒小麥基因組gtf注釋信息,獲得各個野生二粒小麥候選基因的外顯子-內含子結構信息,并利用在線軟件GSDS 2.0(http://gsds.cbi.pku.edu.cn/)繪制示意圖;采用MEME工具(http://meme-suite.org/)預測各野生二粒小麥PYL蛋白的保守結構域,并利用DNAMAN 5.0軟件進行結構域序列多重比對,比對參數設為默認值。
利用TBtools工具(https://github.com/CJ-Chen/TBtools/)截取各個野生二粒小麥基因上游2 kb的基因組序列,然后遞交到啟動子預測數據庫PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進行啟動子順式作用元件預測并手工整理,并對預測到的順式作用元件進行圖形化展示。
從NCBI SRA數據庫(https://www.ncbi.nlm.nih.gov/sra)下載野生二粒小麥不同組織以及干旱脅迫下野生二粒小麥品系TR39477和TTD22的RNA-seq數據,同時利用本實驗室保留的耐鹽品種A5鹽脅迫下不同時間點的RNA-seq數據;采用Hisat 2和StringTie軟件將RNA-seq原始reads與參考基因組進行映射(mapping),并計算各個基因的FPKM值,然后提取所有24個基因在不同樣本中的FPKM值,并利用Deseq2鑒定差異表達基因,利用R軟件繪制表達譜熱圖。
從GSA數據庫中下載所有四倍體小麥重測序的原始測序數據(https://bigd.big.ac.cn/gsa)(CRA001951)和SNP遺傳變異的VCF文件(https://bigd.big.ac.cn/gvm)(GVM000082)。重測序樣本共包含有28份野生二粒小麥、29份栽培二粒小麥和13份硬粒小麥材料;根據野生二粒小麥基因的染色體位置,從VCF文件中提取每個基因的SNP,并計算群體中每個基因的單倍型及其數量,將群體中50%以上樣品具有的單倍型定義為主要單倍型,并比較三個群體中主要單倍型的頻率和比例。
利用BLASTP比對和HMM比對兩種方法,從野生二粒小麥基因組中共鑒定到26個候選基因,進一步對保守結構域和基因結構驗證發現,有2個基因的保守結構域不完整,剔除后最終得到24個包含有完整特征結構域的野生二粒小麥基因。這24個基因不均勻分布在野生二粒小麥1A、1B、2A、2B、3A、3B、4A、4B、7A 和7B染色體上,其中3號染色體組最多,3A和3B染色體上均具有5個,其次是1B染色體,有4個基因;5號和6號染色體組上沒有鑒定到基因(表1)。共發現有10組同源基因,即A和B同源拷貝均存在,而剩下的4個基因發生了同源基因的丟失,同時還發現基因在3號染色體上發生了明顯的片段復制,這可能是其擴張的潛在原因。

表1 野生二粒小麥PYL家族成員基因信息及其編碼蛋白特征Table 1 Genomic information and characterization of protein encoded by PYL gene family members in wild emmer wheat
序列特征分析發現,野生二粒小麥基因的蛋白序列長度為123~253 aa,相對分子量為13.14~26.99 kDa,等電點為4.47~8.99,表明基因存在較大的組成變異。同時,亞細胞定位發現,有7個野生二粒小麥基因定位在葉綠體,1個定位在線粒體,其他16個均位于細胞核中。
為明確野生二粒小麥基因的系統進化關系,將鑒定到的24個野生二粒小麥基因與已報道的水稻和擬南芥基因進行系統進化分析。結果(圖1)發現,所有基因聚為3大類,其中Class I中只包含有野生二粒小麥和水稻的基因,而Class II和Class III中包含有野生二粒小麥、水稻和擬南芥的基因,說明Class I的基因可能是單子葉植物特異的。根據系統進化樹及水稻和擬南芥基因家族的分類信息,可將24個野生二粒小麥基因分為三大類,其中Class I亞家族包含9個成員,Class II亞家族包含11個成員,Class III亞家族只有4個成員(圖2a)。

圖1 野生二粒小麥、擬南芥和水稻PYL基因家族的系統進化分析

圖2 野生二粒小麥PYL基因家族的系統進化關系(a)、保守基序(b)和基因結構(c)
利用MEME工具對野生二粒小麥基因保守結構域的組成和數目進行預測,結果共鑒定到13個保守的蛋白基序(圖2b),其中,Class I亞家族均含有基序4、6和7,Class II亞家族均含有基序1、2、3和10,Class III亞家族除了、和只含有基序2外,其余基因均含有基序1、2和3。不同亞家族成員間具有各自特異的保守結構域,但同一亞家族成員具有相似的保守結構域組成,這可能與其具體的生物學功能相關,同一亞家族具有相似的生物學功能。
基因的結構是決定基因表達和功能的重要因素。對野生二粒小麥基因家族的外顯子和內含子結構進行分析,結果(圖2c)發現,野生二粒小麥家族的基因結構相對簡單,含有的內含子很少,其中17個基因只含有1個外顯子,沒有內含子。從亞家族來看,每個亞家族成員間的基因結構基本一致,各個亞家族之間存在一定差異,其中Class II亞家族基因與其他亞家族基因相比,內含子和外顯子數目較多,基因結構也較為復雜。
順式作用元件在調節基因轉錄和表達方面發揮重要作用。對鑒定到的24個野生二粒小麥基因的啟動子順式作用元件進行預測,共鑒定到56個順式作用元件,主要與ABA代謝、響應逆境和光調節相關(圖3)。ABA響應元件ABRE在22個野生二粒小麥基因中被檢測到,平均每個基因中含有3.4個ABRE元件,特別是、和分別有9、7和9個ABRE元件,表明其可能參與了野生二粒小麥ABA代謝調控過程。基因還含有豐富的光調節因子元件,如G-box和Sp1等。G-box在21個基因中被檢測到,Sp1在15個基因中被檢測到,暗示這些野生二粒小麥基因的表達可能受光調節。發現5個基因有MBS元件,表明這些基因可能還參與逆境脅迫的響應。

圖3 野生二粒小麥PYL基因啟動子的順式作用元件
為探究基因在野生二粒小麥生長發育過程中的潛在功能,利用RNA-Seq數據對野生二粒小麥基因在不同組織(根、葉、穗、穎片、外稃、花和種子)的表達模式進行研究。結果(圖4)發現,野生二粒小麥基因在不同組織的表達模式有明顯差異。、、和在出穗 1 cm時的表達量明顯高于其他組織,而所有的基因在出穗3.5 cm時的表達量都比較低,表明這些基因可能在野生二粒小麥穗部的形態建成過程中發揮重要作用。在根中的表達量高于其他基因,而在葉中表達上調,、和在播種后112 d的穎片中表達量較高,在播種后112 d的外稃中表達量較高;、、、和在播種后105 d的花組織中表達量較高;、、和在播種后123 d的籽粒中表達較高;、和在播種后134 d的籽粒中表達量較高。

DS1和DS3.5分別代表出穗1 cm和3.5 cm;Flower_105、Flower_110、Flower_112分別代表105 d、110 d和112 d(均為播種后的天數,下同)的花組織;Glume_112代表112 d的穎片組織;Grain_123和Grain_134分別代表123 d和134 d的籽粒;Leaf_54和Leaf_57分別代表54 d和57 d的葉片組織;Lemma_112代表112 d的外稃組織;Root_20代表20 d的根組織。
為挖掘與逆境脅迫相關的野生二粒小麥基因,以野生二粒小麥的兩個品系TR9477和TTD22為材料,利用RNA-seq數據分析基因在干旱脅迫下的表達模式。結果(圖5a)發現,在TR9477品系中,、和基因在干旱脅迫下的表達量明顯上升;而在TTD22品系,這3個基因在干旱脅迫下表達量明顯下降,暗示這3個基因可能與野生二粒小麥的抗旱性相關,參與了干旱脅迫的響應。

a:干旱脅迫;b:鹽脅迫。圖a中,TR39477和TTD22分別代表野生二粒小麥的兩個品系;CK代表對照組;Drought代表干旱處理組;1~5代表生物學重復。
進一步對這些基因在野生二粒小麥耐鹽品系A5鹽脅迫下5個時間點(0 h、0.5 h、3 h、8 h和27 h)的表達模式進行分析。結果(圖5b)表明,在0.5 h時,同源基因和明顯上調表達;在3 h時,、、表達量均高于其他時間點,其中和是同源基因,表達模式相同;在8 h時,、、上調表達,其表達量高于其他基因;在27 h時,同源基因和的表達模式相同,均為上調表達。這些結果表明,多個基因參與了鹽脅迫的響應,而且同源基因通常具有相似的表達模式,沒有發生功能分化,這為進一步的生物學功能研究提供了候選基因。
為了進一步探討基因家族在四倍體小麥中的遺傳分化,利用重測序數據分析野生二粒小麥、栽培二粒小麥和硬粒小麥基因的遺傳變異和單倍型組成。結果發現,基因在這三個群體中具有明顯的遺傳差異,發生了顯著的遺傳分化。整體上,野生二粒小麥的遺傳多樣性較高,而硬粒小麥的遺傳多樣性較低。15個基因均有主要單倍型,而且其主要單倍型在野生二粒小麥、栽培二粒小麥和硬粒小麥群體中的分布具有明顯的差異(表2)。其中野生二粒小麥中有6個基因的主要單倍型比例低于栽培二粒小麥,有14個基因的主要單倍型低于硬粒小麥,比如的主要單倍型TTCCGG,其在野生二粒小麥的比例為 42.86%,而在栽培二粒小麥和硬粒小麥的比例分別為 75.86%和84.62%;的主要單倍型為AAGGGGCCGGGG,其在野生二粒小麥的比例為35.71%,而在栽培二粒小麥和硬粒小麥的比例分別為55.17%和84.62%,這說明在野生二粒小麥馴化成栽培類型過程中,野生二粒小麥的基因選擇了一些特定的單倍型作為主要單倍型被固定下來。此外,還發現的主要單倍型為CCCCAACCAA,其在野生二粒小麥和栽培二粒小麥的比例為78.57%和75.86%,而硬粒小麥的比例只有38.46%,這可能是在后期育種改良過程中,部分硬粒小麥中引入了其他來源的變異,降低了該基因的主要單倍型頻率。

表2 PYL基因在四倍體小麥中的主要單倍型組成Table 2 Main haplotype of PYL genes in tetraploid wheat
基因家族在許多植物中已被鑒定分離出來,本研究首次鑒定到野生二粒小麥中的基因,在全基因組范圍中共搜索到24個基因,而在擬南芥和水稻基因組中基因家族的成員分別為13個和12個,均少于野生二粒小麥基因家族的成員數量。基因序列特征分析發現,基因的蛋白序列長度、分子量和等電點均存在較大的差異,亞細胞定位在葉綠體、線粒體和細胞核中,表明它們可能在不同的微環境中發揮著不同的功能。
野生二粒小麥基因聚為3個大類,其中Class I中只包含有野生二粒小麥和水稻基因,而Class II和Class III中包含有野生二粒小麥、水稻和擬南芥基因,說明Class I的基因可能是單子葉植物特有的。同源性較高的基因可能具有相似的功能,如擬南芥、和野生二粒小麥和具有較高的同源性,擬南芥、已被證明能促進ABA誘導的種子萌發,推測、也可能參與ABA誘導種子萌發的調控。
順式作用元件通過響應不同外界環境信號來調節基因轉錄過程,進而影響植物的生長發育,本研究發現,野生二粒小麥基因啟動子區域共有56個不同順式作用元件,主要包括ABA響應元件ABRE和光響應元件Spl和G-box等,暗示基因在調節組織生長和發育過程中可能受到ABA代謝和光調節的影響,這與Kong等的研究結果一致,此外,本研究還檢測到與MBS等逆境相關的順式元件,表明野生二粒小麥基因的表達可由不同的脅迫誘導。
基因家族作為ABA的受體,參與多種ABA有關的生理反應,其中、、、、、、等已經被成功驗證。在本研究中,大部分野生二粒小麥基因在根、葉、穗、穎片、外稃、花和籽粒等不同組織中廣泛表達,表明它們可能參與多種生理反應。另外,野生二粒小麥TR39477品系中、和在干旱脅迫條件下上調表達,表明野生二粒小麥基因可能參與干旱脅迫響應。本研究還發現,在鹽脅迫的各個時間點(0.5 h、3 h、8 h、27 h)都有不同的基因特異表達,表明野生二粒小麥基因可能參與鹽脅迫的響應過程。總之,野生二粒小麥基因家族作為ABA受體,在野生二粒小麥抵抗逆境脅迫過程中發揮了作用,但各成員的具體功能需要后續試驗進一步驗證。對野生二粒小麥、栽培二粒小麥和硬粒小麥基因的遺傳變異和單倍型組成的比較分析發現,基因在這三個群體中具有明顯的遺傳差異,發生了顯著的遺傳分化。