代夢媛,高 梅,李文昌
(云南省農業科學院 經濟作物研究所,云南 昆明 650205)
蓖麻(RicinuscommunisL.)作為一種不可食用的油料作物,具有藥用、工業原料、生物能源價值[1]。由于對蓖麻油供應的需求增加,現在迫切需要創造出能在農業上獲得更高產量的改良品種。蓖麻矮化是育種提高產量的一個重要方向[2-3]。
赤霉素(Gibberellins,GAs)是高等植物內源生長調節劑,在植物、細菌、真菌中發現的136種中赤霉素僅有GA1、GA3、GA4、GA7具有生物活性[4],作用于調控植物生長發育的各個方面,包括種子萌發、莖伸長、葉展開以及花和種子發育[5]。
高等植物中,GA代謝途徑已被廣泛研究[6]。根據活性酶和作用位點分為3個階段:第一階段,葉綠體中,C20二萜類前體牻牛基二磷酸(GGDP)由古巴焦磷酸合成酶(CPS) 和內根-貝殼杉烯合成酶(KS)2種萜類合成酶轉化成內根-貝殼杉烯(Ent-kaurene);第二階段,內質網上,內根-貝殼杉烯氧化酶(KO)和內根-貝殼杉烯酸氧化酶(KAO)2種細胞色素P450單氧化酶(P450s)將內根-貝殼杉烯轉化成C20碳骨架的GA12和GA53;第三階段,胞質中,GA20氧化酶(GA20ox)和GA3氧化酶(GA3ox)2種2-酮戊二酸依賴的雙加氧酶(2-ODDs)將GA12和GA53催化生成活性GAs,而活性GAs或其前體又被第3種2-ODD GA2氧化酶(GA2ox)鈍化,根據作用基團不同分為C19-GA2ox和C20-GA2ox[7]。
GA20ox、GA3ox和GA2ox作為催化GA生物合成途徑后期反應的3種酶,屬于2OG-Fe(Ⅱ)加氧酶超家族,每個酶都由一個多基因家族編碼[8-9]。植物GA20ox和GA3ox功能缺失導致活性GA降低,進而產生矮化表型,水稻OsGA20ox1和OsGA20ox基因缺失導致株高降低[10],擬南芥AtGA2ox7和AtGA2ox8過表達會降低活性GA水平,同時產生矮化表型,雙基因敲除突變體活性GA水平增加2~4倍,產生GA過剩的表型[11]。
蓖麻是分枝型作物,多數品種高大且冠幅寬,不利于密植進而限制產量增加[12],2010年已完成蓖麻全基因組序列,為蓖麻基因功能研究提供了新機遇[13]。叢安琪等[14]克隆蓖麻RcGA20ox1基因,分析并推測該基因功能。但是參與蓖麻赤霉素合成的氧化酶基因未得到系統解析。
因此,本研究利用生物信息學分析方法對蓖麻GAox進行全基因組鑒定,并分析其理化性質、保守結構域、系統發育、基因上游2 kb啟動子區域順式作用元件預測,通過蓖麻表達數據庫以及外源赤霉素和多效唑處理2個蓖麻品種的頂端嫩莖轉錄組測序分析蓖麻GAox基因表達模式。以期發現參與調控株高的功能基因,為進一步開展蓖麻RcGAox基因功能研究奠定基礎。
1.1 材料與處理
試驗于2019年4—9月在云南省農業科學院老院部試驗地進行,以高稈蓖麻品種滇蓖2號(DB2)和矮稈滇蓖5號(DB5)為試材,設定2個處理500 μmol/L赤霉素(GA)和500 μmol/L多效唑(PAC)及一個空白對照組(CK),正常田間管理。在蓖麻生長至7~8片真葉時進行第一次葉面噴施藥劑處理,噴施劑量以葉滴藥為準,每次處理間隔7 d,共進行3次葉面噴施處理,在距首次處理30 d后,分別采集蓖麻植株頂端嫩莖,按品種-處理編號,即DB2-CK、DB2-GA、DB2-PAC 和DB5-CK、DB5-GA、DB5-PAC,每個樣品設定3個生物學重復,液氮速凍后-80 ℃保存,總RNA提取純化、cDNA測序文庫構建及轉錄組測序由北京百邁克生物科技有限公司完成。
1.2 基因的鑒定及理化性質分析
根據Han等[15]公布的擬南芥、水稻、大豆GA20ox、GA3ox和GA2ox基因序列號從Phytozome v12.1(https://phytozome.jgi.doe.gov/pz/portal.html#)下載蛋白質序列。葡萄蛋白序列依據Giacomelli等[8]公布的序列編號從Phytozome下載,小桐子蛋白序列依據高聰聰等[16]公布的序列編號從小桐子基因組數據庫(http://www.kazusa.or.jp/jatropha/)下載。以擬南芥蛋白質序列為基序在Phytozome中Blast蓖麻基因組數據庫,設定E值小于10-3e,得到的序列在Pfam(http://pfam.xfam.org/)上檢測結構域,去除沒有2OG-Fe(Ⅱ)-Oxy結構域的序列,最終獲得蓖麻GA20ox、GA3ox和GA2ox基因及氨基酸序列。
將得到的蓖麻GA氧化酶氨基酸序列輸入到ExPasy 網站(http://au.expasy.org/tool.html),采用Compute pI/MW 工具分析,得到GA20ox、GA3ox和GA2ox蛋白的多種理化性質,包括氨基酸長度、分子量、等電點、穩定性、親水性。
1.3 系統發育、結構域分析
利用ClustalW對蓖麻、擬南芥、水稻、大豆、葡萄、小桐子的GA20ox、GA3ox和GA2ox蛋白序列進行多重序列比對,隨后用Mega 7.0 軟件及鄰接法(Neighbor-Joining,NJ),Bootstrap=1 000構建系統發育進化樹。利用MEME在線軟件分析蓖麻GA氧化酶蛋白的保守結構域,設定最大基序數量為10,其他數值為默認參數。
1.4 啟動子順式作用元件分析
利用TBtools軟件從蓖麻全基因組數據中批量提取GA20ox、GA3ox和GA2ox基因上游2 000 bp啟動子序列,利用PlantCARE對基因啟動子順式作用元件進行預測分析。
1.5 基因表達分析
轉錄組基于邊合成邊測序(Sequencing by synthesis,SBS)技術,采用 Illumina HiSeq 4000高通量測序平臺進行對 cDNA 文庫進行測序,原始數據(Raw data)經過測序質量控制得到 Clean data,利用HISAT2系統將測序數據與參考基因組數據[13]進行比對,然后利用 StringTie 軟件將比對上的Reads進行組裝和定量,采用 FPKM 作為衡量基因表達水平的指標,最后進行差異表達篩選,分別比較處理組(GA 或 PAC)與 對照組(CK),當表達差異倍數超過1.5,P<0.01 時,認定為差異表達基因。
2.1 蓖麻赤霉素氧化酶基因鑒定與理化性質分析
通過同源序列比對與Pfam分析獲得滿足條件的蓖麻赤霉素氧化合成酶基因序列30條,其中RcGA2ox有7條,RcGA3ox有4條,RcGA20ox有19條。在基因組描述中28166.m001069、28166.m001071、29801.m003236、29842.m003651屬于RcGA2ox,而本研究中通過系統進化分析,認為以上4條序列屬于RcGA20ox,另外基因組描述中29682.m000588、29848.m004709和29848.m004710屬于RcGA20ox,而本研究構建的進化樹將29682.m000588、29848.m004709歸為RcGA3ox,29848.m004710歸為RcGA2ox。如表1所示,對這3類蓖麻赤霉素氧化酶基因序列分別進行編號:RcGA2ox1……RcGA2ox7,RcGA3ox1……RcGA3ox4,RcGA20ox1……RcGA20ox19。利用ExPASy預測GA氧化合成酶蛋白序列理化性質,結果表明:30條序列的平均蛋白長度334 aa,平均分子質量37.94 ku,RcGA3ox1序列最短240 aa,其他序列長度都大于300 aa,RcGA20ox2序列最長389 aa,對應分子質量26.12~44.31 ku。pI值預測蓖麻赤霉素氧化酶酸堿性,pI值大于7僅有2個RcGA2ox1(7.60)和RcGA3ox1(7.82),預測為堿性蛋白,其余28個蛋白pI值均小于7,分布在5.06~6.90,預測為酸性蛋白。穩定性預測:數值小于40是穩定蛋白,數值大于40是不穩定蛋白,所以蓖麻赤霉素氧化酶中15個為穩定蛋白,15個為不穩定蛋白。親疏水性預測:分值越高疏水性越強,分值越低親水性越強,介于-0.5和+0.5之間為兩性蛋白,除了RcGA20ox18和RcGA20ox19為親水性蛋白,其他28個蛋白為兩性蛋白。蓖麻赤霉素氧化酶基因結構內含子個數除了RcGA20ox15、RcGA20ox16、RcGA20ox17以及RcGA3ox的4個成員共7條序列含有1個內含子,其余23條序列均含有2個內含子,說明親緣關系越近的基因,基因結構越相似。從基因組描述來看,30條序列皆是與赤霉素代謝功能相關的預測蛋白。

2.2 蓖麻赤霉素氧化酶基因系統進化分析
為了確定蓖麻與擬南芥、水稻、大豆、葡萄、小桐子赤霉素氧化酶家族基因的進化關系,構建了基于蛋白質序列的進化樹,如圖1所示,大多數GA氧化酶基因可以被分離為5個不同的亞群:Ⅰ、Ⅱ、Ⅲ、Ⅳ和C20 GA2ox,分別對應蓖麻GA氧化酶序列數量3,4,6,13,4條。6種植物的GA氧化酶在各個亞群內的同源性大于彼此間的相似性,說明GA氧化酶的擴增發生在該蛋白家族進化的早期。在Ⅰ、Ⅱ、Ⅲ和C20 GA2ox 這4個亞群中,各物種以成對同源基因出現的比例為:擬南芥50.00%、水稻82.35%、大豆83.33%、蓖麻35.29%、小桐子0、葡萄46.15%,表明GA氧化酶在物種特有的進化途徑中擴增,在物種分離后發生重復,蓖麻與同屬大戟科的小桐子重復發生率低,說明蓖麻和小桐子的GA氧化酶基因在進化過程中較為保守,而葡萄沒有經歷最近的基因組復制,其基因組基因也最保守[17]。本研究中將RcGA20ox7~RcGA20ox19蓖麻的13個序列與OsGA20ox5~OsGA20ox8水稻的4個序列歸為Ⅳ亞群。Ⅰ、Ⅱ、Ⅲ亞群是明確區分出的3個亞群,分別對應GA2ox、GA3ox、GA20ox,3個亞群的GA氧化酶具有明顯的功能差異,GA3ox和GA20ox促進活性GA的生成,GA2ox抑制活性GA,進而調節植物中活性GA的水平。C20 GA2ox在系統發育樹中已經從C19 GA2ox(Ⅰ亞群)中分離出來,相應的C20 GA2ox羥基化C20-GA前體,而C19 GA2ox羥基化C19-GAs前體。

圖1 擬南芥(At)、水稻(Os)、大豆(Gm)、葡萄(Vv)、小桐子(Jc)和蓖麻(Rc)中GA2ox、GA3ox和GA20ox的系統進化樹Fig.1 An unrooted phylogenetic tree representing relationships of GA2ox,GA3ox and GA20ox in Arabidopsis (At),rice(Os),soybean(Gm),grape(Vv),Jatropha cucas (Jc)and Riciuns communis L.(Rc)
2.3 蓖麻赤霉素氧化酶蛋白結構域分析
利用MEME對蓖麻30條RcGAox基因序列進行分析,發現10個保守基序(Motif),長度15~41個氨基酸,E值小于3.8e-50,其中Motif 1、Motif 2、Motif 4存在30條序列中,Motif 6在RcGA3ox2中缺失,均存在其余29條序列。RcGA3ox包含Motif 1~Motif 9共9個基序,RcGA3ox2缺失下游的Motif 6,RcGA3ox1缺失上游的Motif 3和Motif 8。所有RcGA2ox成員均缺少Motif 8,且保守性較高,C20 GA2ox亞群成員均含Motif 1~Motif 6共6個基序,Ⅰ亞群成員均含Motif 1~Motif 7、Motif 9共8個基序。RcGA20ox的2個亞群基序有差異,Ⅲ亞群成員包含Motif 1~Motif 8共8個基序,而RcGA20ox6例外;Ⅳ亞群成員含有一個特有基序Motif 10,均無基序Motif 8;RcGA20ox6及RcGA20ox18、RcGA20ox19的基序特征與Ⅰ亞群RcGA2ox相同,如圖2所示,該結果與蓖麻RcGAox基因序列構建的進化樹一致。

圖2 蓖麻GA2ox、GA3ox和GA20ox蛋白基序擴增Fig.2 Schematic diagram of amino acid motifs of GA2ox,GA3ox and GA20ox proteins in Ricinus communis L.
Domain是保守結構域,一條系列一般有1~2個Domain,而一個Domain可能有多個Motif。選取蓖麻RcGAox基因的7條代表序列,分析保守結構域(Domain)與基序(Motif)的位置對應關系,如圖3所示,DIOX-N結構域是具有2-氧化戊二酸/Fe(Ⅱ)依賴的雙加氧酶活性蛋白質的高度保守N端區域,包含Motif 3、Motif 8和Motif 10,其中Motif 3保守性最高,Motif 8中LPWKET保守基序作用于GA底物結合[18],RcGA3ox1序列缺失DIOX-N結構域;2OG-Fe(Ⅱ)-Oxy結構域包含Motif 1、Motif 2、Motif 5、Motif 9及Motif 7部分,其中Motif 1和Motif 2保守性最高。

圖3 部分蓖麻GAox蛋白的保守結構域Fig.3 Conserved domain of partial GAox protein in Ricinus communis L.
如圖4所示,蓖麻30條與擬南芥3條GA氧化酶的2OG-Fe(Ⅱ)-Oxy結構域氨基酸序列比對結果,存在所有序列中的HXDXnH其保守殘基位于Motif 1和Motif 2,是催化鐵結合的三肽結構,與Fe(Ⅱ)形成共價鍵;YXnRXS作用于結合2-氧化戊二酸(2-OG)[19],其中Motif 5包含Y殘基,Motif 7包含R和S殘基,RcGA20ox8缺少Y和S殘基,RcGA20ox7缺少Y殘基。

圖4 蓖麻和擬南芥GA氧化酶2OG-Fe(Ⅱ)-Oxy結構域氨基酸序列比對Fig.4 Amino acid sequence aligment of 2OG-Fe(Ⅱ)-Oxy domain of Ricinus communis L. and Aribidopsis GAox protein
2.4 蓖麻赤霉素氧化酶基因在不同組織中的表達
參考Brown等[20]發布的蓖麻胚乳、葉片、雄花和發育種子的轉錄組數據,獲得20個赤霉素氧化酶基因的在各個組織中的表達量,蓖麻RcGAox在胚乳、雄花、葉片中特異表達的基因分別有7,2,1個,其中RcGA2ox2、RcGA3ox3、RcGA3ox4、RcGA20ox5、RcGA20ox7、RcGA20ox9和RcGA20ox12等7個基因在胚乳中特異表達,可能參與胚乳發育,RcGA2ox1、RcGA20ox2在雄花中特異表達,RcGA2ox3、RcGA20ox19在雄花中高表達,4個基因可能參與雄花發育,RcGA2ox7在葉片中特異表達,RcGA3ox1在葉片中高表達,發育種子少量表達,2個基因可能參與葉片展開。RcGA2ox3、RcGA20ox1、RcGA20ox13、RcGA20ox14、RcGA20ox15、RcGA20ox18、RcGA20ox19在所有組織中均有表達,其中RcGA20ox18在所有組織的表達量都相對較高,可能是功能保守的赤霉素氧化酶基因(圖5)。

圖5 GAox基因在蓖麻不同組織中表達的FPKM值Fig.5 Expression FPKM values of GAox genes in different tissues of Ricinus communis L.
2.5 蓖麻赤霉素氧化酶基因啟動子分析
順式作用調控元件是重要的分子開關,參與轉錄調控一個動態基因活動網絡,控制各種生物過程,包括非生物應激反應、激素反應和發育過程[21]。為進一步探究基因功能,利用PlantCARE對30個蓖麻GA氧化酶基因上游2 000 bp啟動子元件進行預測,結果在基因上游區域包含光反應、激素、應激脅迫、分生組織、光周期信號、低溫誘導、厭氧誘導相關的順式作用元件。其中光反應相關的順式元件數量最多,且在預測區域均勻分布,RcGA20ox10僅有光反應順式元件(圖6),表2列出各類型元件在基因上游出現的數量,根據元件作用分為:與逆境脅迫相關的元件,包括脅迫、厭氧誘導、低溫誘導、干旱誘導;組織器官生長相關元件,包括分生組織、胚乳;與激素相關的元件,包括赤霉素、脫落酸、茉莉酸、水楊酸、生長素。結果發現,蓖麻赤霉素合成相關基因中并非所有基因上游2 000 bp都存在赤霉素相關元件,僅有18個基因含1~2個赤霉素相關元件。

圖6 蓖麻赤霉素氧化酶基因啟動子保守順式元件分布Fig.6 Conservation cis-elements location of Ricinus communis L. GAox genes promoter

表2 蓖麻赤霉素氧化酶基因啟動子順勢作用元件數量Tab.2 Number of cis-acting elements in GAox promoter
2.6 赤霉素和多效唑處理對蓖麻赤霉素合成相關基因表達量的影響
如圖7所示,與對照相比,GA處理后30 d DB2和DB5 這2個品種株高表型增高;PAC處理后30 d這2個品種株高表型降低。處理后30 d進行轉錄組測序分析,結果共有5個基因在GA和PAC處理后均檢測到表達,如圖8所示,GA處理后,RcGA2ox7、RcGA20ox15和RcGA20ox18在2個品種中均上調,其中RcGA2ox7和RcGA20ox18顯著上調(P<0.05),PAC處理后,2個品種中RcGA2ox7下調,RcGA20ox18上調;滇蓖2號中GA處理后RcGA20ox18上調表達水平低于PAC處理,而在滇蓖5號中,GA處理后RcGA20ox18上調表達水平顯著高于PAC處理(P<0.05);滇蓖2號中GA和PAC處理后RcGA20ox15表達量無顯著差異,而滇蓖5號中GA處理后RcGA20ox15顯著上調(P<0.05)。GA處理后2個品種中均下調的基因是RcGA20ox1和RcGA20ox14,PAC處理后RcGA20ox1在2個品種中均上調,而RcGA20ox14在滇蓖2號中下調,在滇蓖5號中上調,相對于對照,這種變化并不顯著。綜上所述,2個品種中的RcGA2ox7和RcGA20ox1基因在GA和PAC的作用下都表現出相同表達模式,所以認為RcGA2ox7和RcGA20ox1在調控赤霉素合成過程中具有重要作用,RcGA20ox15和RcGA20ox18在外源GA及其抑制劑的作用下表現出的品種差異,矮稈品種DB5基因表達水平更顯著,RcGA20ox14對外源GA敏感而對PAC不敏感。

圖7 赤霉素和多效唑對蓖麻株高變化的影響Fig.7 Effects of gibberellin and paclobutrazol on plant height of Ricinus communis L.

不同的小寫字母代表差異顯著(P<0.05)。Different small letters indicate significant difference among treatments at 0.05 level.
本研究將30個蓖麻GA氧化酶分為5個亞家族:Ⅰ(GA2ox)、Ⅱ(GA3ox)、Ⅲ(GA20ox)、Ⅳ(GA20ox)和C20 GA2ox,Huang等[22]在比較了苔蘚、綠藻及陸生植物的GAox基因后,根據系統發育、基因結構和特征基序分析,將陸生植物的GAox分為8個亞群C19-GA2ox、C20-GA2ox、GA20ox、GA3ox、GAox-A、GAox-B、GAox-C和 GAox-D,其中GAox-A、GAox-B、GAox-C和 GAox-D對應本研究中Ⅳ(GA20ox)亞群。本研究中系統發育分析表明,GA3ox和C19-GA2ox具有共同的起源,類似的Giacomelli等[8]利用2種比對方法結果都顯示GA3ox和C19-GA2ox有共同的起源,且GA3ox和C19-GA2ox都代謝C19-GA底物;然而在Han等[15]的研究中GA3ox和C20-GA2ox的親緣關系更近;Serrani等[23]研究認為,C19-GA2ox和C20-GA2ox蛋白來源于一個共同的GA2ox祖先的重復事件,與它們共同的2β-羥化酶活性一致。綜上所述,GA3ox、C19-GA2ox及C20-GA2ox之間的關系存在爭議,GAox基因的多樣性和功能分化有關,然而目前對各個類群基因功能探知還有待進一步的研究。
本研究中發現8個RcGAox基因在雄花中高表達,Tan等[24]和代夢媛等[25]研究發現,GA與蓖麻性別決定相關,多效唑(100~500 mg/L)處理后,花序中雄花數量顯著增加,高GA 水平促進雌花發育,低GA 水平促進雄花發育,所以8個RcGAox基因調控GA水平可能與性別決定相關。另外,在擬南芥和牽牛花中GA是從雄蕊到花瓣轉運[26],推測雄花中合成的GA從雄花轉運到花序的其他器官,促進器官發育。本研究中發現,RcGA2ox7、RcGA3ox1和RcGA20ox13個GA調控基因在葉片中高表達,而煙草和擬南芥中證實了GA是從葉片到莖稈轉運[27],葉片作為GA合成的主要器官,葉片合成的GA轉運到莖稈促進莖稈伸長。
啟動子區域順勢作用元件預測發現蓖麻GAox包含與光反應、光周期信號、植物激素、應激脅迫、分生組織相關的順勢作用元件,結果與董鳳等[28]一致。蓖麻GAox雖然是赤霉素合成相關基因,但是在啟動子的順勢作用元件中有12個基因上游缺少赤霉素相關的順勢作用元件,可能是基因上游2 000 bp的啟動子序列過短未包含GA元件,或者是通過GA信號通路上的其他作用因子調控其響應內源GA含量變化。
蓖麻嫩莖轉錄組測序結果沒有覆蓋所有的GAox基因,有研究報道,GA生物合成基因在不同組織、細胞周期和發育階段差異表達[26]。GA3ox作為催化合成活性GA最后一步的關鍵酶,嫩莖轉錄組測序結果沒有覆蓋任何一個RcGA3ox。GA作為一種移動的信號分子,由葉片、花器官等部位合成后運輸到莖端和根端作用于莖和根伸長[26],嫩莖不一定合成活性GA。本研究中發現,RcGA3ox1缺失保守結構域可能會影響基因功能,另外基因表達分析發現,RcGA3ox1在葉片中高表達,而RcGA3ox3和RcGA3ox4在胚乳中特異表達。擬南芥AtGA3ox具有獨特的器官特異性表達模式,其成員在發育過程中扮演不同角色[26]。所以,RcGA3ox基因可能存在功能調控上的差異。
在嫩莖中表達的5個RcGAox基因,其中RcGA2ox7鈍化活性GA,RcGA20ox1、RcGA20ox14、RcGA20ox15和RcGA20ox18調控活性GA生成。擬南芥中GA20ox突變導致植株出現半矮化表型[29],水稻GA缺陷型半矮化突變體Sd1是由OsGA20ox2位點變異引起[30]。扁豆PcGA2ox1導入茄科植物、果樹和觀賞植物中,植株表現矮化,活性GA水平降低[31]。水稻GA2 氧化酶 GA2ox可以使 GA1和GA4 等活性 GA 發生 2β-羥化作用,降低活性GA水平,獲得顯著半矮化性狀[32];從Williams香蕉和矮化突變體中發現6個GA合成基因MaGA20ox4、MaGA20ox5、MaGA20ox7、MaGA2ox7、MaGA2ox12和MaGA2ox14影響GA的含量[33]。本研究中外源GA處理,RcGA2ox7高表達,鈍化活性GA,降低體內GA水平,同時RcGA20ox1和RcGA20ox14低表達,GA合成速率降低;外源多效唑處理后抑制GA合成,體內GA水平降低,RcGA2ox7低表達,RcGA20ox1高表達,促進活性GA合成,負調控體內活性GA保持穩態,RcGA20ox14無顯著變化,推測RcGA2ox7、RcGA20ox1和RcGA20ox14可能是通過調控植物體內活性GA的水平來響應外源激素對株高的作用,是參與赤霉素合成途徑來調控蓖麻株高的主要基因。
本研究通過生物信息學方法和轉錄組測序表達譜分析對蓖麻赤霉素氧化酶基因進行系統的鑒定和表達分析,為初步解析其潛在功能提供依據。后續應重點關注RcGAox基因克隆和功能分析等研究,進一步解析RcGAox基因在調控蓖麻株高方面的分子作用機制。