吳圳 張明英 閆鋒 李依民 高靜 顏永剛張崗
(1. 陜西中醫藥大學藥學院 陜西省秦嶺中草藥應用開發工程技術研究中心,西安 712046;2. 陜西中醫藥大學省部共建特色秦藥資源研究開發國家重點實驗室[培育],咸陽 712083;3. 陜西中醫藥大學陜西省中醫藥管理局“秦藥”研發重點實驗室,西安 712046)
大黃,別名將軍、黃良等,是我國傳統大宗中藥材,其功效為瀉下攻積、清熱瀉火、涼血解毒、逐瘀通經、利濕退黃[1],其3個基源分別為蓼科植物掌葉大黃(Rheum palmatum L.)、唐古特大黃(R.tanguticum Maxim.ex Bal)和藥用大黃(R. officinale Baill.),入藥部位為干燥根及根莖。掌葉大黃應用歷史悠久,主要分布于甘肅東部及東南部、青海東部、四川西部及西北,多生于林緣、灌叢、草地[2]。大黃的主要生物活性成分是蒽醌類成分,研究發現其有抗腫瘤,抗炎,保護心血管等藥理作用[3]。
轉錄因子是可以與基因順式作用元件發生特異性相互作用,并激活或抑制基因轉錄的一種DNA結合蛋白。植物在高度可變的環境中,轉錄因子通過調控下游靶基因表達直接或間接地參與調節植物對環境的生理適應[4]。目前植物中發現了相當多的轉錄因子家族,如MYB、bZIP、bHLH、WRKY。其中很多家族,如MYB、bHLH和WRKY,被證實參與了植物生長發育和次生代謝的轉錄調控[5]。WRKY是植物中最大的轉錄因子家族之一。WRKY結構由兩部分組成:N端包含一個保守的WRKYGQK基序,C端包含一個60氨基酸長鋅指基序,二者對于WRKY轉錄因子與靶基因啟動子的結合至關重要[6]。WRKY蛋白按其WRKY domain的數目及鋅指基因的種類可劃分為三類[7]。I族成員有兩個WRKY結構域和C2H2型鋅指。II族成員只有一個WRKY結構域和一個C2H2鋅指基序,根據其WRKY結構域可進一步分為5個亞組(IIa、IIb、Ic、IId和IIe)。III族成員有一個WRKY結構域和一個C2HC型鋅指。
第一個WRKY基因SPF1于1994年在甘薯中被克?。?],自此之后WRKY家族被報道廣泛參與植物對非生物脅迫和激素信號轉導。如SbWRKY30參與了高粱對干旱脅迫的響應[9],過表達馬鞭草VbWRKY32基因轉基因植株耐寒性顯著增強[10]。在南非醉茄中鑒定的一個WsWRKY1,能通過調節烷基內酯的積累而參與防御反應[11]。WRKY基因家族還通過激素信號分子廣泛參與了植物種子萌發和生長發育。研究表明,AtWRKY44和AtWRKY75在擬南芥中調節根毛的發育[12]。生長素誘導AtWRKY23的表達從而調節植物根系的正常生長和類黃酮的局部合成[13]。WRKY57作為MeJA誘導葉片衰老的抑制因子,參與了MeJA和生長素介導的信號通路[14]。敲除了AtWRKY2的擬南芥突變體在種子萌發和萌發后早期生長期間對ABA的反應更敏感[15]。
在藥用植物中,WRKY轉錄因子參與次生代謝產物的生物合成調控。CjWRKY1的異位表達可顯著增加小檗堿生物合成相關基因的表達水平[16]。PgWRKY4X與角鯊烯環氧化酶啟動子中的W-box結合上調人參皂苷生物合成基因[17]。紅豆杉TcWRKY8/20/26/47調控紫杉醇的生物合成[18]。過表達IiWRKY34顯著提高菘藍中6種木脂素類化合物的含量[19]。鑒于WRKY在藥用植物次生代謝調控中的潛在作用,其有可能作為中藥材質量控制的關鍵因子。本研究以掌葉大黃為對象,利用全長轉錄組測序技術結合RNA-seq挖掘WRKY轉錄因子家族基因及其差異表達特征,為后續深入研究其在掌葉大黃生長發育及蒽醌類成分代謝調控中的作用機制提供科學支撐。
1.1.1 儀器 NanoDropTM2000分光光度計(美國Thermo-fisher公司); PacBio Seque III測序儀(美國PacBio公司); StepOnePlusTMReal-Time PCR(qPCR)儀(美國Applied Biosystems公司); K5800自動檢測超微量分光光度計(凱奧公司)。
1.1.2 試劑 茉莉酸甲酯(methyl jasmonate, MeJA);Trizol試劑盒(Life technologies公司); SMARTer PCR cDNA Synthesis Kit(美國Clontech公司);RN38-EASYspin Plus植物RNA提取試劑盒(北京艾德萊公司); PrimeScriptTMRT Master Mix反轉錄試劑盒; TB Green? Premix ExTaqTMII(TliRNaseH Plus)(TaKaRa公司)。
1.1.3 植物材料 2022年8月在甘肅省隴南市甘肅中醫藥大學和政藥用植物園分別采集掌葉大黃(R.palmatum L.)一年生植株和成熟種子,經陜西中醫藥大學胡本祥教授鑒定。
選擇外觀一致且飽滿的種子點播于黑色塑料花盆中(直徑9 cm、高12.5 cm), 每盆點播4顆種子,每盆用200 g泥炭土(klasmann)。培養溫度為23±2℃,在9 000 Lx光強下光周期為16 h/8 h。第一次澆水至盆底有水排出即可,每隔3 d補水50 mL。
1月后,選取長勢一致、生命旺盛的掌葉大黃幼苗3株,將其根、葉等量混合用于全長轉錄組測序分析。同時,對1月齡幼苗葉片噴施200 μmol/L MeJA為處理組、噴施溶劑為模擬對照組,以0 h為空白對照,所有樣品重復3次,分別于處理后3、6、12和24 h取樣,液氮速凍后于-80℃冰箱保存。
取200 μmol/L MeJA處理12 h即MeJA-12 h、Mock-12 h 葉片樣本,3次生物學重復,送廣州基迪奧生物科技有限公司進行 RNA-seq 分析;取一年生植株3株,根、根莖、葉3個部位各等量混合后進行RNA-Seq分析。
1.2.1 全長轉錄組測序及WRKY鑒定 利用Trizol試劑盒提取總RNA,采用NanoDropTM 2000分光光度計檢測RNA樣品的濃度,檢測合格后的總RNA使用SMARTer PCR cDNA Synthesis Kit及PCR擴增合成全長cDNA并進行SMRT bell文庫構建。上機測序采用PacBio Seque III,所得到的原始數據用SMRT Link V8.0.0進行分析。先提取高質量的環形一致性序列(circular consensus sequencing, CCS),聚類FLNC reads,得到完整的isoform。通過BlastX(http://www.ncbi.nlm.nih.gov/BLAST/)將isoform比對到蛋白數據庫SwissProt(http://www.expasy.ch/sprot)、Nr(http://www.ncbi.nlm.nih.gov)和KEGG(http://www.genome.jp/kegg)進行功能注釋。
使用轉錄因子數據庫plant TFdb(http://planttfdb.gao-lab.org/index.php)在蛋白序列中找到有已知轉錄因子的motif,進行轉錄因子家族歸類。挑選WRKY轉錄因子家族基因,再次進行BlastX比對,候選基因包含起始密碼子和終止密碼子的完整開放閱讀框(open reading frame, ORF)利用ORFfinder(https://www.ncbi.nlm.nih.gov/orffinder/)在線網站進行預測,使用標準密碼子翻譯表將其中最長的ORF翻譯成全長蛋白序列。用ExPASy(https://prosite.expasy.org/prosite.html)分析基因編碼蛋白質的結構域,同時用CDD(https://www.ncbi.nlm.nih.gov/cdd)進行驗證。
1.2.2 蛋白序列分析 采用ExPASy ProtParam(http://cn.expasy.org/tools)和SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)在線網站進行蛋白一級、二級結構理化性質分析。亞細胞定位使用WoLF PSORT(http://www.genscript.com/psort/wolf_psort.html)預測。
根據WRKY保守結構域來分類RpWRKYs,該結構域在Jalview軟件中進行可視化分析。使用MEGA 11軟件中鄰接法(neighbor-joining, NJ)進行RpWRKYs系統進化樹構建分析,Bootstrap為1 000次,再利用itol在線網站進行發育樹修飾和標注。保守氨基酸基序的分析使用在線保守基序預測網站MEME(https://meme-suite.org/meme/tools/streme)完成。利用TBtools可視化分析RpWRKYs蛋白保守基序。
1.2.3 基因組織表達分析 基于RNA-Seq轉錄組測序數據,篩選出RpWRKYs在掌葉大黃根、根莖和葉中的表達數據,以FPKM值表示豐度,經log2標準化后運用TBtools繪制RpWRKYs在不同組織中的相對表達量熱圖,分析其在不同組織部位的表達模式。
1.2.4 候選基因qPCR驗證 參照RN38-EASYspin Plus植物RNA提取試劑盒提取掌葉大黃各樣品總RNA,1.0%瓊脂糖進行凝膠電泳檢測完整性,經K5800自動檢測超微量分光光度計檢測RNA濃度和純度合格之后用PrimeScriptTMRT Master Mix反轉錄試劑盒合成cDNA第一鏈,-20℃保存備用。
利用實時熒光定量PCR檢測RpWRKYs在大黃不同樣品中基因表達,以β-actin為內參基因。使用TB Green?Premix ExTaqTMII(TliRNaseH Plus)進行qPCR。20 μL反應體系:2×TB Green?Premix ExTaqTMII(TliRNaseH Plus)10 μL、forward/reverse primer各0.4 μL、cDNA模板1 μL、50×ROX Reference Dye 0.2 μL、ddH2O 7 μL。反應程序:預變性95℃ 30 s;變性95℃ 5 s,退火60℃ 30 s,延伸60℃ 34 s,40個循環,反應結束后于95℃ 15 s,60℃ 1 min,95℃ 15 s條件下繪制熔解曲線。包括不加模板的對照在內,所有qPCR反應技術重復和實驗重復各3次,應用2-ΔΔCt法計算相對表達量。
1.2.5 蒽醌合成關鍵酶基因與RpWRKYs蛋白相互作用分析 課題組前期根據二代轉錄組數據NR注釋結果篩選得到蒽醌類生物合成途徑的關鍵酶基因,并繪制蒽醌類生物合成代謝途徑[20]。蒽醌母核的生物合成主要涉及莽草酸(shikimic acid)和聚酮(polyketide)途徑,由于中間產物共用,甲基赤蘚糖醇(methylerythritol 4-phosphate, MEP)、甲羥戊酸(mevalonic acid, MVA)途徑也參與其中(圖1)。使用string 11.5(http://string-db.org/)數據庫預測RpWRKYs蛋白與蒽醌類物質合成關鍵酶基因的相互作用網絡,選定模式植物擬南芥為物種參數,去除不成簇和單個節點的蛋白得到蛋白互作網絡圖。

圖1 大黃蒽醌類生物合成途徑Fig. 1 Anthraquinone biosynthesis pathway in R. officinale Baill
掌葉大黃全長轉錄組中有106條Isoform編碼WRKY蛋白,其中,包含完整ORF的Isoform有62個。整理ORF差異位點并合并重復,最終獲得53個全長RpWRKYs,編號RpWRKY1-RpWRKY53(表1)。序列最長的是RpWRKY1,由748個氨基酸編碼,最短的是RpWRKY53,由192個氨基酸編碼。

表1 掌葉大黃RpWRKY 轉錄因子的基本信息Table 1 Basic information of RpWRKY transcription factors in R. palmatum
蛋白質一級結構分析發現,基因編碼蛋白的相對分子量在21.184(RpWRKY53)-80.746(RpWRKY1)kD之間,理論等電點介于5.40-9.92,包括37個堿性蛋白,16個酸性蛋白。所有RpWRKYs蛋白的平均親水性數值是負值,說明其均為親水性蛋白;RpWRKY44/53的不穩定系數<40,推測其為穩定蛋白,其余51個為不穩定蛋白;脂肪系數為41.61-73.92,說明RpWRKY轉錄因子基因編碼蛋白的熱穩定性較好。
RpWRKYs家族蛋白均具有α螺旋、延伸鏈、β轉角和無規卷曲,所占比例較大的是α螺旋和無規卷曲(所占比平均值分別為20.59%、64.56%),β-折疊和延伸鏈占比較?。ㄋ急绕骄捣謩e為11.25%、3.57%),散布于整個蛋白中。亞細胞定位結果顯示,53個RpWRKYs蛋白均定位于細胞核。
利用MEGA11構建掌葉大黃與擬南芥WRKY轉錄因子家族系統進化樹。圖2結果表明,53個RpWRKYs蛋白分為I、II、III 3個組,與擬南芥WRKY分類結果一致。I組的RpWRKY蛋白有16個,占30.18%,II組又分為II-a、II-b、II-c、II-d、II-e 5個亞組,含有RpWRKY家族成員31個,占58.49%,II-e(1個)和II-b(3個)兩亞組RpWRKY基因分布較少;其次是III組,含有6個RpWRKYs基因,占11.32%。

圖2 掌葉大黃和擬南芥中WRKYs成員的進化樹Fig. 2 Evolutionary tree of WRKYs members in R. palmatum and Arabidopsis thaliana
通過MEME在線工具對RpWRKYs分析,結果(圖3-A-B)表明,同組的RpWRKYs包含的保守元件數量和種類一致,而組間存在一定的差異性。53個RpWRKYs蛋白包含8個Motif保守基序,最短基序有29個氨基酸殘基,最長的有50個氨基酸殘基。由圖3-C可知Motif1和Motif3為RpWRKYs蛋白的WRKYGQK七肽保守序列,Motif2和Motif5屬于鋅指結構基序,RpWRKYs蛋白基序分布與基因分類結果一致。

圖3 RpWRKYs的進化樹(A)、保守基序(B)和保守基序特征(C)Fig. 3 Evolution tree(A), conserved motifs(B)and conserved motif signatures(C)of RpWRKYs
利用不同組織及MeJA組的RNA-seq數據分析掌葉大黃53個RpWRKYs基因的表達譜。結果顯示(圖4-A),同一基因在根、根莖、葉中表達差異較大,僅在根、根莖和葉中高表達的基因分別有21、11、10個。7個基因(RpWRKY5/12/25/28/30/42/47)在根和根莖中表達量均較高,葉中表達量最低。在MeJA處理下(圖4-B),53個RpWRKYs基因呈現差異表達,其中RpWRKY6/7/9/14/33/35/38/43/46/47被MeJA顯著誘導,RpWRKY5/18被顯著抑制。

圖4 掌葉大黃不同組織中RpWRKYs的表達模式(A)和MeJA處理下的響應(B)Fig. 4 Expression patterns of RpWRKYs in different tissues of R. palmatum(A)and in response to MeJA treatment(B)
qPCR分析檢測RpWRKY5/6/9/33響應MeJA處理的表達結果見圖5。以0 h(CK)為空白對照,結果顯示4個基因于MeJA處理12 h的表達量與轉錄組測序數據基本一致。RpWRKY5在MeJA激素處理下4個時間段表達量均下降,且在12 h下調最明顯,為Mock的0.09倍。RpWRKY6/9/33在12 h上調表達,分別為Mock的58.19、2.67、10.66倍,且RpWRKY6于12 h達峰值。

圖5 RpWRKY5/6/9/33在MeJA處理下的表達模式Fig. 5 Expression pattern of RpWRKY5/6/9/33 in response to MeJA treatment
使用STRING 11.5在線軟件構建53個RpWRKY蛋白與蒽醌類生物合成關鍵酶蛋白的蛋白質-蛋白質相互作用網絡(圖6),模式植物設置為擬南芥,去除不成簇和單個節點的蛋白。結果顯示,共有19個RpWRKY蛋白相互作用,其中AtWRKY40(RpWRKY28/33/35/38/43/46)屬于網絡中的中心節點,其余6個AtWRKY均與AtWRKY40有相互作用。5個RpWRKYs蛋白(RpWRKY2/16/20/22/23)通過CHS與其他蒽醌合成途徑關鍵酶基因連接成簇。

圖6 RpWRKY蛋白質-蛋白質相互作用網絡Fig. 6 Protein interactions of protein RpWRKYs
WRKY基因家族是調節植物生長和次生代謝的最大轉錄因子家族之一,廣泛參與植物對生物、非生物和激素脅迫的響應,以及植物生長發育過程[21]。WRKY家族已經在模式植物擬南芥[22]、經濟作物大豆[23]、馬鈴薯[24]和許多藥用植物如人參、丹參、板藍根[25]中進行了研究。本研究利用第三代測序技術分析了掌葉大黃的全長轉錄組,從掌葉大黃中鑒定到53個RpWRKYs全長基因,和黃連(41)[26]、馬藍(65)[27]及杜仲(51)[28]等藥用植物中WRKY基因數量差距不大。但相對于大豆、擬南芥和馬鈴薯基因組的188、72、79個基因[29],掌葉大黃RpWRKYs基因數量較少,說明在藥用植物中WRKY基因家族的數量相較于模式植物和經濟作物來說發現的較少,隨著未來掌葉大黃基因組測序的深入研究,將會鑒定出更多未發現的RpWRKYs基因,進一步豐富大黃WRKY基因家族。
系統發育分析顯示RpWRKYs基因被分為3大組(I、II和III),與擬南芥WRKY基因家族[21]分組一致。其中,II-e(1個)和II-b(3個)組RpWRKYs分布較少。研究發現II-e組AT1G30650.1(WRKY14)基因為擬南芥熱形態發生的抑制因子[30],RpWRKY47與其聚為一個分支,說明RpWRKY47可能在掌葉大黃溫度脅迫機制中起重要作用。
基因結構決定基因功能,對RpWRKYs的結構進行預測發現其均為熱穩定性良好的親水性蛋白,亞細胞定位預測RpWRKYs均定位在細胞核中,說明RpWRKYs的轉錄調控過程主要在細胞核內進行。相同或相似的基序是維系蛋白質結構域進而發揮生物學功能的重要前提。對53個RpWRKYs蛋白的保守基序分析發現,組內Motif分布基本一致,組間存在差異且Motif在不同組的分布符合WRKY家族分類的特征。Motif1和Motif2存在于所有RpWRKYs序列中,說明這兩個基序高度保守,為WRKY的特征基序[31]。
RpWRKYs在掌葉大黃中有著明顯的組織表達特異性,僅在根中高表達的有21個,高表達基因數目明顯多于根莖(11)和葉(10),RpWRKY5/12/25/28/30/42/47等7個基因在根和根莖中表達量均較高,可能參與了掌葉大黃根及根莖的生長發育過程。相較于RpWRKYs主要在根及根莖中有較高表達,馬藍中高表達WRKY則主要分布于根莖及葉片中,說明WRKY在不同物種不同部位中的表達差異較大。Li等[32]檢測發現PgWRKYs表達趨勢與桔梗皂苷含量變化一致,推測PgWRKYs可能調節桔梗皂苷的代謝。本課題組后續也會結合掌葉大黃全生育期活性成分含量變化及其與RpWRKYs表達量的關聯分析,進一步明確可能參與大黃蒽醌類成分合成的關鍵WRKY基因。
MeJA參與了植物生長發育和脅迫反應等多個生理過程,同時能夠調節植物的次生代謝[33]。為研究中藥活性成分生物合成途徑,通常在可控培養環境下,以MeJA等激素處理藥用植物,通過多組學分析,挖掘關鍵調控基因。課題組前期研究發現,外源MeJA處理可顯著誘導掌葉大黃蒽醌類成分積累,RNA-seq揭示MeJA信號通路、次生代謝通路、抗病防御通路均得到顯著富集,而我們關注的RpWRKYs基因家族成員呈現差異表達。10個RpWRKYs基因顯著誘導,只有RpWRKY5和RpWRKY18被MeJA抑制。掌葉大黃不同組織表達模式及其對MeJA的響應表明,這些基因可能在掌葉大黃的生長發育和次級代謝中發揮重要作用。本研究中RpWRKYs在MeJA處理下顯示出不同的響應模式,RpWRKY6/9/33受MeJA顯著誘導,推測可能參與掌葉大黃對外界逆境的防御反應。
蛋白質-蛋白質互作網絡,有助于調節生物信號傳遞和相關基因表達。研究表明AtWRKY6和AtWRKY42相互作用,參與擬南芥對低Pi脅迫的響應[34]。對于RpWRKY蛋白互作網絡預測分析表明,AtWRKY40(RpWRKY28/33/35/38/43/46)屬于網絡中的中心節點,可能在掌葉大黃生長發育以及生物和非生物脅迫等應答過程中發揮重要作用。CHS基因是聚酮代謝途徑的關鍵基因,在蒽醌類物質合成中扮演著重要的角色,如決明CHS-L9參與蒽醌類物質的生物合成[35]。蛋白互作預測AtWRKY44(RpWRKY2/16/20/22/23)與CHS關系密切,推測RpWRKY2/16/20/22/23可能參與了掌葉大黃蒽醌類物質的生物合成過程。綜上所述,本研究為進一步研究WRKY轉錄因子在大黃次生代謝調控及藥材品質形成過程中作用機制提供依據。
本研究鑒定了掌葉大黃53個WRKY基因,并對其進行理化性質、遺傳進化和表達模式分析,探究了不同RpWRKY對MeJA的響應模式以及RpWRKY的組織表達特異性。研究結果顯示WRKY家族基因在掌葉大黃根及根莖中表達量較高,RpWRKY在不同時間MeJA處理下有著不同的響應模式。蛋白互作結果表明有5個RpWRKY基因可能與大黃中蒽醌類物質的合成有關。