楊教童, 李鵬飛, 肖巧巧
貴州中醫藥大學 中藥民族藥資源研究院,貴陽 550025
金銀花是我國常用的藥用植物之一, 在世界各地均有種植, 主要分布在東亞的中國、 韓國和日本等國家, 在中國常使用金銀花的花蕾和花入藥, 而日本常使用金銀花的莖和葉入藥[1]. 金銀花具有清熱解毒、 疏散風熱等功效, 在國內分布廣, 品種多, 使用量大. 現已鑒定出金銀花具有多種活性成分, 包括揮發油、 黃酮類、 有機酸類和三萜類化合物等[2], 可用于治療肺結核、 肺炎、 急性細菌性痢疾等疾病[3]. 金銀花除了在醫學方面有重要的應用外, 在化妝品、 食品和健康飲料方面也有廣泛的應用價值[4-5]. 此外, 金銀花還經常作為觀賞植物呈現在大眾面前[1]. 金銀花的藥用、 養生和觀賞價值決定了其具有較大的市場開發利用前景.
WRKY轉錄因子是植物特有的一類轉錄因子, 因其具有高度保守的WRKYGQK氨基酸序列而得名[6].WRKY基因最初在甘薯中被發現[7], 后期的研究中發現WRKY基因家族包含3個亞家族[8], 并且第2個亞家族又可進一步細分為5個次亞家族[9]. 有研究表明WRKY轉錄因子能識別靶基因的W-box[(T)TGAC(C/T)] 序列并進行特異性結合, 進而調控靶基因的功能[10]. 高等植物的WRKY轉錄因子在不同組織中發揮著重要作用.WRKY基因可以調節植物的生長發育, 如擬南芥的WRKY46,WRKY54和WRKY70可以通過油菜素內酯調控其生長發育過程[11]. 此外,WRKY轉錄因子還參與非生物脅迫反應, 如干旱、 損傷、 水分和鹽脅迫等[12-14]. 在擬南芥中過表達WRKY30可增強鹽脅迫的抗性, 在水稻中過表達WRKY47可以顯著增強水稻對干旱的耐受性. WRKY蛋白在應答生物脅迫(包括細菌、 真菌和病毒病原體)方面也發揮重要作用[15-16], 如擬南芥的WRKY22能夠通過水楊酸和茉莉酸信號調控其對蚜蟲的易感性[17]. 綜上所述,WRKY基因在植物的生長發育、 逆境應答方面發揮了重要的作用.
目前, 越來越多植物的WRKY家族基因被鑒定且相關功能被報道, 如刺梨[18]、 玉米[19]、 茄子[6]、 菠蘿[20]和番茄[21]等, 但金銀花的WRKY基因家族鑒定還未見報道. 本研究基于WRKY家族的種子序列對金銀花WRKY家族基因進行鑒定, 并基于公共轉錄組數據對其功能進行預測, 為將來開展金銀花WRKY基因的功能研究奠定基礎.
從中國國家生物信息中心(CNCB)收集金銀花的全蛋白序列, 從Pfam網站[22]上下載WRKY蛋白的結構域序列, 利用HMMER軟件[23]對金銀花全蛋白序列進行評估以鑒定WRKY基因, 進一步使用保守域預測軟件CDD[24]確保候選基因含有WRKY保守域.
使用 ExPASy在線軟件(https: //web.expasy.org/protparam/)對候選WRKY基因的理化性質進行分析, 指標包括分子量(Da)、 氨基酸數量、 等電點、 不穩定指數、 脂肪系數和平均親疏水性.
提取金銀花和擬南芥WRKY蛋白的WRKY結構域序列, 使用進化樹分析軟件Mega7[25]內置Clustalx進行多序列比對, 然后根據NJ方法進行進化樹的構建與分析, 執行參數: Poission correction, pairwise deletion 和 bootstrap(1 000次重復).
使用MCscanX軟件[26], 在默認參數下分析家族成員的復制事件. 結合家族成員的染色體位置信息, 使用TBtools軟件繪制基因共線性圖.
以全基因組數據庫為基礎, 利用TBtools[27]獲取基因上游2 000 bp的基因組序列, 然后遞交至PlantCARE網站進行啟動子順式作用元件分析[28], 最后通過TBtools[27]對啟動子功能元件進行可視化操作.
根據WRKY蛋白的長度信息及結構域的定位信息, 使用TBtools軟件[27]可視化金銀花WRKY蛋白的結構域.
從金銀花功能基因組數據庫(LjaFGD)[29]中獲取兩組不同轉錄組數據的表達量, 用 TBtools的heatmap工具繪制WRKY基因家族表達熱圖, 分析基因表達與金銀花表型的關系.
本研究采用WRKY家族固有的結構域來鑒定金銀花的WRKY家族基因, 在金銀花全基因組水平上共鑒定了46個WRKY基因. 結果表明WRKY基因的編碼蛋白分子量在15 963.55~80 967.23 Da之間, 氨基酸數量在149~748之間, 等電點在4.75~9.71之間, 不穩定系數在40.97~67.76之間, 脂肪系數在41.00~71.05之間, 平均親疏水性在-1.147~-0.463之間(表1).

表1 金銀花WRKY基因家族及理化性質的預測
本研究對金銀花和擬南芥WRKY保守結構域序列進行了多序列比對, 然后使用Mega7軟件對WRKY基因家族進行進化樹構建, 并使用在線工具iTOL[30]進行展示(圖1). 結果表明金銀花的WRKY家族可分為3個亞家族, 其中亞家族的基因數量分別是16, 13, 17個. 另外, 本研究對基因的旁系同源關系進行預測, 并對WRKY基因在金銀花中的共線性進行分析, 發現WRKY家族有明顯的重復現象, 這表明在金銀花的進化過程中可能發生過加倍(圖2).

圖1 金銀花WRKY基因家族的系統發育分析

圖2 金銀花WRKY基因家族在染色體上的加倍情況
對WRKY基因家族的啟動子區域的功能元件進行分析, 結果表明許多與光應答(如part of a light response element)、 激素應答(如auxin-response element)和逆境應答(如wound-response element)相關的功能元件出現在金銀花WRKY家族基因的啟動子區域(圖3), 說明金銀花的WRKY基因可能參與了光應答、 激素應答和逆境應答等過程.

圖3 金銀花WRKY基因家族的啟動子區域功能元件分布情況
本研究通過Pfam網站提供的在線工具預測金銀花WRKY家族蛋白可能含有的功能結構域(圖4), 發現所有的WRKY基因均含有WRKY結構域, 部分WRKY基因含有2個WRKY結構域, 主要集中在第1組中. 一些WRKY基因家族還含有其他的結構域, 如LjWRKY13除了含有2個WRKY結構域外, 還含有PK_Tyr_Ser-Thr結構域, 第2組中的5個成員含有Plant_zn_clust結構域, 這些結構的差異可能是導致WRKY家族蛋白發生功能分化的原因之一.

圖4 金銀花WRKY家族蛋白的結構域分析
本研究從LjaFGD金銀花功能基因組數據庫[29]中收集了兩組金銀花轉錄組數據的表達值, 構建了金銀花WRKY基因的表達矩陣, 根據矩陣進一步構建了基因表達熱圖(圖5). 第1組數據包括了幼芽期、 第3綠期、 全白期、 銀花期和金花期(圖5a), 第1組數據的第1簇、 第2簇的WRKY基因在幼芽期的表達高于開花期的表達, 因此可能在花的發育過程中發揮了作用. 第1組數據的第3簇在金花期表達顯著高于其他期, 因此可能在銀花期轉變為金花期的過程中發揮了作用. 第2組數據包括對照, 50%光照和20%光照(圖5b), 第2組數據的第2簇、 第4簇中的WRKY基因在低光強度下表達分別高于和低于對照, 因此可能參與了光的應答過程. 以上分析結果表明許多WRKY基因可能參與了金銀花的開花和光應答過程.

圖5 金銀花WRKY基因在兩組不同轉錄組中的表達熱圖
本研究在全基因組范圍內對金銀花的WRKY家族基因進行了鑒定并分析, 發現其WRKY基因家族可能在生長發育、 逆境應答過程中發揮著重要作用, 如調控金銀花花色變化、 干旱和水分脅迫應答等.WRKY基因參與金銀花花色調控雖然沒有報道, 但是在杜鵑花的研究中表明WRKY在開花后期可能參與了花色的形成[31]; 在番茄的研究中表明WRKY8參與了干旱和鹽脅迫的耐受性[32]; 在大豆的研究中表明GmWRKY基因在脫水和鹽脅迫下可能發揮作用[33]. 這些分析將為更深入研究金銀花的WRKY基因功能奠定重要的基礎.
大量的研究已經表明高等植物的WRKY基因家族在其生長發育、 逆境應答等過程中起著重要作用. 本研究根據金銀花WRKY基因的序列特點將WRKY基因分成了3個不同的亞家族. 不同分支上的亞家族之間可能由于序列的差異導致功能存在一定的分化, 進而產生WRKY基因功能的多樣性. 有研究表明金銀花在全基因組水平上發生了染色體加倍事件[34], 本研究對WRKY基因在不同染色體上的重復性分布進行了分析, 發現WRKY基因存在顯著的基因組加倍情況, 這種加倍情況可能是染色體加倍所致. 以上分析結果為將來開展WRKY基因功能分析提供了思路.
為了進一步分析金銀花WRKY基因的潛在功能, 本研究選用順式作用元件分析與基因表達分析共同探索金銀花WRKY基因存在的功能. 通過順式作用元件分析發現許多與光應答、 激素應答和生長發育相關的功能元件出現在WRKY基因家族的啟動子區域, 而通過分析不同光照強度的轉錄組數據發現了一些存在顯著差異表達的WRKY基因, 這些差異表達基因很可能參與了光應答過程. 此外,WRKY基因參與激素應答、 生長發育等過程在植物中也有報道[35-38], 表明該分析結果具有一定的可信度. 通過表達分析發現許多WRKY基因的表達與金銀花生長發育階段的趨勢相一致, 表明WRKY基因很有可能參與了金銀花的生長發育過程.
本研究對全基因組范圍內的金銀花WRKY家族基因進行鑒定, 并利用不同類型的轉錄組數據進行表達分析, 發現WRKY基因家族可能在光應答、 花發育和花色調控過程中發揮著重要作用, 結果為深入開展金銀花WRKY基因的功能研究奠定了基礎.