劉翔,趙紫璇,趙月盈,趙詩睿,賈子怡,姜含越,袁帥,孟德梅
(天津科技大學食品科學與工程學院,天津 300457)
轉錄因子(transcription factors,TF)是一類DNA 結合蛋白,可以特異性地與基因啟動子中DNA 特定序列發生相互作用,對其進行轉錄表達的調控[1]。V-myb 禽成髓細胞病病毒癌基因同源物(V-myb avian myeloblastosis viral oncogene homolog,MYB)是重要的轉錄因子家族之一,通常包含4 個結構功能域[2-3],其中,靠近氨基N 端的一段高度保守的氨基酸序列稱為DNA 結合域,該區域一般由1~4 個不完全重復的R 序列串聯組成[4-5]。根據R 結構特征可將MYB 轉錄因子分為1RMYB、R2R3-MYB、3R-MYB 和4R-MYB 4 個亞家族[6-7],它們廣泛存在于植物、動物以及真菌中。R2R3-MYB型轉錄因子是植物MYB 轉錄因子家族中最大的成員[8-9],在調控植物生長發育、參與調節生物或非生物脅迫的過程中具有重要作用[10]。例如,Sun 等[11]研究發現R2R3-MYB 轉錄因子CaMYB108 沉默會負向調控雄蕊的發育;R2R3-MYB 轉錄因子OsMYB30 可轉錄上調OsPAL6和OsPAL8基因的表達,誘導水稻對褐飛虱的抗性增強[12];Fang 等[13]發現楊樹中存在PtrMYB94基因,該基因參與楊樹中脫落酸依賴的正向干旱脅迫調控。目前,雖然R2R3-MYB 轉錄因子的功能研究較多,但是有關4R-MYB 轉錄因子的研究甚少且作用尚不清晰。MYB 轉錄因子的分類及功能[14-15]如表1所示。

表1 MYB 轉錄因子的分類及功能Table 1 Classification and functions of MYB transcription factors
此外,與植物相比,食用菌中轉錄因子的研究十分有限,對MYB 轉錄因子家族的研究更是少之又少。目前,已有研究從基因組水平對香菇(Lentinula edodes)[16]、金針菇(Flammulinavelutipes)[17]、靈芝(Ganodermalucidum)[18]和平菇(Pleurotusostreatus)[19]中的MYB 類轉錄因子進行了生物信息學分析和鑒定,但關于雙孢蘑菇中MYB 轉錄因子的研究鮮見。前期研究通過轉錄組學從雙孢蘑菇子實體中發現了一個MYB 編碼基因(gene3947),為了更好地了解和分析其特性以及探尋可能的生物學功能,本研究對該基因進行了克隆,對其理化性質、信號肽、保守結構域以及二、三級結構進行預測,將其保守結構域與其他物種中4R型MYB 的氨基酸保守結構域序列進行了比對和親緣關系分析,之后對其亞細胞定位與啟動子序列進行了分析,為后續深入研究提供一定的理論基礎。
雙孢蘑菇子實體:江蘇裕灌現代農業科技有限公司;pGEX-6P-1 載體:天津科技大學食品營養與安全重點實驗室保存;T4 DNA 連接酶:Thermo Fisher Scientific;EcoR I 限制性內切酶和Escherichiacoli(E.coli)DH5α:北京全式金生物技術股份有限公司;XhoI 限制性內切酶:美國NEB 公司;膠回收試劑盒:生工生物工程(上海)股份有限公司;質粒小提試劑盒:天根生化科技(北京)有限公司。
含有卡那霉素的(luria-bertani,LBK)固體培養基的配制:分別稱取5.0 g 酵母提取物,10.0 g 胰蛋白胨,10.0 g 的NaCl,15.0 g 瓊脂粉,用蒸餾水充分溶解,調pH 值至7.0 后,定容至1.0 L,在121 ℃的條件下高壓蒸汽滅菌20 min,待培養基冷卻至60 ℃,向培養基中加入1 mL(100 mg/mL)的卡那霉素,搖勻后分裝至無菌培養皿中,凝固后于4 ℃保存備用。
Veriti9902 PCR 儀:美國應用生物系統有限公司;Champ Gel 5000 凝膠成像儀:賽智科技有限公司;ZXDPB2120 電熱恒溫箱:上海智誠分析儀器制造公司。
參考Wang 等[20]的方法提取雙孢蘑菇總RNA,消化RNA 中殘留的基因組,檢測消化后RNA 的純度和質量,最終反轉錄得到互補DNA(complementary DNA,cDNA)樣品。根據前期轉錄組學測序中MYB 編碼基因(gene3947)的序列,設計Ab4RMYB擴增所需特異性引物(F:5′CGCAAAGAACGGAAGGTGAT 3′和R:5′GCCAGAAGCAACAATAGTCGC 3′)。
1.3.1 基因的克隆及測序
以反轉錄后的cDNA 為模板,利用設計的特異性引物,進行聚合酶鏈式反應(polymerase chain reaction,PCR)擴增,PCR 擴增的反應條件為95 ℃預變性3 min;95 ℃變性30 s,60 ℃退火30 s,72 ℃延伸2 min 30 s,以此條件擴增35 個循環;72 ℃終延伸15 min。反應結束后,用1%的瓊脂糖凝膠電泳對PCR 擴增產物進行檢測,并用膠回收試劑盒將條帶大小正確的PCR 產物進行回收。
將pGEX-6P-1 空載質粒和經PCR 回收的目的片段分別用限制性酶EcoR I 和XhoI 在37 ℃恒溫條件下雙酶切3 h,利用T4 DNA 連接酶于4 ℃反應8~12 h,將酶切后的PCR 片段連接至pGEX-6P-1 載體,構建pGEX-Ab4RMYB重組質粒。利用化學轉化法將重組質?;D入E.coliDH5α 感受態細胞,并涂布于LBK 固體培養基中,于37 ℃恒溫培養8~12 h。使用質粒小提試劑盒提取質粒,用限制性酶EcoR I 和XhoI 做雙酶切驗證,酶切正確的質粒進一步送檢進行測序驗證。
1.3.2 生物信息學分析軟件
通過在線工具對Ab4RMYB 轉錄因子的理化性質、蛋白信號肽、核定位信號、蛋白結構等進行分析,所用工具如表2所示。

表2 生物信息學分析工具Table 2 Tools used in bioinformatics analysis
1.3.3 多序列比對和系統進化樹構建
將Ab4RMYB 的保守結構域序列與高等植物、低等植物和真菌中已知的4R 型MYB 轉錄因子的保守結構域序列通過DNAMAN6.0 進行多序列比對;不同物種的MYB 蛋白保守結構域序列通過Clustal W 進行多序列比對后導入MEGA11.0 以鄰位相近法(neighbor joining,NJ)構建系統進化樹。上述氨基酸序列信息均來自于NCBI 數據庫(https://www.ncbi.nlm.nih.gov/),保守結構域序列均通過表2 中SMART 在線工具尋找。
1.3.4 基因啟動子序列分析
從NCBI 數據庫中下載Ab4RMYB基因的啟動子序列(起始密碼子上游2 000 bp),將基因的啟動子序列提交到PlantCARE 工具中(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),同時使用TBtools 軟件對順式元件進行可視分析。
數據由GSDS、SignalP-4.1、UCLA-DOE LAB—SAVES v6.0、DNAMAN6.0 分析得出,并采用Origin 2018 制圖,由MEGA11.0 以NJ 法構建系統進化樹,由iTOL 進行美化處理。
Ab4RMYB基因編碼區的擴增結果見圖1。

圖1 基因的擴增結果Fig.1 PCR amplification product
由圖1 可知,得到了片段大小1 200 bp 左右的PCR 產物,與預期基本一致。
重組載體的雙酶切驗證見圖2。
根據圖2 瓊脂糖凝膠檢測結果表明,得到了大小分別為1 200 bp 和6 600 bp 左右的基因片段。質粒測序結果表明,成功克隆出大小為1 209 bp 的基因片段。用DNAMAN6.0 對測序結果和轉錄組測序基因編碼區進行序列比對,結果表明序列相似性為100%。
將測序后的序列提交至NCBI 數據庫,查詢到該基因位于基因組的1601735-1603347 區域,mRNA 全長為1 613 bp。通過GSDS 基因結構顯示器將目的基因當中的外顯子和內含子相對位置進行可視化,基因的外顯子和內含子分析如圖3所示。

圖3 Ab4RMYB 基因的外顯子和內含子分析Fig.3 Exons and introns of Ab4RMYB
由圖3 可知,其序列包含9 個外顯子(1~184 bp、239~315 bp、363~456 bp、506~620 bp、673~791 bp、843~996 bp、1 048~1 131 bp、1 185~1 336 bp、1 384~1 613 bp)和8 個內含子(185~238 bp、316~362 bp、457~505 bp、621~672 bp、792~842 bp、997~1 047 bp、1 132~1 184 bp、1 337~1 383 bp)。
該基因翻譯的氨基酸為402 個,將氨基酸序列進行一級結構分析,結果如表3所示。

表3 Ab4RMYB 轉錄因子的基本性質Table 3 Basic properties of Ab4RMYB
由表3 可知,其蛋白分子大小為45.95 kDa,理論等電點為9.17,不穩定系數58.38,脂肪指數為72.34,親水性平均值為-0.784,屬于親水性蛋白。
部分分泌蛋白依靠N 端存在的一小段有特定結構的氨基酸殘基序列穿過細胞質膜,這段特殊序列稱為信號肽或分泌信號序列[21]。Ab4RMYB 轉錄因子的信號肽預測結果如圖4所示。

圖4 Ab4RMYB 轉錄因子的信號肽預測Fig.4 Prediction of signal peptides of 4RAbMYB
由圖4 預測的結果中可見,切割位點的最大值為0.110,位于17 位氨基酸;合并切割位點最大值為0.110,位于17 位氨基酸;信號肽分數的最大值為0.148,位于13 位氨基酸。信號肽分數平均值0.111,其預測的剪切點在1~16 位氨基酸。信號肽分數平均值遠遠小于0.5,說明Ab4RMYB 轉錄因子不含信號肽結構,不是分泌蛋白。
用Prabi SOPMA 預測二級結構,結果如圖5所示。

圖5 Ab4RMYB 的二級結構及保守結構域預測Fig.5 Secondary structure and predicted conserved domains of Ab4RMYB
由圖5A 可知,Ab4RMYB 轉錄因子二級結構中含有大量的α-螺旋和無規則卷曲,少量的β-轉角和延伸鏈結構,從數量上看,主要以無規則卷曲(47.26%)和α-螺旋(45.52%)結構為主。
使用SMART 數據庫預測Ab4RMYB 蛋白含有的保守結構域,由圖5B 可知,Ab4RMYB 蛋白分布著4 個SANT 重復保守序列,分別處于第66~140 位、143~190 位、195~254 和261~316 位的氨基酸之間,從結構上預測Ab4RMYB 屬于4R 類型MYB 轉錄因子。
將Ab4RMYB 轉錄因子保守結構域(66~316aa)序列提交到I-TASSER 服務中通過從頭建模法獲取蛋白質的三級結構模型如圖6所示。

圖6 Ab4RMYB 轉錄因子三級結構預測Fig.6 Predicted tertiary structure of Ab4RMYB
由圖6 可知,Ab4RMYB 轉錄因子蛋白在N、C 兩端存在兩條向外延伸的無規則卷曲長鏈,其內部存在4 個主要的不完全重復螺旋結構(R),結構中存在較多的α-螺旋和無規則卷曲,這與二級結構預測結果相符。InterPro 工具預測Ab4RMYB 轉錄因子存在2 個MYB DNA-binding domain,分別定位于R2(W147-G197)和R3(P198-W248)序列。
通過UCLA-DOE LAB—SAVES v6.0 中提供的ERRAT、WHATCHECK、PROCHECK 工具分別對三級結構模型的不同原子間的非鍵相互作用、立體化學參數和立體化學質量進行分析,結果圖7所示。

圖7 三級結構的質量評估Fig.7 Quality assessments of the predicted tertiary structure
原子間的非鍵相互作用力結果顯示,Ab4RMYB轉錄因子結構域的Overall Quality Factor 為87.310,大于85;立體化學參數結果顯示,Ab4RMYB 轉錄因子結構域模型評估的48 個指標中21 個指標通過,17 個指標警告,10 個指標錯誤(圖7B);立體化學質量結果顯示,94.1%氨基酸殘基落在最佳區和允許區,說明該模型的構象符合立體化學的規則(圖7C)。3 個工具獲取的評估結果均顯示預測模型質量較好。
將雙孢蘑菇中Ab4RMYB 的保守結構域(66~316aa)與高等植物、低等植物以及真菌中的MYB 轉錄因子的SANT 保守結構域進行序列比對。我們選取了高等植物中的MYBs 包括:蘋果(Malusdomestica,XP_008393534.1)、杜梨(Pyrusbetulifolia,APY20264.1)、桃(Prunuspersica,XP_007210492.1)、可可樹(Theobromacacao,XP_007036689.1)、蕓薹(Brassicarapa,XP_009145933.1);低等植物中MYBs 包括:萊茵衣藻(Chlamydomonasreinhardtii,XP_042914591.1)、團藻(Volvoxcarteri,XP_002952676.1)、衣藻(Chlamydomonasschloesseri,KAG2450615.1);真菌中MYBs 包括:白環蘑(Leucoagaricus,KXN89584.1)、紋緣盔孢傘(Galerinamarginata,KDR83959.1)、隆紋黑蛋巢菌(Cyathus striatus,KAF9006580.1)。Ab4RMYB 轉錄因子的多序列比對和保守氨基酸分析結果如圖8所示,其中B 圖為Ab4RMYB 轉錄因子氨基酸同源性百分比,序列的高度表示序列在該位置上的保守性。
從圖8 可看出,11 個來自不同物種的4R-MYB 轉錄因子的保守域都是由4 個不完全重復序列(R)即R1、R2、R3、R4 組成,通過氨基酸序列比對可以發現共有20 個100%保守的氨基酸殘基(如圖8A 黑色標注),其中9 個位于螺旋區域(α),11 個位于非螺旋區域中。20 個保守的氨基酸殘基中包含6 個100%保守的色氨酸,分布于4 個R 區中,并且R2 和R3 區域中規律存在著2 個100% 保守的色氨酸殘基,更為重要的是它們間隔20~30 個氨基酸,分別位于相鄰的兩個螺旋之間,共同形成一個疏水核心,對維持空間結構具有重要的意義[22]。不僅如此,每個保守的色氨酸前后都存在75%保守性的其他氨基酸殘基(如圖8A 深灰色標注),共同形成保守域。這些保守的氨基酸殘基對于螺旋-轉角-螺旋(helix-turn-helix,HTH)結構的維持也具有至關重要的作用。
在75%保守性的氨基酸殘基(圖8A 深灰色標注)中,相比于低等植物,雙孢蘑菇與其他真菌和高等植物的相似度更高,比如真菌和高等植物α4 中的丙氨酸(A),α5 中的第一個谷氨酸(E),α7 前端的精氨酸(R)以及內部的半胱氨酸(C)、酪氨酸(Y)在低等植物中分別被甘氨酸(G),天冬氨酸(D),苯丙氨酸(F),纈氨酸(V)和色氨酸(W)所替代。此外Ab4RMYB 保守結構域中147W、175R、176M、178S、179D、181R、182D、183R、185R、186N、187H、240G、241R、242Q、243Q、244C 共16 位氨基酸被預測為DNA 結合位點。研究表明[23-24],AACNG 是植物中R2R3-MYB 結合的重要順式作用元件,其中擬南芥R2R3-MYB 中的K-55、N-106、K-109、N-110 被報道是識別與結合AACNG 基序至關重要的氨基酸[25]。但是,我們通過氨基酸序列分析并未在Ab4RMYB 序列中發現上述能夠識別和結合該順式作用元件的4 個氨基酸,說明4R 型MYB 轉錄因子可能與R2R3 型MYB 轉錄因子識別和結合的順式作用元件不同。
為更好地了解雙孢蘑菇中Ab4RMYB 轉錄因子的系統發育關系,將雙孢蘑菇中Ab4RMYB 與植物、動物和真菌中MYB 蛋白的保守域進行系統發育樹分析,生物NCBI 號均來自NCBI 數據庫。用MEGA11.0 以NJ 法構建系統進化樹,設置bootstrap 值為1 000。不同物種中MYB 蛋白的系統發育樹分析結果如圖9所示。

圖9 不同物種中MYB 蛋白的系統發育樹分析Fig.9 Phylogenetic tree of MYB proteins in different species
由圖9 可知,進化樹結果表明,同一類別的MYB轉錄因子親緣關系更近,本文研究的雙孢蘑菇中的Ab4RMYB 轉錄因子與白環蘑中的LeMYB 轉錄因子相似度最高,親緣關系最近。
通過多種在線軟件預測Ab4RMYB 的核定位信息,結果如表4所示。

表4 Ab4RMYB 轉錄因子亞細胞定位分析Table 4 Subcellular localization of Ab4RMYB
由表4 可知,Novo Pro 預測核定位信號位于347~354 位氨基酸,PSORT Ⅱ預測核定位信號位于348~351 位氨基酸,兩種在線預測軟件均顯示其具有核定位序列(Nuclear localization sequence,NLS),可以進入細胞核。隨后,我們利用多種在線工具對Ab4RMYB亞細胞定位進行預測,結果均顯示其定位于細胞核。
真核生物基因的啟動子由核心啟動子和上游啟動子兩部分組成,是一類重要的DNA 序列。其作為基因表達的關鍵調控元件,具有控制基因轉錄和調節基因表達水平的功能[26]。為了探究Ab4RMYB 轉錄因子在雙孢蘑菇中可能參與或調控的生物過程,進一步通過PlantCARE 啟動子序列分析工具對Ab4RMYB基因的啟動子序列進行分析,結果如表5所示。

表5 Ab4RMYB 基因啟動子順式元件預測表Table 5 The cis-acting elements in Ab4RMYB promoter
Ab4RMYB基因啟動子序列中除含有2 個A-box,6 個CAAT-box 基本元件外,還含有13 個光反應元件(1 個GTGGC-motif、1 個GATA-motif、1 個GA-motif、1 個chs-CMA2a、2 個I-box、1 個LAMP-element、1 個TCCC-motif、2 個Sp1 和3 個G-box)和1 個晝夜節律控制元件(circadian),此類元件的存在說明Ab4RMYB基因有可能在雙孢蘑菇的生長發育環節發揮著重要的作用[27]。與此同時,還含有1 個參與低溫響應元件(LTR)、1 個參與干旱應答的元件(MBS),3 個厭氧誘導所必需元件(1 個ARE 和2 個GC-motif)。這些說明Ab4RMYB基因在響應生物抗逆應答方面可能具有一定的調控機制。除此之外,發現其中還包含多種激素響應的順式作用元件,如10 個茉莉酸甲酯誘導元件(5 個CGTCA-motif 和5 個TGACG-motif),2 個生長素響應元件(TGA-element)、2 個脫落酸響應元件(ABRE)、3 個赤霉素響應元件(1 個P-box 和2 個GARE-motif),這些元件的存在說明Ab4RMYB基因可能在特定的信號通路中發揮作用。通過以上分析表明,Ab4RMYB基因可能在雙孢蘑菇生長發育環節、抗非生物脅迫以及病原防御中具有重要的調控功能。
本研究首次從雙孢蘑菇中克隆到了一種4R型MYB轉錄因子編碼基因(Ab4RMYB),該基因編碼區長1 209 bp,編碼402 個氨基酸;其蛋白序列含有4 個保守的SANT-MYB 結構域和規律性分布的色氨基酸殘基,屬于MYB 轉錄因子家族中的4R-MYB 型,與白環蘑中的4R-MYB 轉錄因子親緣關系最近。結合信號肽分析和亞細胞定位預測分析,顯示其可在細胞核中發揮轉錄因子的功能。氨基酸序列分析顯示,該基因編碼蛋白序列中不含有植物R2R3-MYB 識別和結合AACNG 順式作用元件所需的氨基酸殘基[28-30],說明Ab4RMYB 轉錄因子可識別和結合的順式作用元件可能與植物中R2R3-MYBs 轉錄因子不同。因此,后續研究中可通過酵母單雜、凝膠阻滯遷移、雙熒光素酶等實驗對其可結合的順式作用元件及可轉錄調控的基因進行進一步研究。此外,啟動子序列分析結果表明,該基因啟動子區域具有多個響應生物抗逆應答和響應激素調控的元件,說明Ab4RMYB 可能與植物中R2R3-MYBs 轉錄因子有類似功能[31-32],能夠參與調控雙孢蘑菇的逆境脅迫反應及茉莉酸等激素信號的調控過程。但是,Ab4RMYB 能夠通過轉錄調控哪些基因或代謝過程進而參與調控這些生物過程,以及其轉錄調控的具體分子機制還需后續的詳細研究。
綜上所述,本研究對雙孢蘑菇中Ab4RMYB 轉錄因子進行基因克隆及生物信息學分析鑒定,為今后進一步深入解析該轉錄因子的結構特征和相關功能,及后續雙孢蘑菇中的生物學功能的驗證奠定了基礎。