莫海英,李智昊,蔡國(guó)磊,陳 鑫,吉巧琳,曹亞璞,楊海英,杜 剛
(1.云南民族大學(xué) 民族醫(yī)藥學(xué)院,云南 昆明 650000;2.云南民族大學(xué) 化學(xué)與環(huán)境學(xué)院,云南 昆明 650000)
轉(zhuǎn)錄因子(transcription factors,TFs)又稱反式作用因子,是與真核生物基因的順式作用元件結(jié)合并調(diào)控下游基因表達(dá)的一類蛋白分子,以響應(yīng)內(nèi)源性或外源性的刺激,激活或抑制靶基因的表達(dá),從而控制生化和生理過(guò)程;依據(jù)轉(zhuǎn)錄因子的DNA結(jié)合域的差異,轉(zhuǎn)錄因子又分為許多基因家族[1].其中MYB轉(zhuǎn)錄因子家族是真核生物中最通用的 TF家族之一;癌基因v-MYB是在禽成髓細(xì)胞病毒中發(fā)現(xiàn)的第一個(gè)MYB轉(zhuǎn)錄因子[2].MYB轉(zhuǎn)錄因子是包含53個(gè)氨基酸殘基的保守結(jié)構(gòu)域,其中的3個(gè)色氨酸殘基通過(guò)空間位置的排布,形成一個(gè)螺旋-轉(zhuǎn)角-螺旋(helix-turn-helix,HTH)折疊[3],可在特異識(shí)別位點(diǎn)與DNA的大溝結(jié)合[4];依據(jù)MYB結(jié)合域數(shù)量的差異,MYB家族被分為四個(gè)亞家族,分別是1R-MYB、R2R3-MYB、3R-MYB和4R-MYB[5].1R-MYB是一類調(diào)控染色體結(jié)構(gòu)穩(wěn)定性與細(xì)胞形態(tài)建成的端粒結(jié)合蛋白[6].R2R3-MYB蛋白是植物中分布最廣泛的一類MYB轉(zhuǎn)錄因子,在植物生長(zhǎng)發(fā)育的各個(gè)過(guò)程發(fā)揮重要作用,例如調(diào)控次生代謝物質(zhì)的生物合成、參與各種逆境脅迫響應(yīng)、響應(yīng)植物的激素應(yīng)答等[7].3R-MYB蛋白廣泛分布于動(dòng)物以及真菌細(xì)胞中,在植物細(xì)胞中的含量相對(duì)較少,主要參與細(xì)胞周期和細(xì)胞分化,同時(shí)也參與部分逆境脅迫響應(yīng)[8].4R-MYB目前僅在擬南芥、楊樹(shù)、葡萄中有少量的發(fā)現(xiàn),但其功能尚不明確[9].MYB蛋白廣泛分布于植物體內(nèi),參與植物初級(jí)和次級(jí)代謝、生長(zhǎng)發(fā)育、生理時(shí)鐘調(diào)控、細(xì)胞周期發(fā)育、生物和非生物脅迫應(yīng)答、植物防御等生物學(xué)過(guò)程的調(diào)控[10],例如之前的研究從金魚(yú)草、棉花、大豆、擬南芥、蘋(píng)果和白菜等植物中鑒定得到功能各異的 MYB轉(zhuǎn)錄因子[11],金魚(yú)草中AmMYB308L 可抑制植物次生代謝途徑中重要可溶性酚酸的合成[12];紅沙梨中 PyMYB10 和 PyMYB10.1 通過(guò)與PybHLH形成三元復(fù)合體調(diào)控花青素的生物合成[13].
蓖麻(RicinuscommunisL.),別名有蓖麻籽、大麻子、紅蓖、老麻子、紅麻等,為被子植物門(mén)大戟科蓖麻屬一年生或多年生草本植物[14],其經(jīng)濟(jì)價(jià)值主要體現(xiàn)在蓖麻籽油在生物能源、聚合物、精細(xì)化工產(chǎn)業(yè)中的利用,此外蓖麻還具有其他經(jīng)濟(jì)價(jià)值如蓖麻毒素提取用于醫(yī)藥農(nóng)藥、餅粨用于飼料化肥、葉片養(yǎng)蠶等[15].蓖麻的生長(zhǎng)適應(yīng)性極強(qiáng),從熱帶到溫帶地區(qū)均有分布,耐鹽堿、耐瘠薄,在耕作粗放、自然條件差、污染較嚴(yán)重的條件下也能正常生長(zhǎng),蓖麻在環(huán)境綠化、防風(fēng)固沙、防治水土流失、修復(fù)重金屬污染土壤方面展現(xiàn)出其生態(tài)效益.蓖麻基因組測(cè)序于 2010年初步完成,全基因組序列大約 350 Mb[16],但關(guān)于蓖麻MYB 轉(zhuǎn)錄因子家族功能研究少部分文獻(xiàn)報(bào)道了在蓖麻的耐鹽脅迫中MYB轉(zhuǎn)錄因子表達(dá)下調(diào)[17],尚未對(duì)蓖麻植物的MYB轉(zhuǎn)錄因子進(jìn)行系統(tǒng)分析,因此本研究通過(guò)蓖麻MYB基因家族的全基因組和轉(zhuǎn)錄組分析,以此與模式植物擬南芥的MYB蛋白進(jìn)行基序、聚類分析、功能注釋分析、系統(tǒng)進(jìn)化以及理化性質(zhì)分析,并對(duì)不同逆境脅迫下蓖麻中MYB表達(dá)量差異進(jìn)行研究,該研究為蓖麻植物MYB基因的功能研究提供了新的思路.
采用的蓖麻基因組數(shù)據(jù)來(lái)源于JGI官網(wǎng)(Joint GenomeInstitute,https://phytozome.jgi.doe.gov/pz/portal.html,美國(guó)能源部聯(lián)合基因組研究所的植物比較基因組學(xué)門(mén)戶網(wǎng)站),MYB蛋白的預(yù)測(cè)基于蓖麻基因組數(shù)據(jù)庫(kù),水稻、玉米和擬南芥的MYB 轉(zhuǎn)錄因子家族氨基酸序列分別來(lái)源于NCBI數(shù)據(jù)庫(kù)(National Center for Biotechnology Information,http://www.biosino.org/pages/ncbi-1.htm,美國(guó)國(guó)家生物技術(shù)信息中心),和擬南芥信息資源數(shù)據(jù)庫(kù)(PlantTFDB,http://planttfdb.gao-lab.org/).
玉米、水稻和擬南芥的MYB轉(zhuǎn)錄因子序列通過(guò)軟件clustalw)進(jìn)行比對(duì),依據(jù)clustalw的比對(duì)結(jié)果采用hmmer軟件(可以快速確定兩組序列之間的相似程度)構(gòu)建MYB轉(zhuǎn)錄因子的hmm模型,結(jié)合蓖麻基因組數(shù)據(jù)庫(kù)檢索結(jié)果,篩選evalue小于1x10-3的基因片段,提取相對(duì)應(yīng)的氨基酸序列,最后取三大數(shù)據(jù)庫(kù)CDD(Conserved Domain Database,https://www.ncbi.nlm.nih.gov/cdd/,保守結(jié)構(gòu)域數(shù)據(jù)庫(kù))、PFAM(Protein families,http://pfam.xfam.org/,蛋白結(jié)構(gòu)域數(shù)據(jù)庫(kù))、SMART(Simple Modular Architecture Research Tool,http://smart.embl.de/,識(shí)別蛋白保守結(jié)構(gòu)域)進(jìn)行結(jié)構(gòu)域確認(rèn),作為蓖麻MYB轉(zhuǎn)錄因子.
通過(guò)The MEME Suite5.3.3(https://meme-suite.org/meme/,用于研究Motif的組合工具套,Motif是指在一組序列中重復(fù)出現(xiàn)的相似的序列模式)程序?qū)Ρ吐镸YB家族蛋白的基序進(jìn)行分析,設(shè)定基序?qū)挾鹊淖畲笾禐?50、最小值為6,基序數(shù)量為10,其余參數(shù)均為默認(rèn)值,提取所選轉(zhuǎn)錄因子于基因組的位置信息,使用軟件TBtools(批量序列處理和交互式數(shù)據(jù)可視化)繪制圖像.
通過(guò)bioperl對(duì)提取出篩選好的蓖麻MYB轉(zhuǎn)錄因子家族蛋白序列進(jìn)行理化性質(zhì)分析.同時(shí)利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html,蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)軟件)對(duì)蛋白二級(jí)結(jié)構(gòu)特征進(jìn)行預(yù)測(cè).
通過(guò)軟件PANNZER2(http://ekhidna2.biocenter.helsinki.fi/sanspanz/,預(yù)測(cè)功能描述(DE)和GO類),對(duì)已篩選確定的蓖麻MYB轉(zhuǎn)錄因子進(jìn)行功能注釋.
對(duì)來(lái)源于PlantTFDB數(shù)據(jù)庫(kù)的完整擬南芥MYB轉(zhuǎn)錄因子蛋白序列進(jìn)行進(jìn)化分析;采用MEGA7軟件內(nèi)置的ClustalW程序?qū)Ρ吐镸YB家族蛋白序列以及下載的擬南芥MYB轉(zhuǎn)錄因子蛋白序列進(jìn)行比對(duì)分析,采用鄰接法(重復(fù)次數(shù)為1000次)構(gòu)建系統(tǒng)發(fā)育樹(shù).
從NCBI數(shù)據(jù)庫(kù)中下載蓖麻的轉(zhuǎn)錄組數(shù)據(jù),熱脅迫轉(zhuǎn)錄組數(shù)據(jù)(HS-1:SRR17894243,HS-2:SRR17894242,HS-3:SRR17894241,CK-1:SRR17894246,CK-2:SRR17894245,CK-3:SRR17894244),鹽脅迫轉(zhuǎn)錄組數(shù)據(jù)(USZ-1:SRR17069850,USZ-2:SRR17069859,USZ-3:SRR17069858,SSZ-1:SRR17069856,SSZ-2:SRR17069855,SSZ-1:SRR17069854).
使用trim_galore v0.6.7去除3′端接頭和過(guò)濾平均質(zhì)量分?jǐn)?shù)低于堿基質(zhì)量值30(quality score of 30,Q30)的讀長(zhǎng)(reads);使用STAR version=2.7.10a軟件與蓖麻參考基因組(https://phytozome-next.jgi.doe.gov/info/Rcommunis_v0_1)進(jìn)行比對(duì).使用featureCounts 2.0.1進(jìn)行定量.
從蓖麻基因組數(shù)據(jù)中共挖掘出32條MYB基因序列,基因片段大小為164~676 bp.片段最短 164 bp(29701.m000580),編碼54個(gè)氨基酸,最長(zhǎng) 676 bp(29737.m001227),編碼225個(gè)氨基酸,片段平均長(zhǎng)度為 378 bp(見(jiàn)附件表2).
32個(gè)蓖麻MYB轉(zhuǎn)錄因子家族的10個(gè)基序,研究發(fā)現(xiàn)32個(gè)蓖麻轉(zhuǎn)錄因子蛋白均具有基序1和2結(jié)構(gòu),結(jié)合MEME和smart結(jié)構(gòu)域在線分析,發(fā)現(xiàn)在32個(gè)MYB轉(zhuǎn)錄因子中同時(shí)存在基序1、2和3時(shí)蛋白質(zhì)中具有2個(gè)MYB結(jié)構(gòu)域,不具有基序3時(shí)只有1個(gè)MYB結(jié)構(gòu)域,基序3可能是一種典型的MYB基因結(jié)構(gòu)域(圖1).

圖1 蓖麻MYB轉(zhuǎn)錄因子基序分析
即預(yù)測(cè)的32個(gè)蓖麻MYB基因家族主要是1R-MYB和2R-MYB基因亞家族.即在32個(gè)蓖麻轉(zhuǎn)錄因子蛋白中具有1R-MYB結(jié)構(gòu)域(圖2)的分別為28582.m000318、29701.m000580、30170.m013948、29780.m001368、29842.m003572、27757.m000022、29814.m000747、30174.m008957、29737.m001227、29848.m004559、29751.m001898、30180.m001019、29790.m000831、28883.m000751、29807.m000474、29676.m001636、29780.m001324、30226.m001993、27973.m000086、30068.m002645,具有2R-MYB結(jié)構(gòu)域的分別為28582.m000317、28582.m000316、29805.m001544、30169.m006598、29637.m000753、29680.m001711、29813.m001501、29950.m001149、29827.m002675、29805.m001543、29904.m002952、30017.m0003(表1).

圖2 蓖麻中MYB基因在smart里的結(jié)構(gòu)域

表1 蓖麻中MYB基因在smart里鑒定的結(jié)構(gòu)域
理化性質(zhì)結(jié)果(見(jiàn)附件表2),此次研究中32個(gè)MYB家族蛋白平均相對(duì)分子質(zhì)量為 42 132,最小值為29701.m000580編碼蛋白的18734.7,最大值為29737.m001227編碼蛋白的74390.5.等電點(diǎn)(pI)平均值為7.39,最小值為30174.m008957編碼蛋白的4.8,最大值為30226.m001993編碼蛋白的9.88,其中pI大于7的MYB家族蛋白有18個(gè),大于pI小于7的14個(gè),證明大部分蓖麻MYB家族蛋白表現(xiàn)為偏堿性.依據(jù)MYB家族蛋白結(jié)構(gòu)特征預(yù)測(cè)結(jié)果,32個(gè)MYB蛋白主要由無(wú)規(guī)卷曲(58.0%)、α螺旋(29.9%)、延伸鏈(8.4%)和β轉(zhuǎn)角(3.4%)組成.
GO注釋結(jié)果表明,蓖麻32條MYB轉(zhuǎn)錄因子序列中有31條均被注釋到生物過(guò)程、分子功能和細(xì)胞組分,并被進(jìn)一步富集為26個(gè)功能類別(圖3).其中生物過(guò)程主要富集在生物過(guò)程調(diào)節(jié),生物調(diào)節(jié),細(xì)胞過(guò)程和代謝過(guò)程;分子功能集中富集在結(jié)合調(diào)控上,細(xì)胞組分主要富集在細(xì)胞,細(xì)胞部分和細(xì)胞器調(diào)控上.可推測(cè),蓖麻MYB 轉(zhuǎn)錄因子通過(guò)結(jié)合到 DNA 區(qū)域發(fā)揮相應(yīng)的調(diào)控功能,主要涉及植物的細(xì)胞過(guò)程、發(fā)育過(guò)程和物質(zhì)代謝等過(guò)程(圖3).

圖3 蓖麻轉(zhuǎn)錄因子功能注釋
在PlantTFDB數(shù)據(jù)庫(kù)中下載擬南芥所有的MYB家族蛋白氨基酸序列(共168個(gè)),將上述篩選出的蓖麻MYB家族蛋白和下載到的擬南芥MYB家族蛋白利用軟件MEGA7構(gòu)建進(jìn)化樹(shù).根據(jù)聚類結(jié)果(圖4),可將蓖麻MYB轉(zhuǎn)錄因子分為2個(gè)亞家族,其中綠色標(biāo)記的一類亞家族成員22個(gè)(28582.m000317—30017.m000317:28582.m000317、28582.m000318、27757.m000022、29814.m000747、29842.m003572、29676.m001636、29780.m001324、28883.m000751、29807.m000474、29737.m001227、29848.m004559、29751.m001898、30180.m001019、29637.m000753、29680.m001711、30169.m006598、29805.m001544、29950.m001149、29827.m002675、29813.m001501、29904.m002952、30017.m000317),第二類亞家族成員10個(gè)結(jié)果(30068.m002645—29780.m001368:29780.m001368、30174.m008975、30226.m001993、29805.m001543、29790.m000831、27973.m000086、28582.m000316、29701.m000580、30170.m013948、30068.m002646),并且被聚類到相同分支的蛋白具有相似的功能,根據(jù)表3可以看出,第一類亞家族中擬南芥的MYB蛋白AT1G49010.1、AT5G08520.1、AT5G04760.1基因與脫落酸介導(dǎo)的鹽脅迫耐受的重要調(diào)節(jié)因子,是脫落酸(ABA)信號(hào)轉(zhuǎn)導(dǎo)所必需的,因此蓖麻中的MYB轉(zhuǎn)錄因子(28582.m000317-30017.m000317分支)可能是鹽脅迫耐受的重要調(diào)節(jié)因子.

圖4 蓖麻MYB家族蛋白與擬南芥MYB家族蛋白進(jìn)化樹(shù)

表3 蓖麻MYB轉(zhuǎn)錄因子與擬南芥MYB蛋白同源性功能比較
2.6.1 鹽脅迫下MYB基因的轉(zhuǎn)錄組分析
根據(jù)蛋白表達(dá)熱圖結(jié)果,32 個(gè)MYB蛋白的轉(zhuǎn)錄組在鹽脅迫和正常情況下的表達(dá)量存在明顯的差異;從圖中可以看出23個(gè)MYB蛋白(占全部MYB蛋白的71.88%)在鹽脅迫的處理下表達(dá)上調(diào);其中有16個(gè)屬于第一類亞家族成員(占第一類亞家族蛋白72.73%),分別為28582.m000318、27757.m000022、29814.m000747、29842.m003572、29676.m001636、28883.m000751、29807.m000474、29848.m004559、29637.m000753、29680.m001711、30169.m006598、29805.m001544、29827.m002675、29813.m001501、29904.m002952、30017.m000317,表明蓖麻在鹽脅迫下MYB蛋白表達(dá)上調(diào),因此蓖麻中的MYB轉(zhuǎn)錄因子可能是鹽脅迫耐受的重要調(diào)節(jié)因子(圖5).
2.6.2 熱脅迫下 MYB基因的轉(zhuǎn)錄組分析
根據(jù)蛋白表達(dá)熱圖結(jié)果,在熱脅迫下,19個(gè)MYB基因表達(dá)量下調(diào),13個(gè)MYB基因表達(dá)量上調(diào),其中4個(gè)MYB蛋白表達(dá)上調(diào)(29780.m1324、28582.m000318、29751.m001898和29780.m001368)具有相關(guān)性,這4個(gè)上調(diào)基因被聚類到一起,表明它們具有相似的表達(dá)模式,而3個(gè)MYB蛋白表達(dá)下調(diào)(29813.m001501、29950.m001149和30169.m006598)具有相似的表達(dá)模式,因此MYB基因在熱脅迫下對(duì)蓖麻的生長(zhǎng)有影響(圖11).

CK代表正常情況下的蓖麻,HS代表熱脅迫下的蓖麻,進(jìn)行了3次重復(fù)實(shí)驗(yàn);顏色鍵位于右上角,表示MYB基因表達(dá)情況圖6 MYB基因在熱脅迫和正常情況下的表達(dá)熱圖
MYB是目前研究植物中數(shù)量最多的轉(zhuǎn)錄因子家族之一,現(xiàn)已在多種植物中被鑒定出來(lái),例如:擬南芥、水稻、玉米和大豆[25].本研究在基因組水平上利用PlantTFbcat和BLAST在線軟件對(duì)蓖麻MYB轉(zhuǎn)錄因子進(jìn)行了鑒定和篩選.
本研究從蓖麻的基因組數(shù)據(jù)中共鑒定到32個(gè)MYB轉(zhuǎn)錄因子,在MEME分析中發(fā)現(xiàn)所有的MYB轉(zhuǎn)錄因子中都具有基序1和基序2結(jié)構(gòu),當(dāng)序列中只含有基序1和2時(shí)發(fā)現(xiàn)只有一個(gè)MYB結(jié)構(gòu)域,當(dāng)同時(shí)含有1、2和3時(shí)具有2個(gè)結(jié)構(gòu)域,說(shuō)明基序1和2是與1R-MYB亞基因家族的保守性相關(guān)的,也與2R-MYB亞基因家族的保守性有關(guān),基序3只與2R-MYB亞基因家族的保守性有關(guān),極有可能基序3就是蓖麻MYB轉(zhuǎn)錄因子中R3的保守結(jié)構(gòu)域,因此具有2個(gè)保守結(jié)構(gòu)域MYB轉(zhuǎn)錄因子可能是R2R3-MYB轉(zhuǎn)錄因子.此外,根據(jù)MYB轉(zhuǎn)錄因子理化性質(zhì)分析,MYB轉(zhuǎn)錄蛋白大多偏堿性,大部分是無(wú)規(guī)則卷曲和α螺旋.
蓖麻MYB蛋白進(jìn)化分析,蓖麻的MYB蛋白主要和擬南芥的MYB蛋白家族聚在2個(gè)大的分支上,因此蓖麻中MYB蛋白主要分為2個(gè)亞家族,值得注意的是,第一類亞家族中28582.m000317-30017.m317000蛋白(22個(gè))的功能可能是鹽脅迫耐受的重要調(diào)節(jié)因子;并且第一類亞家族的MYB蛋白具有2個(gè)保守結(jié)構(gòu)域,因此為R2R3-MYB結(jié)構(gòu)域,R2R3-MYB轉(zhuǎn)錄因子可能對(duì)藥用植物的次生代謝過(guò)程起到調(diào)控轉(zhuǎn)錄的作用.
鹽脅迫下蓖麻MYB蛋白的轉(zhuǎn)錄組分析,前人研究了不同的鹽反應(yīng)基因和組蛋白甲基化開(kāi)關(guān)位點(diǎn),并發(fā)現(xiàn)關(guān)鍵鹽反應(yīng)調(diào)控因子RADIALIS-LIKE SANT (RSM1)的轉(zhuǎn)錄可能受到雙價(jià)H3K4me3-H3K27me3修飾的調(diào)控[26],本研究蓖麻在鹽脅迫下大部分MYB蛋白表達(dá)上調(diào),因此蓖麻中的MYB轉(zhuǎn)錄因子可能是鹽脅迫耐受的重要調(diào)節(jié)因子;在熱脅迫處理下,前人研究針對(duì)熱脅迫下和恢復(fù)過(guò)程中蓖麻幼苗的脂質(zhì)組學(xué)和轉(zhuǎn)錄組學(xué)進(jìn)行了綜合分析,并鑒定了大量熱響應(yīng)脂質(zhì)分子和基因,發(fā)現(xiàn)三酰基甘油(TAGs)的合成可以顯著地被熱應(yīng)激誘導(dǎo)并儲(chǔ)存在細(xì)胞質(zhì)中,但在恢復(fù)過(guò)程中它們會(huì)減少[27],本文對(duì)其轉(zhuǎn)錄組公共數(shù)據(jù)再分析發(fā)現(xiàn),在熱脅迫下,13個(gè)MYB基因表達(dá)量上調(diào),其中4個(gè)MYB蛋白表達(dá)上調(diào)(29780.m1324、28582.m000318、29751.m001898和29780.m001368)具有相關(guān)性,這4個(gè)上調(diào)基因被聚類到一起,表明它們具有相似的表達(dá)模式,因此MYB基因在熱脅迫下對(duì)蓖麻的生長(zhǎng)有影響.
因此,通過(guò)對(duì)蓖麻不同逆境脅迫下的響應(yīng),MYB基因?qū)Ρ吐榈纳L(zhǎng)有調(diào)節(jié)作用.本研究首次系統(tǒng)的進(jìn)行蓖麻基因組和轉(zhuǎn)錄組的MYB基因挖掘,并且首次對(duì)蓖麻在干旱,冷脅迫下,鹽脅迫下和熱脅迫下MYB蛋白的表達(dá)量進(jìn)行轉(zhuǎn)錄組分析,為今后進(jìn)一步解析蓖麻MYB轉(zhuǎn)錄因子的結(jié)構(gòu)和功能奠定基礎(chǔ).