吳怡豪,諸葛君昊,張立華,周樂,杜盛楠,杜世平,蘇秀
( 1. 浙江農(nóng)林大學(xué) 林業(yè)與生物技術(shù)學(xué)院,浙江 杭州 311300;2. 泰順縣自然資源和規(guī)劃局,浙江 溫州 325500;3. 臨海市河頭鎮(zhèn)農(nóng)業(yè)綜合服務(wù)中心,浙江 臨海 317034 )
茶藨子葡萄座腔菌Botryosphaeriadothidea屬子囊菌門Ascomycota、座囊菌綱Dothideomycete、葡萄座腔菌目Botryosphaeriales、葡萄座腔菌科Botryosphaeriaceae、葡萄座腔菌屬Botryosphaeria真菌[1-2],其分布極為廣泛,可以侵染多種經(jīng)濟(jì)林、用材林、園林綠化林木,如蘋果Maluspumila、梨Pyrusp.、桃Prunuspersica、核桃Juglans regia、葡萄Vitisvinifera、楊Populussp.、桉Eucalyptussp.[3-10]等,導(dǎo)致嚴(yán)重的果實(shí)損失和生產(chǎn)減產(chǎn)。該菌可引起山核桃干腐病Macrophomacaryae,對山核桃Caryacathayensis的產(chǎn)量和品質(zhì)產(chǎn)生了顯著的負(fù)面影響[11]。因此,對于了解茶藨子葡萄座腔菌的致病機(jī)理以及篩選抗病品種的研究具有重要的實(shí)踐意義,可以為山核桃生產(chǎn)提供有力的支持,減少果實(shí)損失,維護(hù)生產(chǎn)穩(wěn)定性和生態(tài)平衡。
病原菌產(chǎn)生的分泌蛋白與寄主抗性基因的蛋白產(chǎn)物之間的分子互作是病原菌與寄主之間互作的核心[12-13],分泌蛋白在其中起著重要的作用。研究表明,黃曲霉Aspergillusflavus通過分泌一些細(xì)胞外酶和毒素來侵染寄主,這些酶可以破壞宿主細(xì)胞壁和木質(zhì)素,可以誘導(dǎo)宿主細(xì)胞凋亡和壞死,從而使得該菌對宿主的感染更加容易發(fā)生[14];果樹炭疽菌Colletotrichumgloeosporioides分泌的氧化還原酶可以降低植物的抗氧化能力,導(dǎo)致宿主細(xì)胞的損傷和死亡[15];稻瘟菌Magnaportheoryzae利用分泌外源蛋白,包括纖維素酶、蛋白酶和細(xì)胞壁水解酶等,破壞植物細(xì)胞壁和膜結(jié)構(gòu),從而增加了其侵染的能力。此外,該病原體還釋放毒素,如稻瘟菌素和谷氨酰胺酰胺酶,導(dǎo)致植物細(xì)胞的死亡和壞死[16]。分泌蛋白不僅對真菌自身的生長和代謝有重要的調(diào)節(jié)作用,還能夠通過對植物細(xì)胞的破壞、毒素的作用等方式,導(dǎo)致植物的損傷和病害發(fā)生。因此,研究茶藨子葡萄座腔菌分泌蛋白的功能和作用機(jī)制,對研究該病害的發(fā)病機(jī)理與防控具有重要意義和應(yīng)用價(jià)值。
茶藨子葡萄座腔菌全基因組測序數(shù)據(jù)的公開,為開展該菌分泌蛋白的研究提供了堅(jiān)實(shí)的基礎(chǔ)。本研究以山核桃茶藨子葡萄座腔菌BDLA16-7 的全基因組蛋白序列為基礎(chǔ),以經(jīng)典分泌蛋白特征為依據(jù),結(jié)合Augustus、SignalP、Funannotate、WoLF PSORT、Ensembl Fungi、GenomeTools 等網(wǎng)站和軟件,對BDLA16-7 的分泌蛋白組進(jìn)行了預(yù)測和功能分析,為進(jìn)一步深入研究該病原菌與寄主互作的分子機(jī)制提供了基礎(chǔ),并為挖掘病原菌關(guān)鍵致病基因提供依據(jù)。
山核桃茶藨子葡萄座腔菌BDLA16-7 是從浙江省杭州市臨安區(qū)的一棵患有潰瘍病的山核桃樹的樹干上分離出的山核桃茶藨子葡萄座腔菌菌株。最初,該真菌在馬鈴薯葡萄糖瓊脂培養(yǎng)基上的菌落呈淡白色,隨后逐漸轉(zhuǎn)變?yōu)楹谏W幽易鵳ycnidia通常是單獨(dú)存在的,呈灰黑色、球形,并被菌絲覆蓋。該菌株的基因組DNA 和mRNA是從培養(yǎng)了10 天的菌絲體中提取而得。山核桃茶藨子葡萄座腔菌BDLA16-7 全基因組蛋白質(zhì)氨基酸序列,來自中國生物信息中心(CNCB-NGDC 成員和合作伙伴2021)的基因組倉庫(GWH)(https://ngdc.cncb.ac.cn/gwh/),注冊號為GWHBEBO00000000,原始序列來自CNCBNGDC 的基因組序列檔案(https://ngdc.cncb.ac.cn/gsa/)上公開訪問,登錄號為CRA004612(生物項(xiàng)目PRJCA005744)[17]。
1.2.1 茶藨子葡萄座腔菌全基因組蛋白N-端信號肽預(yù)測 使用SignalP 5.0 在線工具(https://services.healthtech.dtu.dk/services/SignalP-5.0/)和Phobius (https://phobius.sbc.su.se/)來預(yù)測基因組編碼的所有蛋白質(zhì)是否帶有N-端信號肽[18]。
1.2.2 茶藨子葡萄座腔菌蛋白的亞細(xì)胞定位 使用蛋白亞細(xì)胞定位在線預(yù)測軟件Cell-PLoc 2.0[19](http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)來確定帶有N-端信號肽的蛋白質(zhì)的亞細(xì)胞定位。
1.2.3 茶藨子葡萄座腔菌分泌型蛋白的跨膜結(jié)構(gòu)預(yù)測 使用蛋白跨膜結(jié)構(gòu)預(yù)測軟件TMHMM[20](https://dtu.biolib.com/DeepTMHMM),對全蛋白序列中具有信號肽且主要定位于細(xì)胞外的蛋白進(jìn)行是否含有跨膜結(jié)構(gòu)預(yù)測。
1.2.4 茶藨子葡萄座腔菌分泌型蛋白的錨定位點(diǎn)預(yù)測 使用GPI 錨定位點(diǎn)預(yù)測軟件GPI-SOM(http://gpi. unibe.ch)[21],對全蛋白序列中具有信號肽、主要定位于細(xì)胞外且不包含跨膜結(jié)構(gòu)域的蛋白序列進(jìn)行GPI 錨定位點(diǎn)的預(yù)測。
1.2.5 分泌蛋白中效應(yīng)蛋白的預(yù)測和功能分析 使用EffectorP3.0(http://effectorp.csiro.au)[22]軟件對全蛋白序列中具有信號肽、主要定位于細(xì)胞外、不包含跨膜結(jié)構(gòu)域且不包含GPI 錨定位點(diǎn)的蛋白序列進(jìn)行效應(yīng)蛋白的預(yù)測。同時(shí),通過eggnog-mapper[23]數(shù)據(jù)庫和Pathogen Host Interactions[24]數(shù)據(jù)庫對預(yù)測出的效應(yīng)蛋白的組成和功能進(jìn)行分析。
1.2.6 分泌蛋白中碳水化合物活性酶類預(yù)測和功能分析 使用CAZymes 在線預(yù)測工具dbcan[25](http://bcb.unl.edu/dbCAN2/)中的HMMER、DIAMOND 和HOTPEP 程序,對分泌蛋白中的碳水化合物活性酶進(jìn)行預(yù)測和功能注釋。
BDLA16-7 基因組編號為GWHPBEBO000001 到GWHPBEBO013130,總共編碼了13 130 條蛋白質(zhì)序列。通過使用SignalP 5.0 和Phobius 軟件進(jìn)行分析,結(jié)果表明其中含有N-端信號肽序列的有1 402 條蛋白質(zhì)序列,占總蛋白質(zhì)序列數(shù)量的10.67%。這些具有N-端信號肽序列的蛋白質(zhì)全部屬于標(biāo)準(zhǔn)的Sec/SPI 型分泌蛋白質(zhì),它們會在信號肽序列的引導(dǎo)下進(jìn)入細(xì)胞的內(nèi)質(zhì)網(wǎng)腔中。
在BDLA16-7 全基因蛋白序列中,將含有信號肽的1 402 條蛋白序列經(jīng)Cell-PLoc 2.0 軟件分析發(fā)現(xiàn),其中有1 188 條蛋白序列屬于胞外分泌型,而其余214 條序列雖然具有信號肽,但其并不分泌到細(xì)胞外,而是轉(zhuǎn)運(yùn)到了細(xì)胞中不同的細(xì)胞器或質(zhì)膜上。
在BDLA16-7 全基因蛋白序列中,有一些蛋白具有信號肽序列,并且屬于胞外分泌型。經(jīng)過跨膜結(jié)構(gòu)域預(yù)測軟件TMHMM 分析,發(fā)現(xiàn)1 188 條胞外分泌型蛋白序列中,有97 條蛋白序列具有跨膜區(qū)。因此,這些序列有可能是離子通道蛋白、膜錨定蛋白或膜受體蛋白,而無法分泌到細(xì)胞膜外。除此之外的1 091 條蛋白序列沒有跨膜結(jié)構(gòu)域,具有典型的分泌蛋白特征。
在BDLA16-7 全基因蛋白序列中,有一些蛋白具有信號肽序列,屬于胞外分泌型蛋白,并且沒有跨膜結(jié)構(gòu)域。經(jīng)過GPI-SOM 軟件預(yù)測,發(fā)現(xiàn)1 091 條蛋白序列中有193 條含有GPI 錨定位點(diǎn),不符合經(jīng)典的分泌型蛋白特征,因此將其去除。除此之外,有898 條分泌型蛋白序列不含GPI 錨定位點(diǎn),符合經(jīng)典的分泌蛋白特征,因此將其認(rèn)定為BDLA16-7 的分泌蛋白組(表1)。
2.5.1 山核桃茶藨子葡萄座腔菌分泌蛋白組的氨基酸長度分析 對BDLA16-7 分泌蛋白組的序列長度進(jìn)行分析,發(fā)現(xiàn)分泌蛋白的長度分布跨度較大。其中,存在長度小于100 個(gè)氨基酸的小分子蛋白,最短的為66 個(gè)氨基酸;同時(shí)也存在長度超過1 000 個(gè)氨基酸的大分子蛋白,最長的蛋白為2 028 個(gè)氨基酸。分泌蛋白的氨基酸長度主要分布在100~600 個(gè)氨基酸范圍內(nèi),共有721 條序列,占分泌蛋白序列總數(shù)的80.29%(圖1)。

圖1 山核桃茶 藨子葡萄座腔菌分泌蛋白質(zhì)組的長度分布Fig. 1 Length distribution of secretory proteome of B. dothidea
2.5.2 山核桃茶藨子葡萄座腔菌分泌蛋白組的氨基酸組成分析 在BDLA16-7 分泌蛋白組的氨基酸組成分析中,發(fā)現(xiàn)不同的氨基酸含量有顯著差異,按照含量從高到低的順序排列如下:A 丙氨酸、G 甘氨酸、S 絲氨酸、L 亮氨酸、T 蘇氨酸、V 纈氨酸、P 脯氨酸、D 天冬氨酸、N 天冬酰胺、E 谷氨酸、I 異亮氨酸、F 苯丙氨酸、Y 酪氨酸、Q 谷氨酰胺、R 精氨酸、K 賴氨酸、W 色氨酸、H 組氨酸、C 半胱氨酸、M 蛋氨酸,氨基酸可以被分為不同的類別。其中,非極性疏水氨基酸(A、G、L、V、P 和I)的含量最高,占總含量的43.6%,顯示出明顯的優(yōu)勢,親水的極性氨基酸(S、T、N、Q、M 和C)的含量相對較低,為27.7%;酸性氨基酸(A 和E)的含量為14.8%,堿性氨基酸(K、R、H)的含量為8.7%,芳香族氨基酸(F、Y 和W)的含量為9.7%(圖2)。

圖2 山核桃茶藨子葡萄座腔菌分泌蛋白質(zhì)組中氨基酸組成比例Fig. 2 Composition of amino acids of secretory proteome of B. dothidea
2.5.3 山核桃茶藨子葡萄座腔菌分泌蛋白組信號肽的氨基酸長度分析 BDLA16-7 分泌蛋白組中的信號肽序列具有不同的氨基酸長度,這個(gè)長度范圍從14 到41 個(gè)氨基酸。在這些信號肽序列中,長度為16 到24 個(gè)氨基酸的序列最為常見,總共有806 個(gè),占了分泌蛋白組總數(shù)的89.76%。其中,信號肽長度為19 個(gè)氨基酸的序列最多,共有169 個(gè),占了分泌蛋白組總數(shù)的18.82%。其次,長度為18 個(gè)氨基酸的信號肽序列有132 個(gè),占了分泌蛋白組總數(shù)的14.70%。相反,信號肽長度為31、35、39 和41 個(gè)氨基酸的序列最為罕見,每個(gè)長度僅有1 個(gè)序列(圖3)。

圖3 山核桃茶藨子葡萄座腔菌分泌蛋白質(zhì)組信號肽長度分布Fig. 3 Length distribution of signal peptides of secretory proteome B. dothidea
2.5.4 山核桃茶藨子葡萄座腔菌分泌蛋白組信號肽的氨基酸組成分析 根據(jù)對BDLA16-7 分泌蛋白組信號肽的氨基酸組成進(jìn)行的分析,發(fā)現(xiàn)20 種氨基酸在信號肽中的出現(xiàn)頻率存在顯著差異,按頻率從高到低排列如下:A、L、S、V、T、M、F、I、G、P、R、K、Q、H、C、N、Y、W、D 和E。其中,非極性氨基酸丙氨酸(A)的出現(xiàn)頻率最高,占總出現(xiàn)頻率的22.40%,亮氨酸(L)的出現(xiàn)頻率次之,為19.29%。相反地,天冬氨酸(D)和酸性氨基酸谷氨酸(E)的出現(xiàn)頻率最低,分別僅為0.29%和0.27%(圖4)。

圖4 山核桃茶藨子葡萄座腔菌分泌蛋白質(zhì)組信號肽中氨基酸組成比例Fig. 4 Composition of amino acids of signal peptides of secretory proteome in B. dothidea
2.5.5 山核桃茶藨子葡萄座腔菌分泌蛋白組信號肽切割位點(diǎn)分析 通過對BDLA16-7 分泌蛋白組信號肽的切割位點(diǎn)(-3 到+2 位點(diǎn))進(jìn)行統(tǒng)計(jì)分析,得到以下結(jié)果:在-3、-2、-1、+1 和+2 位點(diǎn)出現(xiàn)頻率最高的氨基酸分別為A、S、A、A 和P,它們分別占據(jù)了50.56%、18.93%、81.74%、25.61%和37.08%的比例。具體來說:在-3 位點(diǎn),除了A 之外,V(24.28%)和S(8.91%)也比較常見,而E、F、H、K、M、N、W 和Y 沒有被使用。在-1 位點(diǎn),除了A 之外,G(8.24%)和S(5.90%)也相對常見,而D、E、H、I、L、M、N、V、W 和Y 沒有出現(xiàn)。在-2、+1 和+2 位點(diǎn),所有的氨基酸都被使用。這些結(jié)果表明,在BDLA16-7 分泌蛋白組信號肽中,切割位點(diǎn)-3 和-1 位置上的氨基酸相對來說比較保守,可能在信號肽酶的識別過程中起到關(guān)鍵作用。其他位點(diǎn)則更加多樣化,容納了各種不同的氨基酸(表2)。

表2 信號肽酶切割位點(diǎn)周圍20 個(gè)氨基酸殘基的頻率Tab. 2 The frequency of 20 amino acid residues around the signal peptidase cleavage sites
2.5.6 山核桃茶藨子葡萄座腔菌分泌蛋白組的功能注釋
通過使用eggnog-mapper 數(shù)據(jù)庫、PHI 數(shù)據(jù)庫和Geneious Prim Trial 數(shù)據(jù)庫對BDLA16-7 分泌蛋白組的898條序列進(jìn)行功能分析。結(jié)果表明,共有600 條序列可以被注釋到具有完整功能。通過COG(Clusters of Orthologous Genes)數(shù)據(jù)庫對這些功能進(jìn)行分類,發(fā)現(xiàn)最多的分泌蛋白被歸類為G 類,即碳水化合物的運(yùn)輸和代謝(Carbohydrate transport and metabolism),總共有229 條序列歸入這一類別。其次是S 類,即功能未知類(Function unknown),其中包括一些蛋白的結(jié)構(gòu)域和功能未知的蛋白,如酪氨酸酶中心結(jié)構(gòu)域(Comon central domain of tyrosinase)、泛素3 綁定蛋白But2 的C-端結(jié)構(gòu)域(Ubiquitin 3 binding protein But2 C-terminal domain)、DUF3129和DUF3455 等,總共有152 條序列歸入這一類別。其他類別:O 類蛋白翻譯后修飾和分子伴侶(Post-translational modification, protein turnover, chaperones)86 條序列,E 類氨基酸運(yùn)輸和代謝相關(guān)(Amino acid transport and metabolism)44 條序列,C 類能量產(chǎn)生和轉(zhuǎn)化相關(guān)(Energy production and conversion)24 條序列,以及Q 類次生代謝物的生物合成、轉(zhuǎn)運(yùn)和分解相關(guān)(Secondary metabolites biosynthesis transport and catabolism)23 條序列。其余的功能分類包含的分泌蛋白數(shù)目較少,沒有超過10 個(gè)。這些分析結(jié)果揭示了BDLA16-7 分泌蛋白組的功能多樣性,其中大部分分泌蛋白與碳水化合物代謝相關(guān),但也包含一些功能未知的蛋白以及其他生物學(xué)功能。這種功能分類有助于理解這些蛋白在生物體內(nèi)的作用和生物過程中的角色(圖5)。

圖5 山核桃茶 藨子葡萄座腔菌分泌蛋白質(zhì)組的COG 目錄Fig. 5 COG catalog of the secretory proteome of B. dothidea
BDLA16-7 分泌蛋白組經(jīng)TargetP 2.0 Server 軟件分析,再次確認(rèn)898 條蛋白序列全部含有信號肽,并可以分泌到細(xì)胞外。繼而通過效應(yīng)蛋白預(yù)測軟件EffectorP 3.0 對潛在的效應(yīng)蛋白進(jìn)行預(yù)測,結(jié)果發(fā)現(xiàn)271 條蛋白序列可被預(yù)測為效應(yīng)蛋白,占分泌蛋白總數(shù)的30.18%。其中101 條序列可以被eggnog-map 數(shù)據(jù)庫注釋到具體的功能,其中42 條序列在COG 分類中屬于S 類,主要包括蛋白結(jié)構(gòu)域和功能未知的蛋白,如:IgE 綁定蛋白(Ig Ebinding protein)、Cupin 家族蛋白、成束蛋白結(jié)構(gòu)域(Fasciclin-domain)、CFEM 結(jié)構(gòu)域(CFEM-domain)等,41 條序列屬G 類,14 條序列屬于O 類,2 條序列屬于C 類,1 條序列屬于A 類RNA 加工和修飾相關(guān)(RNA processing and modification),1 條序列屬于E 類(圖6)。

圖6 山核桃茶藨子葡萄座腔菌的效應(yīng)蛋白質(zhì)組COG 目錄Fig. 6 COG catalog of the effector proteome of B. dothidea
對預(yù)測為潛在效應(yīng)蛋白的271 條序列,經(jīng)PHI 數(shù)據(jù)庫Blastp 比對,有14 條序列可以比對到相應(yīng)的致病功能注釋。其中 1 條序列(GWHPBEBO006248)可以比對到黃曲霉的致病效應(yīng)蛋白序列,1 條蛋白序列(GWHPBEBO004805)可以比對到禾谷鐮刀菌Fusariumgraminearum和黃單胞菌Xanthomonasaxonopodis的致病效應(yīng)蛋白序列,1 條蛋白序列(GWHPBEBO011899 和GWHPBEBO003128)可以比對到寄生疫霉Phytophthora parasitica的致病效應(yīng)蛋白序列,1 條蛋白序列(GWHPBEBO008334)可以比對到稻瘟菌的致病效應(yīng)蛋白序列,2 條序列(GWHPBEBO008083 和GWHPBEBO000994)可以比對到禾谷鐮刀菌的致病效應(yīng)蛋白序列,2 條蛋白序列(GWHPBEBO006043 和GWHPBEBO006222)可以比對到擴(kuò)展青霉Penicilliumexpansum的致病效應(yīng)蛋白序列,5 條蛋白序列(GWHPBEBO010105、GWHPBEBO006002、GWHPBEBO003061、GWHPBEBO003727 和GWHPBEBO001912)與褐腐菌Moniliniafructicola致病性增強(qiáng)的效應(yīng)蛋白序列有較高的相似性,其同時(shí)也與柑橘褐斑菌Alternariaalternata的致病效應(yīng)蛋白序列存在較高的相似性。
碳水化合物活性酶類(CAZymes)是病原菌分泌蛋白組的重要組成部分,其主要參與對寄主細(xì)胞壁的降解作用,與病原菌的致病性有緊密的聯(lián)系。利用HMMER、DIAMOND 和HOTPEP 三個(gè)軟件,在BDLA16-7 分泌蛋白組898 條蛋白序列,共預(yù)測到293 個(gè)分泌蛋白屬于CAZymes 酶類,分屬于糖苷水解酶(Glycoside Hydrolases,GHs)、氧化還原酶(Auxiliary Activities, AAs)、糖酯酶(Carbohydrate Esterases, CEs)和多糖裂解酶(Polysaccharide Lyases, PLs)四個(gè)分類,占總分泌蛋白數(shù)的32.26%。其中基于序列相似性的HMMER 軟件預(yù)測發(fā)現(xiàn)282 個(gè)分泌蛋白屬于CAZymes,基于結(jié)構(gòu)域的DIAMOND 和HOTPEP 軟件分別預(yù)測到了188 個(gè)和275個(gè)分泌蛋白屬于CAZymes。三個(gè)軟件都預(yù)測到CAZymes 的數(shù)量為169 個(gè)(圖7)。

圖7 Hmmer Diamond 和Hotpep 對山核桃茶藨子葡萄座腔菌分泌蛋白質(zhì)組碳水化合物酶類預(yù)測結(jié)果Fig. 7 CAZymes prediction on secretory proteome of B. dothidea by Hmmer diamond and Hotpep
在預(yù)測到的169 個(gè)CAZymes 中,GHs 數(shù)量最多為99 個(gè),主要包括GH3、GH28、GH92、GH1 和GH31 等多個(gè)亞家族;其次為AAs,有42 個(gè),主要包括AA3_2、AA1_3、AA3 和AA9 等亞家族;CBMs 為12 個(gè),主要包括CBM1、CBM35 和CBM18 等亞家族;PLs 為9 個(gè),包括PL1_4、PL3_2 等亞家族;CEs 為6 個(gè),包括CE0、CE1、CE16、CE4 和CE8 亞家族;CTs 的數(shù)量最少,為1 個(gè),屬于GT32 亞家族(圖8)。

圖8 山核桃茶藨子葡萄座腔菌分泌蛋白質(zhì)組碳水化合物酶類亞家族分布預(yù)測Fig. 8 Prediction of distribution of carbohydrate enzyme subfamily in secretory proteome of B. dothidea
在BDLA16-7 分泌蛋白組的169 個(gè)CAZymes 中,參與寄主細(xì)胞壁纖維素、木聚糖和果膠降解的CAZymes數(shù)量有85 個(gè),而在絲孢堆黑粉菌Sporisoriumreilianum、玉蜀黍黑粉菌Ustilagomaydis、水稻稻瘟病病菌Magnaporthegrisea、禾谷鐮刀菌、灰葡萄孢Botrytiscinerea、大麗輪枝菌Verticilliumdahliae分別有26、30、128、127、87、165 個(gè)(表3)[32]。

表3 不同營養(yǎng)類型真菌參與寄主細(xì)胞壁纖維素、木聚糖和果膠降解的CAZymes 數(shù)量Tab. 3 The number of CAZymes involved in the degradation of host cell wall cellulose, xylan and pectin by different trophic fungi
病原真菌分泌蛋白的預(yù)測最為重要的是對信號肽進(jìn)行預(yù)測。為了提高信號肽預(yù)測的準(zhǔn)確性,本文通過SignalP 和Phobius 相結(jié)合的方法,排除了與信號肽具有相似結(jié)構(gòu)導(dǎo)肽(transit peptide)的影響,保證了含有信號肽分泌蛋白預(yù)測的準(zhǔn)確性。通過Cell-PLoc 2.0、TMHMM、GPI-SOM、EffectorP3.0、dbcan 等軟件的分析,本文成功預(yù)測了山核桃茶藨子葡萄座腔菌BDLA16-7 分泌蛋白組898 條蛋白序列,占其蛋白序列總條數(shù)的6.84%;與尖孢鐮刀菌Fusariumoxysporum(7.5%)[26]、假禾谷鐮孢菌Fusariumpseudograminearum(5.5%)[27]、新月彎孢菌Curvularialunata(7.7%)[28]、禾谷炭疽菌Colletotrichumgraminicola(5.2%)[29]分泌蛋白在全基因組蛋白序列中所占的比例相似。
分析BDLA16-7 分泌蛋白組的氨基酸構(gòu)成顯示,非極性疏水氨基酸(包括A、G、L、V、P 和I)的含量為43.6%,明顯高于親水極性氨基酸(S、T、N、Q、M 和C)的含量(27.7%)。這表明,分泌蛋白通常需要在其折疊和穩(wěn)定化過程中形成一個(gè)疏水核心結(jié)構(gòu)。這個(gè)核心結(jié)構(gòu)有助于保護(hù)蛋白質(zhì)免受水分子和其他極性分子的干擾,同時(shí)有助于維持蛋白質(zhì)的結(jié)構(gòu)完整性,從而使其能夠正確履行其功能。特別值得注意的是,信號肽長度為19 個(gè)氨基酸的分泌蛋白數(shù)量最多,這可能意味著這個(gè)長度的信號肽對于茶藨子葡萄座腔菌分泌蛋白質(zhì)的正確轉(zhuǎn)運(yùn)和定位至關(guān)重要。這也可能是生物進(jìn)化過程中的結(jié)果,即這個(gè)長度的信號肽的功能在生物進(jìn)化中被保留下來并廣泛應(yīng)用。需要強(qiáng)調(diào)的是,這個(gè)結(jié)論是基于統(tǒng)計(jì)學(xué)推斷的,不一定適用于所有分泌蛋白。此外,需要進(jìn)一步的研究來驗(yàn)證這一結(jié)論,并探索不同長度信號肽的功能和進(jìn)化意義。對于BDLA16-7 分泌蛋白組的信號肽氨基酸構(gòu)成,發(fā)現(xiàn)20 種氨基酸在信號肽中的出現(xiàn)頻率存在較大差異。前六位出現(xiàn)頻率最高的氨基酸均為脂肪族氨基酸,這可能與信號肽需要穿越細(xì)胞質(zhì)膜有關(guān)。此外,分泌蛋白組的信號肽切割位點(diǎn)在-3 和-1 位置的氨基酸相對保守,其氨基酸組成為A-S-A,屬于A-X-A 型,這是真核生物中相對典型的信號肽切割位點(diǎn),可被SpaseI 型信號肽酶所識別。
效應(yīng)蛋白(effector)是一種在植物病原微生物中廣泛存在的重要致病因子,它們通過干擾寄主植物的免疫反應(yīng)來感染宿主[30]。因此,效應(yīng)蛋白既是病原微生物致病的關(guān)鍵分子,也是用于篩選植物抗病性基因的重要工具[31]。研究表明,在對葡萄座腔菌效應(yīng)蛋白預(yù)測中,預(yù)測為潛在效應(yīng)蛋白的119 條序列,有11 條序列可以比對到相應(yīng)的致病功能注釋[32]。當(dāng)在對BDLA16-7 分泌蛋白組效應(yīng)蛋白的預(yù)測中,我們發(fā)現(xiàn)271 條序列(30.18%)符合效應(yīng)蛋白的定義,其中101 條序列可以被eggnog-map 數(shù)據(jù)庫注釋到具體的功能,經(jīng)PHI 數(shù)據(jù)庫Blastp 比對,有14 條序列可以與黃曲霉、禾谷鐮刀菌、黃單胞菌、寄生疫霉、稻瘟菌、擴(kuò)展青霉、褐腐菌、柑橘褐斑菌比對到相應(yīng)的致病功能注釋,其中5 條蛋白序列與褐腐菌M.fructicola致病性增強(qiáng)的效應(yīng)蛋白序列有較高的相似性,但其同時(shí)也與柑橘褐斑菌A.alternata致病性降低的致病效應(yīng)蛋白序列存在較高的相似性。相比較而言,我們研究比對的潛在效應(yīng)蛋白序列更多(271 條),這意味著它在研究潛在效應(yīng)蛋白與致病菌之間的關(guān)系時(shí)有更多的數(shù)據(jù)支持,可以提供更全面的信息;比對到的致病菌種類更多,從細(xì)菌到真菌,從黃曲霉到寄生疫霉等,這增加了研究的多樣性和廣泛性。但目前尚不清楚這些潛在的效應(yīng)蛋白如何具體影響茶藨子葡萄座腔菌的致病性,需要進(jìn)一步通過實(shí)驗(yàn)手段來驗(yàn)證和研究其功能。
CAZymes(碳水化合物活性酶類)在真菌中指的是一組各種酶類,參與碳水化合物的分解和代謝,這些酶在生物質(zhì)降解、病原菌感染宿主、形態(tài)變化、寄生植物侵染以及真菌與寄主的相互作用等方面發(fā)揮著作用[33]。為了準(zhǔn)確預(yù)測BDLA16-7 中的CAZymes 數(shù)量,我們使用了三種不同的軟件,包括Diamond、Hmmer 和Hotpep,通過對這三種軟件的預(yù)測結(jié)果求交集的方法來進(jìn)行預(yù)測。在眾多CAZymes 中,特別是在直接參與植物細(xì)胞壁成分降解的GH、AA、PL 和CE 亞家族中,這些酶發(fā)揮著關(guān)鍵作用[34]。在三種軟件都預(yù)測到的169 個(gè)CAZymes中,GHs 數(shù)量最多,共有99 個(gè),這些亞家族主要負(fù)責(zé)果膠和纖維素的降解。此外,BDLA16-7 的CAZymes 中還包括大量的輔酶模塊,其中AAs 有42 個(gè),PLs 有9 個(gè),CEs 有6 個(gè),這進(jìn)一步增強(qiáng)了茶藨子葡萄座腔菌對細(xì)胞壁的降解能力,有助于病原菌成功侵染寄主植物。許多研究表明,植物病原真菌分泌的CAZymes 與其寄生性之間存在一定的相關(guān)性[35]。通常認(rèn)為,寄生性更強(qiáng)的植物病原真菌編碼的胞外CAZymes 數(shù)量較少[36]。通過比較不同營養(yǎng)型真菌的CAZymes 數(shù)量,本研究發(fā)現(xiàn),半活體營養(yǎng)型的茶藨子葡萄座腔菌中,參與寄主細(xì)胞壁纖維素、木聚糖和果膠降解的CAZymes 數(shù)量與活體營養(yǎng)型真菌相比顯著增加,但與死體營養(yǎng)型真菌相比,CAZymes數(shù)量基本相同或更少。這一研究結(jié)果與對終極腐霉Pythiumultimum[37]、穎枯殼多孢Stagonosporanodorum[38]、大麗輪枝菌[39]等非活體營養(yǎng)型病原菌CAZymes 數(shù)量的研究結(jié)果相一致。
本文以山核桃茶藨子葡萄座腔菌BDLA16-7 全基因組蛋白序列為基礎(chǔ),采用生物信息學(xué)的方法,對BDLA16-7 分泌蛋白組進(jìn)行了預(yù)測,明確了BDLA16-7 分泌蛋白的長度分布特征,功能分類、信號肽切割位點(diǎn)的氨基酸組成、切割位點(diǎn)的類型和CAZymes 數(shù)目,以及CAZymes 中纖維素酶、果膠酶、木聚糖酶的亞家族組成,并篩選到14 個(gè)GWHPBEBO0(06248、04805、11899、03128、08334、08083、00994、06043、06222、10105、06002、03061、03727、01912)與致病性緊密聯(lián)系的潛在效應(yīng)蛋白,為從分子水平上解析茶藨子葡萄座腔菌的致病機(jī)理奠定了基礎(chǔ)。