覃 悅,韓長志
(1. 西南林業大學生物多樣性保護學院,昆明 650224; 2. 西南林業大學研究生院,昆明 650224; 3. 云南省森林災害預警與控制重點實驗室,昆明 650224)
受體介導的內吞作用(receptor-mediated endocytosis)是生物體中大多數細胞實現物質內吞的重要途徑之一[1-2],該作用是由直徑約100 nm小泡產生介導的,小泡具有由胞漿蛋白網格蛋白組成的形態特征性被膜[3]。在模式生物真菌研究中,內吞與其細胞的生長、發育以及分化等各個過程密切相關。前人研究表明,模式真菌(釀酒酵母、構巢曲霉等)中含有NPFxD基序的蛋白參與內吞靶向信號過程,該信號在實現含有特征化弗林蛋白酶樣蛋白酶Kex2p胞質結構域的嵌合蛋白過程發揮重要作用[4]。同時,真菌的包被網格蛋白囊泡(CCV)廣泛存在于細胞中,并形成質膜的區域,該區域可濃縮具有不同受體的大細胞外分子,不同受體則負責配體的低密度脂蛋白、生長因子、轉鐵蛋白和抗體等受體介導的內吞作用[5],并通過CCV攝取的蛋白質通常具有內吞靶向信號,可直接摻入新囊泡中[6]。

表 1 禾谷炭疽菌中NPFxD基序蛋白的基本信息及獲取方法Table1 Basic information and method of obtaining NPFxD motif protein in C. graminicola
禾谷炭疽菌Colletotrichumgraminicola(Cesati)Wilson是一種半活體營養病原菌,主要危害玉米、小麥等農作物[7-9],也可定殖并感染藍草、黑麥草和羊茅等禾本科植物上,嚴重危害著禾本科作物的健康生產,影響農業經濟的發展。隨著該菌全基因組序列的釋放[10],前人對其分泌蛋白、G蛋白信號通路蛋白、MAPK(絲裂原活化蛋白激酶)途徑蛋白[11]、RGS(G蛋白信號轉導調節蛋白)[12]等進行了預測及生物信息學分析,為進一步明確上述蛋白在該病菌致病過程中的功能解析奠定了理論基礎。然而,尚未見有關禾谷炭疽菌中存在具有NPFxD基序的蛋白情況及其生物信息學分析的研究報道,嚴重制約著植物病原絲狀真菌中內吞相關蛋白的功能研究。
因此,基于前人報道,現利用模式生物構巢曲霉Aspergillusnidulans中具有NPFxD基序的蛋白氨基酸序列[13],通過在禾谷炭疽菌蛋白質數據庫中進行Blastp比對分析,同時,利用關鍵詞在美國國家生物信息中心(NCBI)數據庫中進行搜索,明確C.graminicola中NPFxD基序蛋白序列,并對上述序列開展跨膜結構、理化性質、疏水性、二級結構以及信號肽、亞細胞定位等生物信息學分析,以及結合其他植物病原絲狀真菌中的NPFxD基序蛋白同源的氨基酸序列,開展遺傳關系分析,為進一步開展同屬于炭疽菌屬但其基因組序列尚未公布的核桃炭疽病菌相關內吞蛋白研究提供重要的理論指導。
通過NCBI數據庫下載禾谷炭疽菌的蛋白質序列,利用EMBOSS fuzzpro[14]預測程序獲取該菌中具有NPFxD保守基序的蛋白質序列,同時,利用“NPFxD”“NPFxD-mediated endocytosis”等關鍵詞對禾谷炭疽菌蛋白數據庫進行搜索,此外,以A.nidulans中具有NPFxD基序的蛋白序列[13]為基礎,進行Blastp比對分析,對上述所獲得序列進行匯總、去重,最終明確禾谷炭疽菌中NPFxD基序蛋白以及相關信息(圖 1)。

圖 1 禾谷炭疽菌NPFxD基序蛋白獲取方法Fig.1 Method for obtaining NPFxD motif protein in C. graminicola
1.2.1 跨膜預測
利用在線跨膜區結構預測網站HMMTOP version 2.0[15]和TMHMM Server v. 2.0[16]對NPFxD基序蛋白進行預測。
1.2.2 保守結構域預測
利用在線保守結構域特征分析軟件SMART[17]對NPFxD基序蛋白進行預測。
1.2.3 亞細胞定位分析
利用亞細胞定位分析軟件ProtComp v9.0[18]對NPFxD基序蛋白進行預測,并繪制定位情況。
1.2.4 理化性質分析
利用理化性質測定程序Protscale[19]對NPFxD基序蛋白進行預測。
1.2.5 轉運肽及信號肽預測
利用蛋白質轉運肽分析軟件TargetP 1.1 Server[20]對NPFxD基序蛋白進行預測;同時,利用蛋白質信號肽軟件SignalP 5.0 Server[16]對NPFxD基序蛋白進行預測。
1.2.6 二級結構預測
采用蛋白質二級結構分析軟件PHD[21]對NPFxD基序蛋白進行預測。
1.2.7 遺傳關系進化樹構建
在NCBI中在線進行Blastp同源搜索獲取同源序列,并利用ClustalX[22]和MEGA X軟件[23]分別對其進行多重比對分析以及構建遺傳關系進化樹。
前人對構巢曲霉開展了NPFxD基序蛋白的搜索工作[24],利用EMBOSS fuzzpro軟件對禾谷炭疽菌全部蛋白質序列進行掃描分析,結果獲得了33條含有NPFxD基序的蛋白序列,同時,利用“NPFxD-mediated endocytosis”以及“NPFxD”等關鍵詞進行搜索,未獲得相關序列,此外,進一步利用Blastp比對分析,獲得了621條同源序列(結果未顯示),對上述蛋白序列進行對比篩選、去除重復,結果表明,與A.nidulans同源的C.graminicola中含有NPFxD基序蛋白質序列共6條,其蛋白ID分別為GLRG_06102、GLRG_02949、GLRG_02326、GLRG_07742、GLRG_06797、GLRG_08762,根據同源關系,將上述所獲得的的NPFxD蛋白分別命名為CgTPO1、CgMYO2、CgCRN3、CgNPF4、CgGBP5、CgTRM6(表 1)。
基于TMHMM跨膜結構域軟件分析,上述6個蛋白均不具有跨膜結構域;同時,進一步利用HMMTOP跨膜結構域軟件進行預測,結果表明,除CgNPF4、CgGBP5未發現明顯的跨膜結構域外,其他NPFxD基序蛋白均具有跨膜結構域(表 2)。同時,利用SMART在線預測禾谷炭疽菌中6個NPFxD基序蛋白的保守結構域,結果表明,上述NPFxD基序蛋白序列具有Inositol_P、MYSc、DUF100以及RRM、Methyltransf_4等保守結構域,然而,并未存在同種保守結構域(圖 2),推測上述不同類型保守結構域在實現禾谷炭疽菌內吞作用過程中發揮著其他特殊作用。

表 2 跨膜情況預測Table2 Prediction of transmembrane
結合S.cerevisiae、P.oryzae以及其他模式生物,特別是參考SNARE蛋白家族、Rab蛋白家族以及Dynamin家族蛋白等有關植物絲狀真菌內吞信號的一般途徑,結合跨膜結構域分析,繪制出C.graminicola中所含的NPFxD亞細胞定位情況(圖 3)。

圖 2 保守結構域分析Fig.2 Analysis of conserved domains

Yup1、MoVam7、MoSyn8、FgRab51、FgRab52、FgRab7、MoRab7、MoDNM2、MoDNM3、Vps3、Vps8、FgVps39、FgVps41、MoNOX1、MoNOX2分別為 真菌Ustilago maydis、Pyricularia oryzae、P. oryzae、F.graminearum、P. oryzae、Aspergillus nidulans、F.graminearum、P. oryzae中已經報道的蛋白圖 3 亞細胞定位分析Fig.3 Subcellular localization
對禾谷炭疽菌中的6個NPFxD基序蛋白開展氨基酸殘基組成情況分析,結果表明,CgTPO1、CgGBP5中所含有的G(甘氨酸)氨基酸殘基所占比例較高,分別為11.10%、22.20%;而CgMYO2、CgCRN3、CgNPF4、CgTRM6中含有的A(丙氨酸)氨基酸殘基所占比例較高,分別為9.00%、11.40%、11.10%以及9.40%(表 3);同時,對上述蛋白中含有較低比例的氨基酸殘基進行分析,結果發現,在CgTPO1蛋白中所含有的H(組氨酸)最低,所占比例為1.00%,在CgTRM6蛋白中所含有的W(色氨酸)最低,所占比例為1.00%,在CgMYO2、CgCRN3、CgNPF4、CgGBP5蛋白中所含有的C(半胱氨酸),所占比例分別為0.60%、0.30%、1.40%和0.20%(表 3)。
進一步對上述NPFxD基序蛋白開展理化性質分析,結果表明,在分子式、相對分子質量、理論等電點、正負電荷殘基數以及原子總數、脂肪族氨基酸指數等理化性質方面均存在著較大的不同,盡管如此,上述NPFxD基序蛋白總平均親水性為親水性蛋白,半衰期均為30h,同時,上述蛋白穩定性不盡相同,其中,CgTPO1、CgNPF4和CgGBP5蛋白屬于不穩定蛋白,其余2個蛋白則屬于穩定性蛋白(表 4)。

表 3 氨基酸殘基組成情況Table3 Amino acid residues composition
為了進一步明確上述6個NPFxD基序蛋白中氨基酸殘基的親(疏)水性情況,利用疏水性預測網站對其進行分析,結果表明,不同蛋白的最強親(疏)水性殘基及其位置情況、最強親(疏)水性殘基數值綜合情況均不盡相同,其中,CgTPO1和CgTRM6在最強親水性殘基均為T(蘇氨酸),而其在最強疏水性殘基的組成上不同;CgTPO1和CgCRN3在最強疏水性殘基均為V(纈氨酸),CgMYO2和CgTRM6則均為L(亮氨酸),上述蛋白在最強親水性殘基上不同(表 5)。

表 4 基本理化性質分析Table4 The physicochemical properties
經過TargetP在線分析蛋白的轉運肽情況,結果表明,C. graminicola中的NPFxD基序蛋白中的轉運肽預測定位情況及結果可靠性情況不盡相同,除CgCRN3和CgNPF4分別定位于線粒體和分泌途徑外,結合之前所開展的亞細胞定位分析結果,發現兩者結果不一致,同時,其他4個蛋白均未得到有效定位情況(表 6),上述研究結果有待于進一步通過生物學試驗進行解析和驗證。
由于TMHMM和HMMTOP預測程序對于蛋白跨膜結構域的預測與信號肽的預測之間存在著一定的重疊性,因此,本研究進一步利用信號肽預測軟件SignalP 5.0對上述蛋白進行分析,結果表明,上述6條蛋白序列中僅有1條序列(CgNPF4)具有明顯的信號肽,其信號肽切割位置在17~18 aa,最大切割率為0.949(表 7)。

表 5 親(疏)水性氨基酸殘基位置Table5 Hydrophobic and hydrophilic amino acid residue positions

表 6 潛在轉運肽的可能性預測Table6 Possibility prediction of transit peptides

表 7 含有信號肽的可能性預測Table7 Probability prediction of signal peptide
一般而言,蛋白質的基本理化性質由其氨基酸組成情況決定,而其二級結構則較好地反映其生化性質。為了進一步明確禾谷炭疽菌C.graminicola中的NPFxD基序蛋白的二級結構情況,更好地明確其功能情況,對上述6個蛋白開展了二級結構預測工作,結果表明,CgMYO2中所含的α螺旋所占比例較高,為45%;而CgCRN3所含有的β卷曲所占比例較高,為37%;相對而言,CgMYO2中所含有的β卷曲所占比例則較低,為9%,而CgGBP5中所含有的無規則卷曲所占比例較高,為48%(圖 4)。

圖 4 二級結構分析Fig.4 Secondary structure analysis
為了進一步明確不同植物病原真菌中NPFxD基序蛋白的遺傳關系,以C.graminicola中的CgTPO1、CgMYO2、CgCRN3、CgNPF4、CgGBP5、CgTRM6氨基酸序列為基礎,在NCBI數據庫中進行同源序列搜索,同時,利用ClustalX[22]和MEGA X軟件[23]分別對上述序列開展多重序列比對和系統進化樹構建等,結果表明,在所選擇的30個蛋白中,分別以C.graminicola中的6個NPFxD基序蛋白為核心蛋白聚類形成了四大類,同時,該菌中的NPFxD基序蛋白又與炭疽菌屬真菌(C.sublineola、C.incanum)中相關蛋白有著較近的親緣關系,此外,禾谷炭疽菌中的CgMYO2和CgTRM6彼此之間親緣關系最為緊密,其次為CgTPO1和CgNPF4(圖 5)。

Cc、Ch、ChI、Cf、Ci、Cn、Csh、Csi、Csp、Csu、Cta、Cto、Ctr、Co、CoM、Pg、Pp、Pl、Ps、Po、Sa、Tc、Mm分別為C.higginsianum、C. higginsianum IMI 349063、C. chlorophyti、C. fioriniae PJ7、C. incanum、C. nymphaeae SA-01、C. shisoi、C. sidae、C. spinosum、C. sublineola、C. tanaceti、C. tofieldiae、C. trifolii、C. orchidophilum、C. orbiculare MAFF 240422、P. grisea、P. pennisetigena、Purpureocillium lilacinum、Pyricularia sp. CBS 133598、P. oryzae、Scedosporium apiospermum、Tolypocladium capitatum、Madurella mycetomatis物種的縮寫圖 5 禾谷炭疽菌NPFxD蛋白與其他物種之間的遺傳關系Fig. 5 Genetic relationship between the NPFxD protein in C. graminicola and other species
通過關鍵詞搜索和Blastp比對分析,明確了C.graminicola中存在6個與構巢曲霉具有高度同源性的NPFxD基序蛋白;并通過在線分析軟件SMART、SignalP等,對上述蛋白的保守結構域、信號肽、理化性質及亞細胞定位等進行預測分析,明確上述蛋白在保守結構域方面具有多種不同的保守域,且缺乏較為同一的保守域結構;上述蛋白在信號肽、理化性質、疏水性、亞細胞定位等方面也存在著明顯的差異性;進一步利用上述NPFxD基序蛋白開展遺傳關系分析,明確該菌中NPFxD基序蛋白與炭疽菌屬真菌中的蛋白具有較近的親緣關系。
2012年,禾谷炭疽菌的全基因組序列釋放,為進一步開展其致病因子提供了重要的數據支撐[10]。前人基于全基因組序列數據,對該菌中的諸多致病基因開展了基因敲除、蛋白生信分析、功能解析等方面的研究,一些如G蛋白偶聯受體GPCR[25]、磷脂酰肌醇特異性磷脂酶PI-PLC[26]、磷脂酰肌醇轉移蛋白Pth11[27]、細胞外膜蛋白CFEM[28]等涉及G蛋白信號效應分子及其特征得到進一步明確。上述研究為解析禾谷炭疽菌侵染禾本科植物過程中,蛋白亞細胞定位、功能發揮等方面的深入研究提供了重要的理論基礎。然而,作為真菌中重要的細胞活動之一——內吞,尚缺乏在植物病原絲狀真菌中的解析工作,特別是對于禾谷炭疽菌中NPFxD基序蛋白的研究尚未見報道。前人對于模式真菌中內吞作用的研究工作已經明確,具有NPFxD基序的蛋白可用于其他正常受體的內化過程,對于缺乏泛素化位點的受體尤為重要[29]。內吞作用可以大量出現在絲狀真菌菌絲尖端,并且菌絲尖端的快速延伸可能需要有效的內吞作用[30]。
中外學者對內吞在模式真菌及植物病原絲狀真菌的菌絲生長中作用已明確,例如,構巢曲霉中存在著諸多內吞相關蛋白,稻瘟菌中內吞調控蛋白可以有效抑制寄主免疫反應[31]。結合前人關于植物病原絲狀真菌特別是稻瘟病菌中內吞機制調控蛋白的研究,有理由推測禾谷炭疽菌在菌絲生長和發育過程中也很可能與內吞機制調控有關。就禾谷炭疽菌與禾本科植物互作而言,當禾本科植物通過各種信號途徑激活自身防衛反應后,可以有效地阻止病原真菌在其體內的進一步擴散和傳播;同樣,當禾谷炭疽菌中相關蛋白感應到植物的防衛反應時,也必將進一步采取和調整相應的攻擊方法,如分泌毒素、角質酶、果膠酶和纖維素酶等致病因子,進一步破壞寄主植物的免疫反應,從而實現其與植物之間的此消彼長“軍備競賽”關系。在上述過程中,內吞作用在禾谷炭疽菌侵染植物以及不同營養階段中的地位和作用是什么?其內吞作用與植物中解毒物質分泌之間的關系如何?是否還存在其他不同基序的內吞蛋白?研究中所獲得NPFxD基序蛋白在保守結構域方面具有其他結構發揮何種功能?上述問題均有待于進一步通過生物學試驗開展研究和探討,從而較好地明確禾谷炭疽菌中的內吞作用機制,為進一步防控該病菌提供重要的解決思路。