唐國鑫,陳寧
(1.天津科技大學生物工程學院,天津300457;2.中國科學院天津工業生物技術研究所,天津300308)
土壤宏基因組中芽孢桿菌信號肽的克隆及分析
唐國鑫1,2,陳寧1*
(1.天津科技大學生物工程學院,天津300457;2.中國科學院天津工業生物技術研究所,天津300308)
從土壤宏基因組中篩選獲得在芽孢桿菌中高效分泌重組蛋白的信號肽。通過數據分析,將預測到的信號肽DNA片段與蛋白酶基因融合,在枯草芽孢桿菌(Bacillus subtilis)WB800和地衣芽孢桿菌(Bacillus licheniformis)DL6中表達,進行胞外蛋白酶酶活測定。篩選得到25個可能來源于G+菌的信號肽序列,胞外蛋白酶活性分析的結果顯示,有14個信號肽具有較好的分泌蛋白酶的能力,其中引導效果最好的信號肽(sig20)是蛋白酶自身信號肽的1.64倍。將高分泌信號肽轉化到地衣芽孢桿菌中,證實其在地衣芽孢桿菌同樣具有較好的引導效果。應用生物信息學與宏基因組學相結合的方法,可有效獲得高效的芽孢桿菌信號肽序列,為蛋白質高效分泌表達系統的構建提供豐富的表達元件。
宏基因組;信號肽;芽孢桿菌;蛋白酶
眾所周知,芽孢桿菌被作為工業中外源蛋白表達的優良宿主。它們的發酵成本相對低廉[1]。其中的枯草芽孢桿菌和地衣芽孢桿菌已通過美國食品藥物管理局一般認為安全(generallyreeonized as safe,GRAS)認證[2-3]。同時,芽孢桿菌可直接將表達產物分泌到培養基中[4],簡化了目的產物的提取和純化過程。有相關報道,芽孢桿菌分泌外源目標蛋白最高可達到20~25 g/L[5]。
信號肽是一段通常位于分泌蛋白的新生肽鏈N端的氨基酸序列,并將新生的肽鏈引導到細胞特定的部位。信號肽一般含15~45個氨基酸殘基[6],一般分為三個區域:帶正電的N端,含有堿性氨基酸,可與細胞膜上的易位蛋白和帶負電的磷脂相互作用[7-8];中間為疏水的H區,含大量疏水氨基酸;C端為加工區,含小分子的氨基酸,是信號肽的切割位點[9-10],信號肽酶識別出信號肽C端的切割位點,將信號肽從成熟蛋白上切除[11]。
篩選高效信號肽是提高蛋白質分泌量的一個有效手段。BROCKNEIER U等[12]篩選到了對角質酶分泌引導效率不同的信號肽;DEGERING C等[13]通過篩選,獲得了7個枯草芽孢桿菌蛋白酶(BPN′)的野生型信號肽引導效率高的信號肽。范鑫[14]通過篩選24個枯草芽孢桿菌信號肽,其中最好的信號肽YnfF使木聚糖酶的胞外酶活達到37.2 U/mL。
宏基因組是由HANDELSMAN J等[15]于1998年首次提出的概念。其定義為自然環境獲得的樣品中所有微生物基因組的總和。自然環境中超過99%的微生物不能通過傳統的方式培養,這極大的限制了人們認識和了解微生物[16]。宏基因組學以環境中全部微生物的脫氧核糖核酸(deoxyribose nucleic acid,DNA)作為研究對象。相對于傳統的篩菌方法獲得的微生物基因資源,宏基因組學避免了微生物分離培養的難題,極大的拓展了對微生物資源的利用[17-19]。
本研究通過生物信息學的方法從宏基因組數據中獲得信號肽,在枯草芽孢桿菌(B.subtilis)WB800得到有效的表達和分泌,進一步對5條胞外蛋白酶活性較好的信號肽在地衣芽孢桿菌中進行了驗證,并對這些信號肽進行了結構解析,為蛋白高效分泌表達體系的構建奠定了較好的基礎。
1.1材料與試劑
1.1.1菌株和質粒
大腸桿菌(Escherichia coli)DH5α、枯草芽孢桿菌(Bacillus subtilis)WB800、地衣芽孢桿菌(Bacillus lincheniformis)DL6:本實驗室保存菌種;大腸桿菌-枯草桿菌穿梭質粒pHT43:本實驗室保存;重組質粒pBE980B-pro(含有由芽孢桿菌組成型啟動子P43控制表達的芽孢桿菌堿性蛋白酶基因(pro,GenBank:AR691047),自身攜帶有一個野生型Pro309信號肽):本實驗室構建[20]。
1.1.2試劑及樣品
限制性內切酶、T4 DNA連接酶:美國Thermo公司;高保真DNA聚合酶Cobuddy、質粒小提試劑盒、DNA凝膠回收試劑盒:北京康為世紀生物科技有限公司;脫氧核糖核苷三磷酸(deoxy-riborucleo side triphosphate,dNTP)、三磷酸腺苷(adenosine triphosphate,ATP)和氨芐青霉素、卡那霉素、氯霉素等抗生素:北京Solarbio公司;酪蛋白:美國Sigma公司。其他化學試劑均為國產分析純。
宏基因組來源于天津大港冬季的堿性土壤,土壤宏基因組DNA的提取和純化采用美國OMEGA土壤DNA提取試劑盒完成,宏基因組DNA序列測定和拼接由蘇州金維智公司完成。聚合酶鏈式反式(polymerase chain reaction,PCR)引物合成和DNA測序均由北京華大基因和蘇州金維智公司完成。
1.1.3培養基和溶液
固體LB培養基:5 g/L酵母粉、10 g/L氯化鈉、10 g/L蛋白胨、15 g/L瓊脂粉,LB牛奶平板添加1%脫脂奶粉用于枯草芽孢桿菌胞外分泌的蛋白酶水解圈分析。
芽孢桿菌電轉化復蘇培養基為包含0.5 mol/L的山梨醇和0.38 mol/L的甘露醇的LB培養基。
2%酪蛋白溶液:酪蛋白溶于pH9.0甘氨酸-氫氧化鈉緩沖液(0.05 mol/L)中,用于測蛋白酶酶活。0.4 mol/L三氯乙酸用于終止蛋白酶反應。
1.2儀器與設備
SPX-150B-Z型生化培養箱、SKY-2111B恒溫搖床:上海博迅實業有限公司;ECM399電擊儀:美國HarvardApparatus公司;Epoth 2TC酶標儀:美國BioTek公司;紫外酶標板:德國GreinerBio-OneGmbH公司。
1.3試驗方法
1.3.1信號肽篩選載體的構建
設計引物up-promoter(5′-CTCGTCAAACATCACCC TCTT-3′)和down-MC(5′-CTTGGAATTGTGCTGAAG CT-3′),以pBE980B-pro質粒為模板,擴增獲得包含pro基因完整表達盒的片段。PCR程序為:預變性98℃,3 min;擴增:95℃,20s,52℃,20s,72℃,45s,30個循環;補齊:72℃,10min。將PCR產物純化后與經過SmaⅠ-NheⅠ雙酶切并平端化處理的pHT43載體部分連接,獲得了重組質粒pHT43-pro,該質粒去除了原質粒上由異丙基-β-d-硫代半乳糖苷(isopropyl-β-d-thiogalactoside,IPTG)誘導的外源基因表達片段,可組成型表達芽孢桿菌蛋白酶。
再設計引物mPro 5′-GCTAAGGATCCGCTGAAGAA GCAAAAGAAAAATA-3′(下劃線處為BamHⅠ酶切位點),以pHT43-pro質粒為模板,down-MC為下游引物,擴增出不含信號肽的蛋白酶成熟肽基因片段,PCR程序與前文一致。用BamHⅠ和PstⅠ切下蛋白酶基因,同樣的酶切下pHT43-pro的pHT43載體部分,連接后得到重組質粒,命名為pHT43-mpro(mpro為不含信號肽的芽孢桿菌蛋白酶成熟肽基因片段),該質粒用于不同信號肽的篩選。土壤宏基因組預測獲得的信號肽DNA序列分別與蛋白酶基因進行融合,獲得含有不同信號肽的重組質粒pHT43-SP-mpro。
1.3.2枯草芽孢桿菌和地衣芽孢桿菌的轉化及初篩
枯草芽孢桿菌和地衣芽孢桿菌的轉化均采用相同的電擊轉化的方式,取5~10 μL(約500 ng)質粒與100 μL B.subtilisWB800感受態細孢混合,放入預冷的2 mm電擊杯中,冰浴2 min后取出,置于電擊儀中,用1 750 V的電壓電擊,電擊后立刻加入1 mL復蘇培養基,37℃、220 r/min復蘇培養3 h,涂布于含有10 μg/mL氯霉素和1%脫脂奶粉的LB平板,37℃過夜培養,觀察菌落和水解圈。通過測定蛋白水解圈大小與菌落直徑的比值,進行初篩。
1.3.3蛋白酶酶活測定
配制不同質量濃度的酪氨酸溶液,讀取其在波長280nm下的吸光度值,以酪氨酸質量濃度為縱坐標,以波長280nm下的吸光度值為橫坐標,繪制標準曲線[21]。結果顯示酪氨酸質量濃度在0~400 μg/mL范圍內具有很好的線性關系,R2為0.999。酶活定義為在50℃、pH 9.0條件下,每分鐘蛋白酶水解酪蛋白產生1 μg的酪氨酸為一個酶活單位(U)[21],酶活計算公式如下:

式中:X—酶活,U;269.8—標準曲線的斜率;Y—OD280nm;2.266—截距;4—稀釋倍數,即1 mL反應體系里實際只含1/4毫升上清液;10—反應時間,min。
將重組B.subtilisWB800在37℃,220 r/min培養24 h的培養液以12000r/min離心1min沉淀菌體,取250 μL上清液在50℃水浴中溫浴2 min后,加入pH 9.0的2%酪蛋白溶液250 μL,50℃保溫10 min,立刻加入500 μL濃度為0.4 mol/L三氯乙酸終止反應,12 000 r/min離心10 min,取200 μL上清液于酶標儀中測定OD280nm。
2.1宏基因組信號肽數據庫的建立
土壤宏基因組DNA的抽提、純化依照說明書的方法進行,最終獲得的DNA純度A260nm/A280nm為1.87,質量濃度228.8 ng/μL,符合宏基因組DNA測序的要求,并由蘇州金維智公司進行了高通量測序和初步的拼接注釋。結果表明該測序具有較好的質量。通過數據拼接,獲得了37 284個大于500 bp的片段,初步比對獲得了70 072個可能的基因。利用在線蛋白數據庫(http://www.ebi.ac.uk/interpro/)分析,并結合在線信號肽預測工具SignalP 4.1 Server(http://www. cbs.dtu.dk/services/SignalP/),最終獲得了398個可能含有信號肽序列的新基因(與Genbank數據比對,全肽序列的同源性≤90%),構建了含信號肽序列的基因數據庫(數據未顯示)。再根據蛋白的同源性關系,篩選了其中可能來源于G+菌的含有可能的分泌性信號肽的新基因34個,對這些基因N端編碼的70個AA用SignalP 4.1 Server進行分析,獲得了可能的信號肽序列和信號肽酶的切割位點,將這些信號肽序列在信號肽數據庫(http://www.signalpeptide.com/)中進行比對分析,結果發現預測的信號肽均為新的信號肽序列,其序列被用于在芽孢桿菌中進行外源蛋白的分泌表達分析。
2.2信號肽的初篩

圖1 不同信號肽-蛋白酶產生的水解圈Fig.1 Hydrolyzed circles of different signal peptides-protease
將不同的信號肽插入到信號肽篩選載體pHT43-mpro的BamHⅠ位點處,與芽孢桿菌堿性蛋白酶基因pro融合,成功構建了25個信號肽重組質粒,獲得的重組質粒電轉化到B.subtilisWB800中,進行初篩。根據水解圈與菌落比值大小并與含野生型信號肽質粒pHT43-pro的重組菌株進行對比,結果見圖1(未完全列出),將不同水平的信號肽分成了四組:高分泌組包括sig8、sig12、sig13、sig20、sig27、sig34;中等分泌組包括sig18、sig24、sig26、sig28、sig30、sig31、sig37、sig40;低分泌組包括sig15、sig21、sig29、sig32、sig36、sig41,差分泌組包括sig17、sig22、sig35、sig38、sig39。其中高分泌組的水解圈比值高于野生型,中等分泌組的水解圈比值與野生型相當,差分泌組的水解圈很小,有的甚至難以測定。
2.3胞外分泌蛋白酶活性定量分析
挑取出高分泌組和中等分泌組的B.subtilisWB800重組菌株,接種于2 mL含氯霉素10 μg/mL的LB培養基中,37℃,220 r/min過夜培養,將該種子液按2%接種量接種于5 mL含氯霉素10 μg/mL的LB培養基的大試管中,37℃,220 r/min繼續震蕩培養24 h,離心后去除菌體,取上清液測定蛋白酶的活性。以同樣培養條件的含pHT43-pro質粒的B.subtilisWB800為陽性對照,含pHT43-mpro質粒的B.subtilisWB800為陰性對照(該菌株喪失了胞外分泌蛋白酶的能力),測定其相對酶活,即扣除陰性對照后的酶活。對比分析含不同信號肽的重組菌株的蛋白酶的胞外分泌能力,將不同信號肽引導的蛋白酶胞外酶活與Pro309信號肽進行比較,結果見表1。每個菌株做5個平行試驗。
同時,利用SignalP4.1Server信號肽分析工具對這25個預測的信號肽以及Pro309信號肽進行分析,從肽鏈長度、D值(D值對區分是否為分泌蛋白具有重要作用)、N端正電荷數(根據預測結果對N區的劃分,統計N區氨基酸攜帶的凈正電荷數)和信號肽的疏水百分比(疏水氨基酸數量占信號肽總氨基酸數量的百分比)這四個方面進行對比,按胞外酶活排序,結果見表1。
表1結果顯示初篩的14個信號肽,可在枯草芽孢桿菌中有效的表達分泌芽孢桿菌堿性蛋白酶。高分泌組的胞外蛋白酶活性是野生型的1.4倍以上,其中含有信號肽sig20(氨基酸序列:MKRLISTLLIGILLTASAPSAFAKPD)的重組菌株的胞外蛋白酶的活性是野生型的1.64倍;中等分泌組的胞外蛋白酶活性是野生型的0.8~1.4倍,這一結果與水解圈法得到的結果基本一致。
這26個信號肽長度大多在24~36個氨基酸,平均長度為28.3,長度分布比較隨機。統計得出引導效率最高的前11個信號肽(野生型信號肽Pro309以及效率高于野生型的信號肽)平均D值為0.694,最差的后15個信號肽(效率低于野生型信號肽)平均D值為0.552。推測D值越高,胞外酶活越高,但這并不是絕對的,如排名第5的sig34的D值只有0.525,而排名第18的sig15的D值卻達到0.851。從表中可以發現,N區正電荷數在2~4的時候,信號肽傾向于效率較好。有的信號肽,如sig34和sig21卻并不遵循這個規律。信號肽的疏水比例則與信號肽是否能成功插入細胞膜有關,然而,統計發現這26個信號肽的疏水比例大多在50%~70%隨機分布。

表1 不同信號肽與野生型信號肽引導效率的比值Table 1 Guide efficiency ratio of different signal peptides and wild-type signal peptide
2.4高分泌信號肽在地衣芽孢桿菌中的表達

圖2 含不同信號肽的重組菌株的相對胞外蛋白酶酶活Fig.2 Relative extracellular protease activity in recombinant strain containing different signal peptides
將含高分泌組信號肽(sig8、sig12、sig13、sig20、sig27)的重組質粒轉化到B.lincheniformisDL6中,篩選出陽性克隆,用與B.subtilisWB800同樣的方法培養和測定上清液中的蛋白酶活性。結果發現,在地衣芽孢桿菌中,與野生型信號肽Pro309相比,除sig27外(sig27在枯草芽孢桿菌和地衣芽孢桿菌中的蛋白酶分泌量分別是野生型信號肽的1.52倍和0.98倍),其余幾個信號肽的相對胞外蛋白酶活性與在B.subtilisWB800中相似,結果見圖2。由圖2可知,這些信號肽在地衣芽孢桿菌中也可以有效地引導分泌蛋白酶。
本研究應用生物信息學和宏基因組學相結合的方法,從土壤宏基因組中篩選出25個信號肽并成功在枯草芽孢桿菌中得到了分泌表達,其中最好的信號肽sig20對蛋白酶的分泌表達是蛋白酶野生型信號肽的1.64倍。此外,將部分信號肽應用于地衣芽孢桿菌,也得到了較好的效果。結果表明,從宏基因組中獲得信號肽來提高蛋白的分泌水平是一種行之有效的辦法。
通過分析信號肽的長度、D值、N端正電荷數和信號肽的疏水百分比,試圖找出信號肽分泌效率的規律,預測影響信號肽強弱的關鍵結構和位點。然而,這些因素與信號肽的強弱之間并沒有明顯的或者絕對的規律,并不能覆蓋影響信號肽功能的所有因素,說明宿主對信號肽的識別和蛋白的分泌是非常復雜的。因此,構建高效的信號肽篩選和評價體系對于獲得高效信號肽的是十分重要的。本研究篩選到的新的信號肽,為在芽孢桿菌中高效分泌表達目標蛋白提供了新的信號肽資源和表達元件。
[1]FU L L,XU Z R,LI W F,et al.Protein secretion pathways in Bacillus subtilis:implication for optimization of heterologous protein secretion[J].Biotechnol Adv,2007,25:1-12.
[2]陳向東.枯草芽孢桿菌作為生防制劑在農業上的應用[J].微生物學通報,2013,40(7):1323-1324.
[3]王光強.枯草芽孢桿菌中Sec分泌途徑底物特性及非經典分泌途徑的研究[D].無錫:江南大學,2013.
[4]王培立,王平,田健,等.芽孢桿菌高效分泌表達異源蛋白的研究進展[J].生物技術進展,2015(2):95-102.
[5]SCHALLMEY M,SINGH A,WARD O.Developments in the use of Bacillus species for industrial production[J].Can J Microbiol,2004,50:1-17.
[6]CHOO K H,RANGANATHAN S.Flanking signal and mature peptide residues influence signal peptide cleavage[J].BMC Bioinformatics,2008,9(Suppl 12):S15.
[7]ISMAIL N F,HAMDAN S,MAHADI N M,et al.A mutant L-asparaginase II signal peptide improves the secretion of recombinant cyclodextrin glucanotransferase and the viability ofEscherichia coli[J].Biotechnol Lett,2011,33:999-1005.
[8]DEUERLING E,MOGK A,RICHTER C,et al.The ftsH gene ofBacillussubtilisis involved in major cellular processes such as sporulation,stress adaptation and secretion[J].Mol Microbiol,1997,23(5):921-933.
[9]JONET M A,MAHADI N M,MURAD A M A,et al.Optimization of a heterologous signal peptide by site-directed mutagenesis for improved secretion of recombinant proteins inEscherichia coli[J].J Mol Microbiol Biotechnol,2012,22:48-58.
[10]SHENG C,BIN L,RUOYU H,et al.The number of signal peptide cleavage site is critical for extracellular production of recombinant Thermobifidafuscacutinase[J].Process Biochem,2011,46:1867-1870.[11]TJALSMA H,BOLHUIS A,JONGBLOED J,et al.Signal peptide-dependent protein transport inBacillus subtilis:a genome-based survey of the secretome[J].Microbiol Mol Biol R,2000,64(3):515-547.
[12]BROCKMEIER U,CASPERS M,FREUDL R,et al.Systematic screening of all signal peptides fromBacillus subtilis:a powerful strategy in optimizing heterologous protein secretion in gram-positive bacteria[J]. J Mol Cell Biol,2006,362(3):393-402.
[13]DEGERING C,EGGERT T,PULS M,et al.Optimization of protease secretion inBacillus subtilisandBacillus licheniformisby screening of homologous and heterologous signal peptides[J].Appl Environ Microbiol,2010,76(19):6370.
[14]范鑫.外源木聚糖酶在枯草芽孢桿菌中信號肽篩選[D].楊凌:西北農林科技大學,2011.
[15]HANDELSMAN J,RONDON M R,BRADY S F,et al.Molecular biological access to the chemistry of unknown soil microbes:a new frontier for natural products[J].Chemistry and Biology,1998,5(10):R245-R249.
[16]張冰,崔岱宗,趙敏.宏基因組學技術及其在微生物學研究中的應用[J].黑龍江醫藥,2014,27(2):267-271.
[17]王光龍.利用功能宏基因組技術對北極、大西洋海底沉積物中的新型蛋白酶、酯酶進行篩選、鑒定和性質研究[D].濟南:山東大學,2014.
[18]斯日古楞,特木侖,明亮,等.宏基因組學及其應用前景[J].中國畜牧獸醫,2014,41(3):115-118.
[19]于雷,于麗,張薇,等.宏基因組技術及其在酶制劑中的應用[J].食品科學,2013,34(9):404-407.
[20]甄杰,胡政,李樹芳,等.一個新型耐熱普魯蘭酶的結構與功能[J].生物工程學報,2014,30(1):119-128.
[21]胡政.堿性蛋白酶菌株的選育及其酶學性質的研究與應用[D].天津:中國科學院天津工業生物技術研究所,2014.
TANG Guoxin1,2,CHEN Ning1*
(1.College of Biotechnology,Tianjin University of Science and Technology,Tianjin 300457,China;2.Tianjin Institute of Industrial Biotechnology,Chinese Academy of Sciences,Tianjin 300308,China)
Signal peptide,efficiently secreting recombinant proteins inBacillussp.was obtained from soil metagenome.After database analysis,the predicted signal peptide DNA fragment was fused with a protease gene,and then expressed inBacillus subtilisWB800 andBacillus licheniformis DL6 to measure the extracellular protease activity.Totally 25 signal peptide sequences which may derived from G+bacteria were screened,extracellular protease activity results showed that there were 14 signal peptides had excellent ability of secreting protease.One of the signal peptides,named sig20,was 1.64 times of its own protease signal peptide,which performed the optimal secretion ability.The high secretion signal peptides were transformed intoB.licheniformisand the results confirmed the similar secretion ability inB.subtilis.By combining bioinformatics and metagenomics methods,effectively Bacillus signal peptipe sequence could be obtained,which provided a rich expression elements for expression and secretion of recombinant proteins.
metagenome;signal peptide;Bacillus;protease
0254-5071(2016)06-0138-05
10.11882/j.issn.0254-5071.2016.06.029

2016-01-15
國家高技術研究發展計劃‘863計劃’項目(2014AA021303,2014AA021302);天津市應用基礎與前沿科學研究計劃(13JCYBJC39500)
唐國鑫(1991-),男,碩士研究生,研究方向為芽孢桿菌信號肽的篩選與改造。
陳寧(1963-),男,教授,博士,研究方向為氨基酸與有機酸發酵。