王冠娜,鄭義培,鄭璞
(江南大學 生物工程學院,工業生物技術教育部重點實驗室,江蘇 無錫,214122)
香蘭素以游離態和葡萄糖苷的形式存在于植物及植物提取物中,如香莢蘭豆、丁香油、甜菜根、秘魯香脂、吐魯香脂和天冬門等,其中較集中存在于香莢蘭豆中[1]。純凈的香蘭素具有濃郁的奶香氣,有“香料之王”的美譽,被廣泛應用于食品、飲料、香料和醫藥等領域中[2]。目前,市場上香蘭素的生產方式主要包括植物提取法、微生物轉化法和化學合成法[3]。植物提取法主要是從香莢蘭豆中提取香蘭素,但香莢蘭的種植受氣候的影響,其產量有限,價格昂貴,不能滿足市場需求。化學合成法生產的香蘭素價格低廉,但其生產過程對環境造成嚴重污染,而且香型單一,安全性也備受質疑,不符合下游應用市場對天然原料的消費趨勢,并且歐盟(European Union,EU)和美國食品藥品監督管理局(Food and Drug Administration,FDA)不允許將其用于食品[4]。天然底物經微生物轉化產生的香蘭素被稱為“天然香蘭素”。以天然阿魏酸為底物,微生物生產的香蘭素在價格和品質方面都比化學合成的香蘭素占有優勢。其中,Amycolatopsissp.ATCC 39116[5]和Streptomycessp.strain V-1[6]用于阿魏酸發酵生產天然香蘭素,產量可達10 g/L以上。
全基因組測序是對未知基因組序列的生物體進行高通量DNA測序和生物信息學組裝以獲得全基因組序列信息[7]。全基因組測序有助于了解菌株代謝特點,認識其遺傳信息與生理功能之間的聯系[8-10]。本實驗室前期篩選到1株擬無枝酸菌(Amycolatopsissp.)CCTCC NO:M2011265,它可以轉化阿魏酸合成香蘭素[11-13];為深入了解擬無枝酸菌中參與香蘭素合成的功能基因及其代謝通路信息,本文通過第二代全基因組測序技術,獲得擬無枝酸菌的全基因組信息,然后根據已報道的香蘭素合成的基因信息,挖掘擬無枝酸菌(Amycolatopsissp.)CCTCC NO:M2011265潛在參與香蘭素生物合成的功能基因。
1.1.1 材料與試劑
擬無枝酸菌(Amycolatopsissp.)CCTCC NO:M 2011265保存于中國典型培養物中心,E.coliJM109和E.coliJM110均為市售菌株,質粒pULcrRNA由中國上海師范大學生命科學學院王金教授贈予;細菌基因組DNA提取試劑盒(柱式法),寶日醫生物技術(北京)有限公司;質粒小量制備試劑盒,上海捷瑞生物工程有限公司;ClonExpress Ⅱ 多片段克隆試劑盒,南京諾唯贊生物科技股份有限公司;引物合成和PCR產物測序,金唯智生物科技有限公司;天然阿魏酸,西安冠宇生物技術有限公司;安普霉素(apramycin,Apr),生工生物工程(上海)有限公司;酵母提取物、胰蛋白胨,英國OXOID有限公司;瓊脂粉、牛肉浸膏、酵母浸膏、蔗糖、冰醋酸、甲醇、氯化鈉,國藥集團有限公司。
1.1.2 儀器與設備
5418離心機、Eporator電轉儀,德國艾本德公司;HH-4恒溫水浴鍋,榮華儀器制造有限公司;G154DWS立式高壓滅菌鍋,美國致微公司;SW-CJ-1FD超凈工作臺,蘇州安泰空氣技術有限公司;Waters2487高效液相色譜儀,美國Waters公司;DYCP-31DN核酸電泳儀,北京六一儀器有限公司;Tanon-3500R凝膠成像儀,上海天能科技有限公司;SPX-150-B生化培養箱,上海博泰實驗設備有限公司;HYL-C組合式搖床,太倉市強樂實驗設備公司;9700A-PCR儀,南京賽飛生物科技公司。
1.1.3 培養基
斜面培養基、種子培養基、發酵培養基參見文獻[12],本氏培養基、YEME培養基參見文獻[13]。
1.2.1 菌體的活化與培養
從-80 ℃冰箱取出保存菌種甘油管,放置冰上融化后用接種環沾取少量的菌液,在本氏固體培養基上劃線,30 ℃培養7 d后挑取單菌落,接種至本氏液體培養基于30 ℃、220 r/min培養48 h。
1.2.2 基因組DNA提取、測序與功能注釋
將斜面保存的擬無枝酸菌接種于新鮮的本氏培養基中,在30 ℃、220 r/min恒溫搖床中培養28 h,獲得擬無枝酸菌菌液,使用柱式細菌基因組DNA提取試劑盒提取擬無枝酸菌基因組DNA。提取好的擬無枝酸菌基因組DNA經0.8%(質量分數)瓊脂糖凝膠電泳檢測,用核酸檢測儀測量基因組DNA的濃度,并將合格的樣品委托上海伯豪生物技術有限公司進行基因組測序。使用Illumina Hiseq platform進行基因組測序、利用FastQC對樣本的測序數據質量進行可視化評估,為了保證信息分析質量,對原始數據進行過濾,得到Clean數據。Reads質量的評估標準為:90%以上的堿基Q值>20。序列拼接使用SPAdes-3.5.0軟件,利用軟件Prokka結合Swiss-Prot庫注釋,分別使用KOBAS工具、rpsblast工具、和blast2GO算法,將預測的基因分別與KEGG、COG、GO數據庫進行比對以注釋其功能[14-17]。
1.2.3 香蘭素合成與代謝基因篩選
根據已知產香蘭素模式菌株Amycolatopsissp.ATCC 39116(GenBank:NZ_AFWY00000000.3)的產香蘭素的關鍵基因,利用NCBI的BLAST工具(https://blast.ncbi.nlm.nih.gov/Blast.cgi)對擬無枝酸菌CCTCC NO:M2011265的全基因組序列進行序列相似性分析,篩選擬無枝酸菌CCTCC NO:M2011265基因組中可能參與香蘭素生物合成的功能基因。
1.2.4 過表達質粒的構建
根據Amycolatopsissp.ATCC 39116的ech-fcs和ech2基因設計引物,以擬無枝酸菌CCTCC NO:M 2011265基因組作為模版,分別用引物P1(5′-GTATCTGAAAGGGGATACGCATGAGCACAGCGGTCG-GCAACGGGC-3′)/P2(5′-GCGACGTAGATGACCTGGCCTCAGCCG-AAGCGGCGGCGGACCTCG-3′)和P3(5′-TCCGCCGCCGCTTCGGCTGAGGCCAGGTCATCT-ACGTCGC-3′)/P4(5′-GGGAGATCTACTAGTACGGT-CTTGCCCTGGCTGAACC-3′)擴增獲得ech-fcs和ech2片段,通過一步克隆將回收的ech-fcs、ech2片段和線性化pULcrRNA質粒按照2∶1的摩爾比,在37 ℃下反應30 min連接。以上連接產物通過熱激法轉化至大腸桿菌E.coliJM109感受態細胞中,37 ℃孵育45 min后涂布在對應抗性平板上,獲得的轉化子使用引物P5(5′-GCTGCTCCTTCGGTCGGACGT-3′)和P6(5′-CACTACTTCTCCGGGTCGA-3′)進行菌落PCR驗證,將驗證正確的質粒命名為pULwgn03。
1.2.5 過表達菌株的構建
將擬無枝酸菌CCTCC NO:M2011265從斜面接到新鮮的YEME培養基,30 ℃,220 r/min培養36~48 h后以5%的接種量轉接至新鮮的YEME培養基,30 ℃,220 r/min過夜培養約12 h,將菌體放于冰上冰浴30 min;隨后4 ℃,5 000 r/min,離心5 min收集菌體;倒掉上清液,用冰浴的電擊緩沖液洗滌2~3次,然后用1~2 mL電擊緩沖液重懸菌液。將菌液按每份100 μL裝入1.5 mL離心管中。pULwgn03質粒轉入E.coliJM110去甲基化;獲得的質粒于98 ℃加熱10 min后立即放在冰上冷卻,與擬無枝酸菌感受細胞態輕輕混勻,冰上放置5 min,隨后加入0.1 cm預冷電轉杯中,放置于電轉儀中,電轉條件為1 800 V、5 ms。電擊后立刻加入預熱本氏培養基,30 ℃,220 r/min孵育約4 h。菌液在5 000 r/min的條件下離心5 min,去除上清液,將菌體重懸涂布于含有安普霉素的固體本氏培養基,30 ℃培養5~7 d,使用P5/P6引物進行菌落PCR和測序驗證。
1.2.6 過表達菌株搖瓶發酵分析
阿魏酸生物轉化分為兩階段法:生長階段和轉化階段。種子液的獲得:從斜面保存的過表達菌株接兩環于種子培養基中30 ℃,220 r/min培養36 h左右獲得種子液。按10%接種量將種子液接種于發酵培養基中,溫度30 ℃,220 r/min培養16~24 h,加入終質量濃度為12 g/L的底物阿魏酸,同時溫度上升至35 ℃。間隔取樣,測定發酵過程中發酵液的OD600、阿魏酸和香蘭素的含量。
1.2.7 分析方法
取1 mL發酵液12 000 r/min下離心5 min,稀釋10倍后用0.22 μm的微孔濾膜過濾后,進行HPLC分析。色譜柱采用C18柱,進樣體積為10 μL,柱溫35 ℃,流動相為30%甲醇和0.1%乙酸為流動相,流速為1 mL/min,波長選擇280 nm。
擬無枝酸菌(Amycolatopsissp.)CCTCC NO:M2011265基因組DNA經0.8%瓊脂糖凝膠電泳質檢(圖1),結果為單一且無明顯彌散的條帶,表明提取基因組DNA的質量較好。如表1的結果顯示擬無枝酸菌基因組的總量為0.85 μg,OD260/OD280值為1.80,說明基因組DNA無降解、無污染,達到基因組DNA測序要求,將合格的樣品委托上海伯豪生物技術有限公司進行全基因組測序、拼接、注釋和生物信息學分析。

表1 擬無酸菌基因組DNA濃度Table 1 Concentration of Amycolatopsis sp.genomic DNA

圖1 擬無枝酸菌基因組 DNA 電泳圖
擬無枝酸菌CCTCC NO:M2011265可以轉化阿魏酸生成香蘭素,為了更全面地了解擬無枝酸菌合成香蘭素基因信息,采用從頭測序技術對擬無枝酸菌菌株進行了全基因組測序分析,得到2 726 966 400 bp測序數據量,使用軟件SPAdes進行初步組裝后將組裝結果進行比對評估,組裝總共得到64個scaffolds,總長度為8 425 551 bp,其中scaffold平均長度為131 649 bp,最大scaffolds長度為716 347 bp,整個基因組組裝大小約為8.43 M,總GC含量為71.89%,N50長度為363 153 bp。上述結果表明擬無枝酸菌基因組的組裝質量較好,結果如表2所示。

表2 擬無枝酸菌基因組序列拼接結果Table 2 Results of genome splicing of Amycolatopsis sp.
將上述得到的基因組數據分別使用blast2GO算法、rpsblast工具和KOBAS工具與GO、COG、KEGG數據庫進行比對和功能注釋[18-19]。結果共有8 185個基因得到注釋,占基因總數的97.04%,其中,在COG數據庫中得到功能注釋的基因較多,為6 910個,占基因總數的84.40%。在GO和KEGG數據庫中得到注釋的基因分別是5 386和2 824個,分別占基因總數的65.80%和34.50%。
2.3.1 COG注釋
COG數據庫按照功能一共可以共分為26類,由擬無枝酸菌的COG功能注釋統計結果可知,在COG數據庫中一共有6 910個基因得到注釋,占全部編碼基因的百分比為84.40%(圖2)。其中Mobilome:prophages,transposons這一分類沒有被注釋到,一般功能預測基因富集最為顯著,達到1 065個,其次是轉錄類別基因注釋為968個,而碳水化合物運輸與代謝、氨基酸運輸與代謝、能源生產和轉換和脂質轉運與代謝基因注釋也相對較多,分別為555、554、550和447個。

圖2 擬無枝酸菌預測基因的 COG 注釋圖
2.3.2 GO數據庫
GO數據庫是基因功能描述的分類系統。總基因的65.80%(5 386)在GO數據庫得到了注釋,注釋結果由細胞組分(cellular component,)、分子功能(molecular function)和生物過程(biological process)組成。GO注釋蛋白質分類顯示,其中“生物過程”類別注釋了4 060個基因、“分子功能”類別注釋了4 159個基因和細胞組分類別注釋了2 327個基因,且大部分基因被注釋了多個類別,表明了擬無枝酸菌擁有較為旺盛的初級和次級代謝過程。
2.3.3 KEGG注釋
將擬無枝酸菌的氨基酸序列與KEGG數據庫進行BLAST比對,共有34.5%(2 824)的基因得到了注釋,比對到了1 665個KO號。其中ABC 2型運輸系統-ATP結合蛋白(KO1990:ABC-2 type transport system ATP-binding protein)預測到基因最多,其次是ABC 2型運輸系統-通透酶蛋白(KO1992:ABC-2 type transport system permease protein)。在KEGG數據庫中有占總數18.6%(1 523)的基因得到了注釋,其中部分基因被注釋到了多條途徑,如圖3所示,擬無枝酸菌基因組中基因注釋最多的15條途徑。其中有986個基因被注釋到代謝途徑(KO01100:metabolic pathways),其次為次不同環境中微生物代謝(KO01120:microbial metabolism in diverse environments),共有476個。

圖3 擬無枝酸菌預測基因的部分 KEGG Pathway 注釋結果
根據GO、COG和KEGG數據庫的注釋結果,將疑似基因在NCBI數據庫進行比對,挖掘與香蘭素合成與代謝相關的基因。其中在GO注釋結果中挖掘到了1個與香蘭素合成的基因z4344,將其氨基酸序列在NCBI數據庫比對,確定為阿魏酰輔酶A合成酶(fcs);在KEGG注釋結果中挖掘到了1個與香蘭素合成的基因z4343,將其氨基酸序列在NCBI數據庫比對,確定為烯酰輔酶A醛縮酶(ech)。此外,參考其他細菌中香蘭素合成代謝途徑,結合3個數據庫的注釋結果,檢索到了2個關鍵基因z7967和z8076,分別為烯酰輔酶A醛縮酶2(ech2)和香蘭素脫氫酶(vdh)。其中,烯酰輔酶A醛縮酶2在GO數據庫中被注釋為:烯酰輔酶A醛縮酶活性(enoyl-CoA hydratase activity);在COG數據庫中被注釋為:脂質轉運與代謝(enoyl-CoA hydratase activity)。香蘭素脫氫酶在KEGG數據庫中被注釋為:苯甲醛脫氫酶(benzaldehyde dehydrogenase);在GO數據庫中被注釋為:醛脫氫酶活性(aldehyde dehydrogenase activity);COG數據庫中被注釋為:能源生產與轉換(energy production and conversion)。將這4個酶與NCBI中其他來源序列進行比對,結果如表3所示。

表3 相關的序列比對結果 單位:%
如表4所示香蘭素合成與代謝相關酶基本信息,其中fcs基因與ech基因為同一個基因簇。此外,參考其他細菌中香蘭素合成代謝途徑[20],推測阿魏酸在擬無枝酸菌CCTCC NO:M2011265中是在FCS的作用下生成阿魏酰輔酶A,在ECH和ECH2的共同作用下生成香蘭素,最后在VDH的作用下生成香草酸,相關的代謝反應推測如圖4所示。

表4 香蘭素合成與代謝相關的酶Table 4 Enzymes involved in vanillin synthesis and catabolism

圖4 擬無枝酸菌中香蘭素合成與分解代謝途徑
2.5.1 過表達菌株的構建
首先以擬無枝酸基因組為模板,分別利用引物P1/P2和P3/P4擴增獲得ech-fcs基因片段和ech2基因片段,如圖5-a所示,ech-fcs基因片段目的條帶約為2 200 bp,與實際大小2 339 bp吻合,ech2基因片段目的條帶約為400 bp,與實際大小453 bp吻合,隨后將這2個基因片段與線性化pULcrRNA質粒相連,成功構建出過表達質粒pULwgn03。將重組質粒pULwgn03電轉入野生型擬無枝酸菌中,涂布在含有安普霉素平板上,生長5~7 d后,隨機挑選10個轉化子,使用引物P5/P6進行的菌落PCR擴增驗證,如圖5-b所示,目的條帶約為3 000 bp,與實際大小2 792 bp吻合,說明ech-fcs-ech2過表達菌株構建成功。

a-ech-fcs、ech2基因的PCR產物(M-DNA marker;1-ech-fcs基因片段;2-ech2基因片段);b-轉化子的PCR鑒定結果(M-DNA marker;1~10-單菌落)圖5 目的基因ech-fcs、ech2和轉化子的電泳圖
2.5.2 過表達菌株的發酵分析
按照1.2.6節發酵方法將過表達菌株與野生型分別接入搖瓶發酵,研究過表達fcs、ech和ech2基因對菌株轉化阿魏酸生成香蘭素的影響。從圖6-a中可以看出過表達菌株與野生型的發酵生長曲線有顯著性差異,過表達菌株在48 h后,發酵生長曲線迅速下降,推測是fcs-ech-ech2的組成型表達引起了香蘭素的快速合成,短時間內積累高濃度的香蘭素對菌體有一定毒害作用,轉化至55 h,過表達菌株底物阿魏酸基本上已經消耗殆盡了,轉化停止,此時過表達菌株中發酵液香蘭素質量濃度達到了11.06 g/L,而野生型菌株的底物阿魏酸殘余量為6.41 g/L,香蘭素的質量濃度為4.67 g/L(圖6-b、圖6-c)。過表達菌株代謝阿魏酸和生成香蘭素的速率均比野生型快,發酵時間比野生型縮短了一半,野生型在轉化94 h時香蘭素產量為7.77 g/L(圖6-c),過表達菌株比野生型產香蘭素的濃度提高了42.30%。上述搖瓶發酵結果證明了ech、fcs、ech2基因與香蘭素合成密切相關。

a-OD600;b-阿魏酸的質量濃度;c-香蘭素的質量濃度圖6 野生型菌株和過表達菌株對阿魏酸的轉化
本研究運用Illumina二代測序技術對擬無枝酸菌CCTCC NO:M2011265進行了全基因組的測序,獲得了64個scaffolds,總長度為8 425 551 bp,GC含量71.89%,包含8 185個預測編碼蛋白。同時對組裝的基因組進行了基因預測、功能注釋和聚類分析。最終獲得的這些基礎數據有益于從分子水平上認識擬無枝酸菌CCTCC NO:M2011265的生理功能、代謝特性。通過生物信息學分析得到香蘭素合成相關基因ech、fcs和ech2基因,其中ech和fcs為一個基因簇,香蘭素分解代謝相關基因,vdh基因,與已報道Amycolatopsissp.ATCC 39116香蘭素合成與分解代謝的基因一致。構建的過表達ech-fcs-ech2菌株代謝阿魏酸和生成香蘭素的速率均比野生型快,發酵時間比野生型縮短了一半。過表達菌株最終產香蘭素質量濃度為11.06 g/L,野生型為7.77 g/L,比野生型產香蘭素的濃度提高了42.30%,進一步證明了ech、fcs和ech2基因與香蘭素生物合成密切相關。