王玉霞,崔 霞,周海軍,穆 軍
(浙江海洋大學海洋科學與技術學院,浙江舟山 316022)
微生物絮凝劑作為一種綠色環保的水處理劑,往往因高生產成本和復雜的發酵、回收過程而限制了其工業化投入,因此越來越多的研究者投入到開發新的生物絮凝劑資源,菲律賓蛤仔黏附污泥(Ruditapes philippinarum conglutination mud,RPM)就是一種被報道的水產養殖廢物利用的天然生物絮凝劑資源,能克服其昂貴的成本和發酵過程,具有很好的前景[1-4]。研究表明RPM 無論是對高嶺土懸浮液的絮凝率還是不同染料的脫色率均高達90%以上,具有高效的絮凝活性,而RPM 的共附生細菌被報道為絮凝活性的主要承擔者,且從RPM 中已經分離得到了17 株產生物絮凝劑菌株,胞外多糖被認為是這些細菌代謝的絮凝活性物質[1-8]。
本研究從RPM 中分離、篩選獲得1 株新的高絮凝活性菌株GHS18,先對其進行16S rDNA 分型鑒定、生理生化特征測定將其鑒定到物種,然后基于基因組學水平對菌株GHS18 進行全基因組的框架掃描測序,基因預測以及功能注釋來分析菌株GHS18 產絮凝活性物質的分子水平依據,為該菌株未來的深入研究奠定基礎。
從抗生素培養獲得的具有絮凝活性的RPM 中分離純化獲得產絮凝劑菌株。
菌株的絮凝率測定參照MU Jun,et al[1]使用的方法。取93 mL 4 g·L-1高嶺土懸浮液、5 mL 10 g·L-1氯化鈣溶液和2 mL 待測菌株GHS18 的菌懸液于250 mL 燒杯中,pH 調至7.5。200 r·min-1快速攪拌混合液1 min,然后80 r·min-1慢速攪拌2 min。靜置10 min 后,取液面下1 cm 處懸濁液于分光光度計測定OD值,吸光度為550 nm,測得值記為A0空白對照組以2 mL 去離子水代替待測菌液,測得OD 值記為A0。菌株的絮凝率(flocculation rate,FR)計算公式為:

A0和A 分別為空白對照組和待測樣品組的OD550值。
菌株GHS18 的形態特征、生理生化指標、生長溫度與鹽度范圍、胞外酶活性檢測、碳源的利用測定方法參照《伯杰氏細菌鑒定手冊》[9]、《常見細菌系統鑒定手冊》[10]以及BAUMANN,et al[11]。
將菌株GHS18 接種到液體培養基中恒溫25 ℃培養10 h 后使用TaKaRa 全基因組提取試劑盒(DNA Extraction Kit Ver.3.0)進行核酸DNA 的抽提。擴增引物為27F(5'-AGA GTTTGATCATGG CTC AG-3')和1492R(5'-TAC GGTTACCTGTTACGACTT-3')[12],反應體系終體積為20 μL,包括2.0 μL 10×Ex Taq buffer、1.6 μL 2.5 mM dNTP mix、5p 引物、0.5 μL 模板、0.2 μL Ex Taq,加ddH2O 補至終體積。擴增程序為:95 ℃,5 min;95 ℃,30 s,55 ℃,30 s,72 ℃,90 s,24 個循環;72 ℃,10 min。擴增結果以凝膠電泳進行檢測,檢測合格后使用ABI 3730XL 測序儀進行測序。
將測序拼接后的序列于EzBioCloud(http://www.ezbiocloud.net)進行blast 比對,將菌株鑒定到種屬水平。菌株GHS18 的16S rDNA 序列上傳到NCBI 數據庫,登錄號為KX702262。選取比對結果中相似度高的模式菌株及外間組模式菌株通過軟件MEGA7 進行系統發育樹的構建。
將菌株GHS18 純培養后提取基因組DNA,利用1%瓊脂凝膠電泳檢測并收集抽提的DNA。對質檢后收集的DNA 進行300~500 bp 片段化,然后使用TruSeqTMDNA Sample Prep Kit 進行文庫構建,TruSeq PE Cluster Kit 進行橋式PCR,最后使用Truseq SBS Kit 利用Illumina 測序技術對DNA 進行paired-end(PE)測序。將測序得到的原始數據進行有效數據的統計、序列拼接(SOAPdenovo v2.04 軟件)、序列矯正(GapCloser v1.12 軟件),得到拼接后的序列,以便進行下一步分析。
對拼接后的序列進行rRNA/tRNA 的查找(RNAmmer-1.2 和tRNAscan-SE v1.3.1 軟件)、串聯重復序列預測(http://tandem.bu.edu/trf/trf.basic.submit.html)[13]、插入序列預測(https://www-is.biotoul.fr/)[14]、基因的功能預測(Glimmer 3.02 軟件),并將預測基因的蛋白序列與Nr、genes、string 和GO 數據庫進行blastp 比對(BLAST 2.2.28+軟件),得到預測基因的功能注釋信息。
分離純化的單菌株GHS18 恒溫25 ℃純培養10 h,測得其絮凝率為75.1%。比對結果顯示菌株GHS18的16SrDNA 序列與Pseudoalteromonas paragorgicola KMM 3548T 和P.distincta ATCC 700518T 序列具有99.92%的相似性。菌株GHS18 的系統進化發育樹如圖1,低于80%的值被隱藏,由圖1 可知,菌株GHS18與P.paragorgicola 和P.distincta 聚集在一個分支。

圖1 菌株GHS18 的系統進化發育樹Fig.1 The phylogenic tree of strain GHS18
菌株的生理生化指標測定結果見表1。由表1 可知,菌株GHS18 為桿狀菌,革蘭氏陰性菌,具有極性鞭毛,出現黃色色素沉著;生長鹽度耐受范圍與模式菌株相比,由1%~6%提升到了10%;高溫不耐受,37 ℃無法生長;能產生淀粉酶;能利用葡萄糖、阿拉伯糖、半乳糖、麥芽糖、甘露醇、木糖,而蜜二糖、乳糖、山梨糖醇、檸檬酸鹽均無法利用。與模式菌株的理化特征比對,結合16S 序列比對和系統發育樹結果,菌株GHS18 被鑒定為P.paragorgicola。

表1 菌株GHS18 的生理生化特征測定結果Tab.1 The results of biochemical tests of strains GHS18
為了深入研究產絮凝物質的菌株GHS18 分子機制,本研究利用Illumina 技術對菌株GHS18 的基因組進行了框架掃描測序,序列拼接為43 個大框架序列,總長度為4 691 518 bp,其中43 個框架序列長度均大于1 000 bp,最長框架為536 748 bp,框架N50 為227 074 bp,N90 為68 684 bp,GC 含量為39.191 mol%。將菌株GHS18 拼接后的序列進行與基因預測,包含11 個rRNA、94 個tRNA 和4 342 個基因。
通過TRF(tandem repeat finder)對菌株GHS18 的基因組進行串聯重復序列的在線預測,共預測到142條串聯重復序列,57.7%的序列匹配分值為50~100,19.7%的序列匹配分值為101~500,其余匹配分值大于500,表明菌株GHS18 的基因組中多存在短串聯重復序列。通過IS Finder 對菌株GHS18 的插入序列進行在線預測,7 條潛在的插入序列被篩選出,篩選結果以E-value(0.001)為標準,IS3 和IS110 序列家族各含有3 條,1 條屬于IS91 家族。
將注釋基因與COG 數據庫進行比對,結果表明2 608 個(60.1%)基因具有COG 編號,即具有明確的生物學功能(見圖3)。其中,COG 功能一級分類中參與代謝的蛋白數最多,高達1 109 個(42.5%),其次是參與細胞內進程和信號傳導功能(31.3%),以及信息儲存和處理(21.0%)。COG 功能二級分類中,擁有最多功能基因的是E(氨基酸轉運和代謝,9.7%)、類別J(翻譯、核糖體結構和生物發生,9.2%)、T(信號轉導機制,7.5%)和C(能源生產和轉換,6.9%)。參與次生代謝產物的生物合成、轉運和分解代謝功能的類別Q 僅占2.2%。

圖3 菌株GHS18 的COG 的功能分類Fig.3 The results of COG second level class in P.paragorgicola GHS18

圖2 菌株GHS18 的基因組CG 圖譜Fig.2 The CG view of P.paragorgicola GHS18
GO 功能注釋結果統計如圖4 所示,總共2 296 條列具有GO 數據庫的注釋信息,占預測總蛋白數目的52.9%。GO 功能分為生物學過程、細胞成分和分子功能三類。由圖可知,細胞內過程、單生物過程和代謝過程在生物學過程中占優勢,細胞部位、細胞膜部位、細胞膜和細胞是細胞組分中的優勢功能組,結合和催化活性在分子功能分類中占絕對優勢。作為具有絮凝活性的功能菌株GHS18,其在表達過程中需要大量的代謝、生物調控、代謝產物轉運等各種生物學過程互作,從而實現胞外多糖的產生,這些注釋功能占優勢的也與它們的菌體繁殖和代謝活動息息相關,因此菌株GHS18 基因組在GO 數據庫中進行功能注釋與這些生物過程相關的基因表達占優勢。

圖4 菌株GHS18 的GO 功能分類圖Fig.4 Functional classification of GO annotation in P.paragorgicola GHS18
將菌株GHS18 基因組預測的基因序列與KEGG 數據庫進行比對,結果顯示在菌株GHS18 基因組中預測的4 342 個全長基因中,有2 241 個基因(51.6%)匹配到KEGG 數據庫中的基因,且在其對應的代謝途徑上均進行了定位,共參與了193 條KEGG 的代謝途徑。其中參與代謝途徑的總共583 個基因,參與次生代謝產物的生物合成有256 個基因,參與不同環境的微生物代謝共有170 個基因。此外,參與碳代謝的有89 個基因,主要包含淀粉、蔗糖、氨基糖、核苷酸糖、果糖、甘露糖、肽聚糖、半乳糖、脂多糖的生物合成與代謝。
到目前為止,研究已經明確了一些具有絮凝活性的多糖物質的結構以及生物合成途徑,如纖維素、幾丁質、普魯蘭多糖、果膠、淀粉、海藻酸鈉和黃原膠[16-19]。合成途徑主要分為3 個步驟[20-21]:ⅰ)前體底物的合成;ⅱ)多糖的聚合和轉移;ⅲ)通過外膜分泌到胞外。其中報道的一些前體底物如UDP-Glucose、GDPmannose 和UDP-glucuronate 在菌株GHS18 中均能找到,這些前體的轉化為后續胞外多糖的聚合提供了基礎。而多糖聚合過程中的一些重復單元如UDP-Gal、dNTP-D-Glu、dNTP-L-Rham、UDP-3-O-(3-acetyl)-GlcNAc 也能在菌株GHS18 代謝中發現它們的生物合成,這些重復糖單元在對應的聚合酶/糖基轉移酶作用下聚合成多糖,奇怪的是,本研究中并未發現將重復單元聚合成胞外多糖的eps 基因簇,但菌株代謝具有絮凝活性的胞外多糖是不爭的事實,因此推測其具有與eps 基因簇相似的基因簇來代替行使其功能。由于國內外研究者對于產絮凝劑菌株的研究多集中于高絮凝活性菌株的分離篩選,或優化其培養的理化條件以期達到更高的產量,相較于其分子水平的研究存在很大的不足,因此對于菌株GHS18 的產絮凝劑依據按照當前研究證據來看還需要未來更進一步的研究。
將菌株GHS18 組裝后預測的基因注釋到NR 數據庫,有96.4%(4 187)的基因在NR 數據庫中獲得了注釋結果。對注釋到NR 數據庫基因的E 值進行統計,4.2%基因的E 值位于1×10-30~1×10-5,5.0%位于1×10-50~1×10-30,14.0%位于1×10-100~1×10-50,23.9%位于1×10-180~1×10-100。63.1%的基因序列具有100%的相似性,34.3%的相似性集中在80%~99%。注釋結果的物種分布表明,97.7%的預測基因與Pseudoalteromonas sp.有相似的同源序列,其中62.4%(相對于注釋到Pseudoalteromonas sp.中相似基因的百分比,下同)的預測基因與P.haloplanktis 相似,11.2%的預測基因與P.arctica 相似。由于目前對于P.paragorgicola 物種的全基因組學研究尚未完善,因此菌株GHS18 的基因注釋功能偏向于進化分類學分支相隔較近的物種也是合理的。
將菌株GHS18 的預測基因注釋到Swiss-Prot 數據庫,2 818 個基因在該數據庫有注釋信息,占總基因數的64.9%。對E 值分布進行統計,5.3%基因的E 值處于1×10-10~1×10-5,25.0%位于1×10-30~1×10-5,13.9%位于1×10-50~1×10-30,24.2%位于1×10-100~1×10-50。1.9%的基因序列具有100%的相似性,23.3%的相似性集中在80%~99%,36.6%相似性為60%~79%,24.5%相似性為50%~59%。
通過antiSMASH 對菌株GHS18 的序列進行次級代謝產物合成基因簇預測,分別在GHS18_scaffold1、GHS18_scaffold9、GHS18_scaffold10、GHS18_scaffold16 和GHS18_scaffold22 序列中各預測到1 個基因簇,分別為細菌素、細菌素、間二苯酚和芳基多烯、細菌素和四氫嘧啶合成基因簇。
從RPM 中分離篩選的1 株新的高絮凝活性菌株GHS18 通過16S rDNA 序列比對和生理生化特征結果鑒定為P.paragorgicola,絮凝活性為75.1%。通過一系列的預測對菌株GHS18 的基因組進行了初步分析,一共預測到了94 個tRNA,11 個rRNA,142 條串聯重復序列,7 條插入序列,4 342 個基因和5 個次級代謝產物合成基因簇。將預測的基因進行數據庫的注釋,60.1%、52.9%、51.6%、96.4%、64.9%的基因分別在數據庫COG、GO、KEGG、NR 和Swiss-Prot 匹配到了相應的注釋信息。在菌株GHS18 的功能注釋中發現了一些產絮凝活性多糖的代謝途徑中重要的前體底物、重復單元以及一些調控基因,然而未找到eps 基因簇,推測該菌株具有類似的基因簇來代替其行使相應的功能,這也可能是目前這一類研究領域數據大量缺乏的原因,如果需要進一步探索菌株的代謝通路,未來還需要更深入的分子水平研究。