陳德純 周晏陽 周 瀧 楊發龍 湯 承
(西南民族大學 畜牧獸醫學院,成都 610041)
乳酸菌(Lactic acid bacteria)是一種能夠產生乳酸的革蘭氏陽性細菌,廣泛存在于自然界中,乳酸菌功能包括維持機體微生態平衡,抑制致病菌在宿主體內定植,并且能夠保護腸道粘膜完整性的作用[1]乳酸菌還可以提高機體免疫,通過激活腸道黏膜免疫反應,提高機體對致病菌的反應活性[2]。乳桿菌屬(LactobacillusBeijerinck)是乳酸菌中數量最多的屬分類,也是目前為止人類研究最多和應用最廣的一類益生菌。乳酸菌代謝過程中產生的細菌素為無毒副作用和耐藥性的生物活性的多肽[3]。細菌素獨特的的抗菌活性,有望在臨床抗感染領域發揮一定的作用?;谌樗釛U菌的特異性功效,越來越多的研究表明,乳酸菌是一種未來的抗生素替代品[4-5]。
全基因組測序(Whole-genome sequencing,WGS)可將細菌的完整基因組序列全部測序出來的技術,通過基因組序列的分析和基因功能分析(包括GO、KEGG、COG和NR等),更好地理解同屬種之間的差異。全基因組測序技術已成為了一種高效檢測手段,目前該技術已經在腸道菌群、土壤和真菌[6-8]微生物群落的分析鑒定中得到了應用。在深入挖掘核心基因組、鑒定特異基因以及功能基因組學研究方面具有重要的意義,為探究未知微生物類群多樣性和生物學特性的重要手段。
乳酸菌能夠調節腸道菌群的平衡,在機體內起到抑制致病菌的作用,在治療疾病方面具有代替傳統抗生素的潛力。長久以來人們一直致力于尋找能夠替代抗生素的益生菌。盡管很多研究表明乳桿菌在動物腸道能夠起到一定抑制致病菌的作用,但其在動物腸道疾病的治療應用上還很不成熟,并且乳桿菌在動物體內的具體作用機制仍不清楚?;诒菊n題組前期從牦牛糞便中分離出一株具有耐酸耐膽鹽特性的植物乳桿菌SWUN5815,研究表明其具有較強的抗菌活性,可增強小鼠的腸道免疫能力[9],是一種潛在的具有抗生素替代功能的益生菌,但其具體機體作用機制尚不清楚。針對此乳酸桿菌菌株,尚未從基因組水平揭示和闡釋其功能基因和代謝通路信息。因此,本研究采用PacBio RSII測序平臺對乳桿菌SWUN5815進行全基因組測序分析和GO、KEGG、COG和NR數據庫基因組基本功能注釋,從基因組水平進一步揭示該株乳桿菌的功能關鍵基因和代謝通路信息,為該菌株在尋找腸道抗生素替代品和食品添加劑的開發等方面的研究提供科學指導和生產實踐參考。
1.1.1菌株
牦牛源植物乳桿菌SWUN5815為西南民族大學畜牧獸醫學院臨床獸醫學團隊從川西北牦牛糞便中分離和篩選獲得[10]。
1.1.2相關試劑和儀器設備
乳酸細菌(MRS)固體培養基和MRS肉湯培養基(杭州微生物試劑有限公司),細菌基因組DNA提取試劑盒(DP302,天根生化科技(北京)有限公司)。
Pacbio測序儀(Pacbio RSII,Pacific Biosciences,USA),PCR儀(ABI GeneAmp?9700,ABI,USA),生化培養箱(上海一恒科技有限公司,中國)。
1.2.1牦牛源植物乳桿菌SWUN5815基因組DNA的提取
冷凍保存的SWUN5815菌株在MRS固體培養基涂板進行活化復蘇培養,再挑取單個菌落接種到MRS液體培養基中純化。培養12 h后提取細菌DNA,依據天根生化試劑盒說明書進行操作。純化的基因組DNA采用分光光度計檢測進行定量。高質量的DNA(OD260/OD280在1.8~2.0,質量濃度≥20 ng/μL)用于后續的建庫測序。
1.2.2文庫構建及庫檢
測序委托北京諾禾致源科技股份有限公司完成。質檢合格的菌株DNA樣品經Covaris g-TUBE剪切成小片段DNA。受損的DNA經修復后用DNA黏合酶連接接頭,使用AMpure PB磁珠對DNA片段進行純化,并構建SMRT Bell文庫。Buffer溶解,經片段篩BluePipin后分成固定大小片段,再次使用AMpure PB磁珠進行純化。二次得到的文庫使用Qubit進行濃度測定,Agilent 2 100對文庫質量質檢。采用第3代測序儀PacBioRS II對DNA進行測序。
1.2.3生物信息分析
過濾除掉低質量的reads后的clean date進行基因組組裝,包含菌株的基因組基因情況的序列文件進行評價;分析菌株基因組成分,涉及編碼基因(http:∥topaz.gatech.edu/GeneMark/)、重復序列及滾環(http:∥topaz.gatech.edu/GeneMark/)、tRNA(http:∥lowelab.ucsc.edu/tRNAscan-SE/)等基因成分的分析;然后對編碼基因進行功能注釋,包含的數據庫有GO數據庫(http:∥geneontology.org/)、KEGG(https:∥www.genome.jp/kegg/)、COG數據庫(http:∥www.ncbi.nlm.nih.gov/COG/)、針對病原微生物的數據庫(http:∥ardb.cbcb.umd.edu/)和NCBI數據庫(https:∥www.ncbi.nlm.nih.gov/);Treebest(Version 1.9.2)軟件構建系統發生樹。從基因組和基因兩層面分別比較樣品與參考基因組的差異;呈現基因組組分分析結果和功能注釋結果。
通過PacBio RSII測序平臺,對植物乳桿菌SWUN5815進行了完成圖測序,測序及預測結果如表1所示。SWUN5815染色體基因組組成為一個環狀基因組,大小為3.27 Mb,GC含量為44.59%。SWUN5815存在多個質粒。GeneMarkS軟件對乳桿菌的基因組進行編碼基因預測,獲知SWUN5815的基因組有3 258個編碼基因,總長度為2 814 147 bp,平均長度864 bp,占基因組的84.13%。植物乳桿菌SWUN5815全基因組中轉座子的數量為64個,總長度為5 180 bp,平均長度為91 bp。長散在重復序列有34個,總長度為2 252 bp,占基因組的0.067 3%,平均長度為71 bp。短散在重復序列有10個,總長度為627 bp,平均長度為63 bp。滾環有3個,總長度為200 bp。植物乳桿菌SWUN5815基因組中含有69個tRNA,平均長度為77 bp,總長度為5 314 bp?;驆u的數量為12個,長度為152 316 bp。

表1 植物乳桿菌SWUN5815基因組統計Table 1 Genome statistics of SWUN5815
由圖1可以看出,SWUN5815基因組圈圖最外圈是基因組序列位置坐標。自外向內分別是編碼基因、基因功能注釋結果(依次為COG、KEGG和GO數據庫的注釋結果信息)、ncRNA、基因組GC含量和基因組GC skew值分布。編碼基因和基因功能注釋結果包括外側的正鏈和內側的反鏈組成。
最外圈的編碼基因顯示基因總長度為2 172 224 bp;第2圈為正鏈和負鏈的CDS(編碼序列)區域,不同的顏色代表不同的COG功能分類,編碼基因的數量為3 258個,其中COG注釋的基因為2 386個,占編碼基因的73.23%,涉及的分類包括新陳代謝、信息存儲與處理、細胞作用與信號傳遞和無明顯特征4個大分類,并在22個類型上包括轉錄、碳水化合物運輸和代謝、氨基酸轉運與代謝等得到了注釋;第3圈為正鏈和負鏈的CDS,不同的顏色代表不同的KEGG功能分類,1 144個基因分別在6大功能32個通路上得到功能注釋;第4圈為正鏈和負鏈的CDS,不同的顏色代表不同的GO功能分類,共獲得2 231個基因注釋,注釋得到41種功能特性;第5圈為ncRNA;第6圈為GC含量,向外的顏色代表GC含量高于全基因組平均GC含量,反之向內的顏色表示GC含量低于全基因組平均GC含量,峰值的絕對值表示兩者的差異;第7圈為GC-Skew值,正值代表正鏈易于轉錄為CDS,反之,負值時負鏈易于轉錄為CDS。基因組圈圖可以直觀的認識菌株基因組分布。

圖1 植物乳桿菌SWUN5815全基因組圖譜Fig.1 Genome map of SWUN5815
對預測得到的編碼基因進行基礎的功能注釋,與數據庫GO、KEGG、COG和NR等。SWUN5815基因組中所有基因能夠注釋到GO信息的基因數目為2 231個,可注釋到COG信息的基因數目為2 386個,與KEGG數據庫比對能夠定位到具體Pathway的基因數目有1 762個。

表2 植物乳桿菌SWUN5815基因功能統計分析Table 2 Statistical function analysis of SWUN5815
2.3.1GO(GeneOntology)數據庫注釋
GO為基因功能描述的分類系統,包括三大類:分子功能(Molecular function,簡稱MF)、細胞組分(Cellular component,簡稱CC)和生物過程(Biological process,簡稱BP)。植物乳桿菌SWUN5815在GO數據庫三大類統計結果如圖2所示:GO分類中共有2 231個基因進行了注釋,注釋得到41種功能分類。其中MF中基因數量參與最多的前三位是催化活性、結合和轉運活性;CC中細胞、細胞部分和高分子絡合物是基因數量最多的功能注釋;BP得到功能注釋最多的前三位是代謝過程、細胞過程和定位。與抗氧化活性相關的基因包括GM00057、GM000185、GM000750、GM002948和GM003068。參與免疫系統過程的基因涉及GM001449和GM003206。

圖2 植物乳桿菌SWUN5815基因功能注釋GO功能分類Fig.2 GO function classification map of SWUN5815
2.3.2KEGG數據庫注釋
植物乳桿菌SWUN5815的氨基酸序列,與KEGG數據庫進行比對,把目標物種的基因和其相對應的功能注釋信息結合起來,得到注釋結果。SWUN5815菌株在KEGG數據庫中共有1 144個基因分別在細胞過程、環境信息處理、遺傳信息處理、人類疾病、新陳代謝和生物體系統6大功能32個通路上得到功能注釋,結果如圖3所示。
注釋中涉及的代謝通路總數以及參與每個代謝通路的基因組數目,分析發現在代謝途徑、環境信息處理和遺傳信息處理得到較多的基因功能注釋。其中1 049個基因在代謝通路上得到注釋,12個代謝通路中,碳水化合物代謝相關的基因為223個,占代謝通路注釋基因(1 049)的21.26%。195個基因在環境信息處理層面得到注釋,其中與膜運輸相關的基因為136個,與信號傳導相關的基因59個。
其中細菌素和免疫相關基因的Pathway通路信息及其Pathway ID如表3所示。SWUN5815基因組中包含了參與抗生素、生物降解等代謝過程基因;可調控免疫和炎癥的通路(包括PPAR和RIG-I樣受體通路)的組織系統通路相關基因;可調節人類疾病的金黃色葡萄球菌感染的map05150有4種相關基因,包括GM001668、GM001141、GM001666和GM000529,在感染疾病通路水平上參與拮抗金黃色葡萄球菌感染。
GM000962基因參與原核生物糖代謝調控中,作用于萬古霉素類抗生素的生物合成。SWUN5815中GM000328和GM000663參與PPARs信號通路的調控。乳桿菌SWUN5815中含有1個基因GM000137參與RIG-I樣受體(維甲酸誘導基因I)信號通路的調控中。
2.3.3COG數據庫注釋
COG蛋白數據,能夠根據細菌完整基因組的編碼蛋白系統進化關系分類,并將每個蛋白序列注釋到相應的同源序列構成的COG簇中。
注釋得知植物乳桿菌SWUN5815含有合成MFS型轉運蛋白功能(Atg22 family)的序列,位于基因編號是GM002542。合成膜蛋白Yag U的功能序列(DUF1440 family),基因組編號是GM002449。還包含4個合成ABC型抗菌肽轉運系統的功能序列,基因組編號分別是GM000256、GM002379、GM002450和GM002479。

圖3 植物乳桿菌SWUN5815基因功能注釋KEGG代謝通路Fig.3 The gene KEGG pathway classification map of SWUN5815

表3 植物乳桿菌SWUN5815基因組細菌素和免疫調控通路及其相關基因Table 3 Related genes of bacteriocins and immune regulatory pathways in SWUN5815 genome

C:能源生產和轉換(119);D:細胞周期控制,細胞分裂,染色體分裂(39);E:氨基酸轉運與代謝(231);F:核苷酸轉運和代謝(108);G:碳水化合物運輸和代謝(272);H:輔酶轉運與代謝(129);I:脂質轉運與代謝(101);J:翻譯、核糖體結構與生物發生(204);K:轉錄(276);L:復制、重組和修復(107);M:細胞壁/膜/包膜生物發生(150);N:細胞運動(16);O:翻譯后修飾,蛋白質轉換,伴侶(83);P:無機離子轉運與代謝(134);Q:次生代謝產物生物合成、運輸和分解代謝(39);R:僅一般功能預測(252);S:功能未知(176);T:信號轉導機制(112);U:細胞內運輸、分泌和囊泡轉運(17);V:防御機制(71);W:細胞外結構(3);X:運動組:原噬菌體,轉座子(45);括號內數字代表匹配的基因數 C: Energy production and conversion (119); D: Cell cycle control, cell division, chromosome partitioning (39); E: Amino acid transport and metabolism (231); F: Nucleotide transport and metabolism (108); G: Carbohydrate transport and metabolism (272); H: Coenzyme transport and metabolism (129); I: Lipid transport and metabolism (101); J: Translation, ribosomal structure and biogenesis (204); K: Transcription (276); L: Replication, recombination and repair (107); M: Cell wall/membrane/envelope biogenesis (150); N: Cell motility (16); O: Posttranslational modification, protein turnover, chaperones (83); P: Inorganic ion transport and metabolism (134); Q: Secondary metabolites biosynthesis, transport and catabolism (39); R: General function prediction only (252); S: Function unknown (176); T: Signal transduction mechanisms (112); U: Intracellular trafficking, secretion, and vesicular transport (17); V: Defense mechanisms (71); W: Extracellular structures (3); X: Mobilome: prophages, transposons (45); The number in brackets represented the number of matched genes圖4 植物乳桿菌SWUN5815 COG功能分類Fig.4 COG function classification chart of SWUN5815
2.3.4NR數據庫注釋和進化分析
NR數據庫統計得到植物乳桿菌SWUN5815注釋到的物種及基因數目統計結果如圖5。
基于NCBI數據庫已知的植物乳桿菌全基因組和植物乳桿菌SWUN5815全基因組用Treebest(Version 1.9.2)軟件,采用NJ法構建系統發生樹,物種之間的進化樹繪制如圖6植物乳桿菌SWUN5815與植物乳桿菌WCFS1進化最為相似達99.97%。
對植物乳桿菌SWUN5815潛在的細菌素基因進行挖掘,如表4,SWUN5815含有18個的II類細菌素相關編碼基因。其中PlnA、PlnE、PlnF、PlnJ、PlnK、PlnN、PlnQ和PlnM合成對應的細菌素;PlnA以及PlnN屬于Ⅱc類細菌素;PlnE、PlnJ、PlnK和PlnF屬于Ⅱb類雙肽類細菌素。
本研究采用PacBio RSII 3代高通量測序技術對分離牦牛糞便的具有益生特性的植物乳桿菌SWUN5815進行全基因組測序,經序列拼接組裝后,確定該菌株基因組大小為3.27 Mb,GC含量為44.59%的微生物類群,同時將整合的基因組數據與GO、KEGG、COG和NR等數據庫進行注釋分析,完成菌株基因組功能的注釋及數據統計工作,從分子生物學的角度探究了該菌株的生物學特性以及基因組功能特性。

1:植物乳桿菌(2882);2:乳酸菌(65);3:戊糖乳桿菌(47);4:副植物乳桿菌(44);5:干酪乳桿菌(10);6:蠶豆乳桿菌(9);7:乳酸桿菌噬菌體(5);8:副干酪乳桿菌(5);9:大腸桿菌(4);10:布氏乳酸桿菌(4);11:短乳桿菌(3);12:棒狀乳桿菌(3);13:戊糖球菌(3);14:酒明串珠菌(2);15:乳酸桿菌(2);16:酸性乳酸球菌(2);17:腸系膜明串珠蟲(2);18:諾登斯乳桿菌(2);19:動物乳桿菌(2);20:解淀粉乳桿菌(2);括號內數字代表匹配的基因數量 1: Lactobacillus plantarum (2 882); 2: Lactobacillus (65); 3: Lactobacillus pentosus (47); 4: Lactobacillus paraplantarum (44); 5: Lactobacillus casei (10); 6: Lactobacillus fabifermentans (9); 7: Lactobacillus phage (5); 8: Lactobacillus paracasei (5); 9: Escherichia coli (4); 10: Lactobacillus buchneri (4); 11: Lactobacillus brevis (3); 12: Lactobacillus coryniformis (3); 13: Pediococcus pentosaceus (3); 14: Oenococcus oeni (2); 15: Lactobacillales (2); 16: Pediococcus acidilactici (2); 17: Leuconostoc mesenteroides (2); 18: Lactobacillus nodensis (2); 19: Lactobacillus animalis (2); 20: Lactobacillus amylolyticus (2); The number in brackets represented the number of matched genes圖5 植物乳桿菌SWUN5815 NR注釋圖Fig.5 NR annotation diagram of SWUN5815

圖6 植物乳桿菌SWUN5815物種間的系統進化樹Fig.6 Phylogenetic relationship among SWUN5815 and other species

表4 植物乳桿菌SWUN5815潛在的細菌素相關基因Table 4 Potential bacteriocin related genes of SWUN5815
通過基因功能GO注釋分析得知SWUN5815基因組中包括5個基因參與抗氧化活性過程,2個基因參與免疫過程。前期研究表明,牦牛源植物乳桿菌SWUN5815可促進小鼠的生長發育和腸粘膜免疫功能[9],這可能與SWUN5815中存在的抗氧化基因和免疫過程相關基因有關。KEGG數據庫中有1 144個基因在32個通路得到功能注釋,SWUN5815基因組中包含了抗生素和生物降解等代謝過程;可調控免疫和炎癥的通路(包括PPAR和RIG-I樣受體通路)的組織系統通路相關。GM000962基因參與原核生物糖代謝調控中,參與萬古霉素類抗生素的生物合成。SWUN5815中有GM000328和GM000663參與PPARs信號通路的調控,該通路與能量(脂、糖)代謝、細胞分化、增殖、凋亡和炎性反應等密切相關[11]。植物乳桿菌SWUN5815菌株中基因GM000137參與RIG-I樣受體(維甲酸誘導基因I)信號通路的調控中。RIG-I 樣受體是一種固有免疫的模式識別受體,可識別非自身的病毒RNA,同時激活RIG-I信號通路并促成細胞因子的生成,發揮出抗病毒的功效[12]。這可能是植物乳桿菌具有抗病毒作用的原因。COG功能分類顯示,植物乳桿菌SWUN5815其含有合成參與膽汁耐受基因(MFS型轉運蛋白功能Atg22序列)和耐酸性基因(DUF1440 family序列)[13]。這與乳桿菌SWUN5815具有耐膽汁、耐酸的特性相吻合。植物乳桿菌SWUN5815來源于高原環境的牦牛腸道,是一株特異性的對腸道有益的功能菌。
通過基因功能注釋NR分析得知SWUN5815全基因組中含有18種已知細菌素基因。細菌素有較強的抑菌活性,也被認為是未來抗生素最有效的替代物。SWUN5815全基因組中包含PlnA、PlnE、PlnF、PlnJ、PlnK、PlnN、PlnQ和PlnM合成對應的Ⅱ類細菌素,其中PlnE、PlnJ、PlnK和PlnF屬于Ⅱb類雙肽細菌素[14],PlnA和PlnN屬于Ⅱc類環狀細菌素。細菌素的抗菌機制是穿過病原菌的細胞膜,增加其滲透性,導致離子流失以及膜電位的消耗,最終導致病原菌的死亡[15]。細菌素PlnP、PlnL和PlnM功能是輔助合成細菌素免疫蛋白,可以防止菌株被自身分泌的細菌素殺滅[16];PlnB、PlnC和PlnD是編碼三組分調節系統的細菌素,參與生物膜成熟過程[17-18];PlnG與ABC轉運系統相關,負責將細菌素分泌到胞外;PlnN、PlnU和PlnV是與膜蛋白合成等相關的細菌素[19]。SWUN5815具有多種功能的細菌素,這與前期研究乳桿菌SWUN5815能夠抑制腸道病原菌減輕腹瀉[20]的結果一致。COG注釋分析發現有4個合成ABC型細菌素轉運系統的功能序列,是細菌素轉運和分泌的必要因素,說明植物乳桿菌SWUN5815擁有一套完整的細菌素合成和運輸體系,保證了菌株的抑菌特性。
綜上,牦牛乳桿菌SWUN5815基因組序列的解析,為研究該菌株的功能特性基因提供了大量的依據,也為研究產生細菌素的該菌株的抗菌機理提供理論依據。為今后深入開展抗生素替代品的益生菌飼料添加劑的研究提供了重要的參考數據。