閆更軒,王向向,田 緣,3,劉治廷,張淑梅,夏海華
(1.黑龍江省科學院微生物研究所,哈爾濱 150010;2.東北林業大學生命科學學院,哈爾濱 150040;3.東北農業大學食品學院,哈爾濱 150030)
解淀粉芽孢桿菌(Bacillus amyloliquefaciens)是一種革蘭氏陽性兼性厭氧菌,在28~37 ℃、pH 6.5~7.0 的條件下適宜生長。解淀粉芽孢桿菌生長速度快、產量高、安全無致病性,可以合成多種具有抑菌活性的次級代謝產物,包括脂肽、抑菌蛋白及聚酮化合物等,是發酵工業的重要宿主菌株[1]。脂肽作為一類由親水性肽鏈和親脂性脂肪烴鏈組成的兩親性表面活性劑,主要包括表面活性素(Surfactin)、豐原素(Fengycin)以及伊枯草菌素(Iturin)三大類[2]。多數脂肽具有抗菌活性,在細菌或真菌病害防治中發揮重要作用。表面活性素對藤黃微球菌具有強烈的抑制作用;豐原素可有效抑制灰霉病菌、稻瘟病菌的生長;伊枯草菌素可對分布于多種環境中的白色念珠菌起到抑制生長作用,為果實保鮮中念珠菌的污染防治提供了新策略[3-6]。
解淀粉芽孢桿菌是生產脂肽的重要菌株,但受菌種本身基因表達限制,目前脂肽的發酵產量十分有限,應用基因工程技術進行菌種創制有望成為提高脂肽產量的重要策略。研究發現,解淀粉芽孢桿菌TF28 在脂肽產量上具備優勢,TF28 菌株的脂肽合成水平受碳源類型的影響較大[7],探究脂肽合成途徑和碳源利用及碳代謝過程的關聯對提高脂肽的產量有重要意義。本研究分別對在以葡萄糖、果糖和木糖為主要碳源條件下培養的菌株轉錄組進行比較研究,為揭示碳源代謝與脂肽合成調控途徑間的關聯性提供有力依據。
1.1.1 試劑和儀器 葡萄糖、果糖、木糖、酵母膏、硫酸銨、硫酸鎂、氯化鈣、硫酸錳、磷酸二氫鉀、磷酸氫二鈉均為市售分析純。細菌總RNA 提取試劑盒購自Tiangen 公司,反轉錄試劑盒PrimeScript RT reagent Kit 及熒光定量PCR 試劑盒TB Green?Premix Ex Taq?(Tli RNaseH Plus)購自Takara 公司,-80 ℃超低溫冰箱購自Thermo 公司,ABI StepOne 熒光定量PCR 儀購自美國應用生物系統公司。
1.1.2 菌株 解淀粉芽孢桿菌TF28 由(此處隱去單位)保藏。
1.1.3 培養基 復蘇培養基:牛肉膏8.0 g/L,酵母膏5.0 g/L,根據接種類型分別額外添加10.0 g/L 的葡萄糖、果糖和木糖。
葡萄糖培養基:葡萄糖40 g/L,酵母膏2 g/L,硫酸銨2 g/L,硫酸鎂2.11 g/L,氯化鈣0.1 g/L,硫酸錳0.1 g/L,磷酸二氫鉀1.5 g/L,磷酸氫二鈉3 g/L。
果糖培養基:將葡萄糖培養基中的葡萄糖替換為等量的果糖。
木糖培養基:將葡萄糖培養基中的葡萄糖替換為等量的木糖。
1.2.1 樣品處理 以葡萄糖、果糖和木糖為碳源(以下分別簡稱為葡萄糖組、果糖組及木糖組),將保藏的解淀粉芽孢桿菌TF28 純化后接種于復蘇培養基中,振蕩培養至對數期(約10 h),按1%的接種量分別轉接至葡萄糖培養基、果糖培養基和木糖培養基中,繼續培養至對數期,培養條件為30 ℃,180 r/min。培養后的菌體離心(4 000 r/min,5 min),去除上清液,液氮速凍后利用干冰運輸至上海生工生物有限公司,采用Total RNA Extractor 試劑盒提取各樣品總RNA,并通過Qubit2.0 RNA 檢測試劑盒進行RNA 質量檢測,構建文庫并完成轉錄組測序。測序平臺為Illumina,每組樣品進行3 次生物學重復。以葡萄糖為碳源生長的解淀粉芽孢桿菌TF28 為對照組(葡萄糖組),以果糖、木糖為碳源生長的解淀粉芽孢桿菌TF28 為試驗組(分別為果糖組、木糖組)。
1.2.2 轉錄組測序數據處理 原始序列(Raw reads)需完成數據質控,通過Trimmomatic 軟件對雙端序列進行過濾,以獲得相對純凈的測序有效數據[8]。應用Bowtie2 軟件將有效數據映射至解淀粉芽孢桿菌TF28 參考基因組上(https://www.ncbi.nlm.nih.gov/genome/848?genome_assembly_id=217758),利用BEDTools 完成基因覆蓋率統計分析[9]。
1.2.3 基因表達差異分析 基因表達水平的計算通過FPKM(Fragments per kilobase of exon per million fragments mapped)方法完成。以葡萄糖組解淀粉芽孢桿菌TF28 基因為對照,使用DESeq2 進行基因表達差異分析,分別計算果糖組、木糖組解淀粉芽孢桿菌TF28 基因轉錄豐度,挖掘差異基因,基因表達量差異倍數Log2(FC)>1,P<0.05[10]。
1.2.4 基因聚類分析 通過WEGO(http://wego.genomics.org.cn)將全部差異基因映射至Gene ontology(GO)數據庫的各個條目,統計在不同條目下差異基因富集數量。應用Cluster profiler 完成Kyoto encyclopedia of genes and genomes(KEGG)通路富集分析,計算KEGG pathway 各層級上富集的差異基因數量[11]。富集分析均覆蓋全部基因組,通過超幾何分布計算差異基因顯著富集的條目或通路。
1.2.5 實時熒光定量PCR 驗證 基于實時熒光定量PCR(Real-time quantitative PCR,RT-qPCR)技術檢測葡萄糖組、果糖組和木糖組的解淀粉芽孢桿菌TF28 差異基因表達水平,與轉錄組測序結果進行對比,驗證轉錄組測序結果的準確性。根據解淀粉芽孢桿菌TF28 的全基因組設計RT-qPCR 檢測引物(表1),引物委托蘇州金唯智有限公司合成。解淀粉芽孢桿菌TF28 的總RNA 提取參考Tiangen 總RNA 提取試劑盒說明文檔,總RNA 經檢測合格并定量后,應用PrimeScript RT reagent Kit 將RNA 逆轉錄為cDNA,以cDNA 為模板進行RT-qPCR 檢測。RT-qPCR 反應體系為:TB Green Premix Ex Taq 10 μL,cDNA 模板2 μL,上、下游引物(10 μmol/L)各0.4 μL,ROX Reference Dye 0.4 μL,滅菌去離子水6.8 μL。PCR 反應條件為:預變性95 ℃30 s;95 ℃5 s、60 ℃30 s,40 個循環;72 ℃10 min。TF28 菌株的16S rRNA 作為內參基因,采用2(-ΔΔCT)方法統計各基因的相對表達水平。

表1 RT-qPCR 引物序列
測序堿基質量主要受試劑、儀器及菌體RNA 質量的影響,直接反應出測序結果的可信度。堿基質量值的計算公式為:
式中,Q表示堿基質量值,e表示堿基識別出錯的概率。
分別對葡萄糖組、果糖組和木糖組的菌體轉錄組過濾前后測序數據質量進行統計,結果見表2、表3。

表2 測序原始數據質量統計

表3 測序后過濾數據質量統計
葡萄糖組樣品的轉錄組共包含35 711 663 條reads,過濾后得到34 889 479 條reads;果糖組樣品的轉錄組共包含27 418 183 條reads,過濾后得到26 783 949 條reads;木糖組樣品的轉錄組共包含22 327 617 條reads,過濾后得到21 777 502 條reads;葡萄糖組、果糖組、木糖組樣品的轉錄組中有效reads 數量占總reads 數量的比重分別為97.70%、97.69%、97.54%,均大于97.00%;過濾后,各組樣品Q20均大于98.00%,Q30均大于94.00%,GC 含量均大于48.00%。綜上,此次測序數據質量可用于后續相關研究。
應用Bowtie2 軟件將過濾后的數據與解淀粉芽孢桿菌TF28 基因組進行比對,結果見表4。3 組樣品的轉錄本定位至解淀粉芽孢桿菌TF28 基因組上的reads 數、多重比對reads 數占總reads 數量的比例分別超過98.00%、1.00%,表明本研究的所有樣品均未受到其他外源生物轉錄本的污染。

表4 過濾后的數據與TF28 基因組的比對結果
本研究共分析了解淀粉芽孢桿菌TF28 參考基因組上3 948 個基因的表達水平。基因表達水平通過FPKM(Fragments per kilobase of exon per million fragments mapped)來衡量,FPKM同時考慮了測序深度和基因長度對讀長數量的影響,是目前常用的基因表達水平估算方法。各樣品基因表達水平的情況如表5 所示。碳源改變將對解淀粉芽孢桿菌TF28 的基因表達水平分布趨勢造成影響。與對照相比,以果糖、木糖為碳源的樣品組檢測到的高水平表達基因(FPKM>100)數量較多,具備研究價值。

表5 不同表達水平分布區間的基因數統計
通過統計各基因表達量,篩選差異基因,繪制火山圖,結果如圖1 所示。以葡萄糖為碳源的樣品為對照,果糖作為碳源的樣品可獲得差異基因688 個,其中上調基因522 個,下調基因166 個,差異基因占全部檢測基因的17.43%;木糖作為碳源的樣品可獲得差異基因855 個,其中上調基因691 個,下調基因164 個,差異基因占全部檢測基因的21.65%;果糖和木糖作為碳源的樣品共有的差異基因為594 個,其中表達量增加的基因383 個,表達量下降的基因125個,表達趨勢不同的基因86 個。

圖1 差異基因火山圖
對差異基因進行GO 注釋分析,圖2 顯示了包含以果糖、木糖為碳源的樣品組全部差異基因的注釋結果。相對于以葡萄糖為碳源的對照組,差異基因屬于生物過程(Biological process)分類的主要包括代謝過程(Metabolic process)、細胞進程(Cellular process)、定位(Localization)等;屬于細胞組分(Cellular component)分類的主要包括細胞(Cell)、細胞器(Cell part)以及細胞膜(Membrane)等;屬于分子功能(Molecular function)分類的主要包括催化活性(Catalytic activity)、結合(Binding)以及轉運活性(Transporter activity)等。上述GO 注釋分析結果顯示,碳源種類的改變影響了許多解淀粉芽孢桿菌TF28 中參與代謝合成、酶的表達、胞內代謝物轉運等進程的功能基因表達量,可能會對該菌能夠合成的次級代謝產物類別及水平產生影響。

圖2 差異基因的GO 注釋結果
對差異基因進行KEGG 富集分析,以明確差異基因參與的主要生化代謝途徑及信號轉導途徑。對差異基因在各個代謝途徑的富集情況進行統計,結果如圖3 所示。以果糖為碳源的樣品組差異基因富集于115 個代謝途徑中,富集程度較高的代謝途徑主要包括ABC 轉運子(ABC transporters)、纈氨酸、亮氨酸和異亮氨酸的生物合成(Valine,leucine and isoleucine biosynthesis)、果糖和甘露糖代謝(Fructose and mannose metabolism)、生物素代謝(Biotin metabolism)等,而包含了最多差異基因的代謝途徑主要包括ABC 轉運子(ABC transporters)、氨基酸生物合成(Biosynthesis of amino acids)等;以木糖為碳源的樣品組差異基因富集情況略有差別,富集程度較高的生物素代謝(Biotin metabolism)被半胱氨酸和蛋氨酸代謝(Cysteine and methionine metabolism)及脂肪酸生物合成(Fatty acid biosynthesis)所取代,此外,差異基因分布于雙組分系統(Two-component system)、群體感應(Quorum sensing)等代謝途徑中的數量較多。

圖3 差異基因KEGG 富集散點圖
雙組分系統直接調控細菌絕大多數生理過程,包括細菌的趨化性、感知滲透壓、孢子的形成、營養元素的代謝以及次級代謝產物的合成等,在芽孢桿菌中,對脂肽的合成有重要影響,因此該途徑中的差異基因類型值得關注[12]。通過統計差異基因數量,發現木糖組分布于雙組分系統的差異基因有21個,而果糖組只有10 個。基于2 組共有的差異基因所表達的蛋白類型進行COG 注釋,發現差異基因主要編碼脂肪酸去飽和酶(Fatty acid desaturase,TH57_RS14500)、信號轉導組氨酸激酶(Signal transduction histidine kinase,TH57_RS14505)等,表明上述基因可能在脂肽合成過程中起調控作用。
為評估RNA-Seq 結果的可靠性,隨機篩選6 個差異基因,通過RT-qPCR 對基因的相對表達水平進行檢測,并和轉錄組測序結果進行對比(圖4)。結果表明,各差異基因在果糖組及木糖組中的表達水平變化趨勢與轉錄組測序結果一致,說明本研究RNA-Seq 檢測數據的可信度較高。
脂肽的兩親性結構賦予了其高效的抗菌生物活性,在農作物病害防治領域具有廣闊的應用前景。脂肽的生物安全性高,既可應用于生物防治,也可應用于蔬菜和水果的運輸保藏,且保藏效果相較一些常見的保鮮劑更具優勢[13]。然而,現有脂肽發酵技術仍然難以實現較高的產率,其原因在于野生菌種次級代謝產物類型多樣、合成調控網絡復雜、受菌體生理活性限制等。脂肽的合成同時包含側鏈脂肪酸合成、脂肪酸活化及氨基酸配位等過程,其中有大量基因發揮各自的調控作用[14]。為提高菌種合成脂肽效率,可應用合成生物學技術,明確調控基因的類別和功能,通過定向改造優勢底盤菌株的代謝通路來增強脂肽的合成調控系統,包括群體感應系統、雙組分系統等,為脂肽生產菌株的改良提供遺傳資源。
有研究表明,芽孢桿菌的脂肽產率受培養碳源類型的影響,例如果糖作為碳源時,枯草芽孢桿菌中豐原素及表面活性素的合成量更高[15]。為挖掘調控脂肽合成的關鍵基因,本研究以解淀粉芽孢桿菌TF28 為樣品,通過轉錄組測序分析該菌株在葡萄糖、果糖和木糖3 種碳源條件下基因表達水平差異情況。與葡萄糖組相比,在果糖組、木糖組中篩選到較多的差異基因,但果糖組和木糖組間的差異基因數量較少,表明解淀粉芽孢桿菌TF28 在不同碳源條件下,其碳代謝途徑和效率存在差異。
脂肽為脂質與氨基酸的化合物或復合體,KEGG 富集結果顯示,在替換為能夠提高脂肽產率的碳源(果糖、木糖)后,部分氨基酸合成途徑相關基因表達水平發生顯著變化,如用于合成表面活性素及豐原素的蘇氨酸(ko00260,16 個差異基因)、纈氨酸(ko00290,11 個差異基因)等;脂肪酸合成途徑(ko00061,14 個差異基因)、脂肪酸降解途徑(ko00071,6 個差異基因)同樣發生了變化,結合各種脂肽產量的發酵檢測結果推測,脂肽的上游途徑可能得到了增強。下游脂肽合成途徑中,未篩選到表面活性素合成相關的差異基因,但在豐原素(TH57_RS04740,TH57_RS04715,TH57_RS04720)、伊枯草菌素(TH57_RS04875,TH57_RS20350,TH57_RS20340)中均檢測到表達量上調的基因,表明培養碳源類型的不同可能影響了脂肽合成相關基因表達。
在芽孢桿菌中,群體感應系統在脂肽操縱子表達的過程中起到重要調節作用[16]。在本研究發現phrC、aprE、lepB、oppABCDF、rapK、degU、spo0F、spo0B等群體感應調控基因均發生了上調,其中phrC、degU已被證實和脂肽的合成調控有關[17,18]。rapK是表面活性素的負調控因子,但本研究的測序結果顯示,rapK在果糖組和木糖組的表達量皆發生了上調,其對脂肽合成的調控作用可能需要進一步驗證[19]。此外,雙組分系統中許多基因的表達發生了改變,碳貯藏調控因子csrA的表達發生上調,表明碳代謝過程受到影響;PhoR/PhoP 雙組分系統被證實和表面活性素及豐原素的合成有關,而其下游的調控因子phoA的表達在果糖組和木糖組中均下調,意味著phoA可能和脂肽的合成存在關聯;spo0F的上游環境相關因子kapB的表達量增加,其全局調控作用同樣值得關注。本研究通過轉錄組測序技術,篩選到了一批可能與脂肽合成相關的調控因子,后續將依托本研究結果繼續對基因功能進行解析,為脂肽的生產和應用提供支持。