于學健,馮慧軍,翟磊,白秀彬,許玲,于盼盼,程池,姚粟*
1(中國食品發酵工業研究院有限公司,北京,100015) 2(天津科技大學,天津,300222)3(山東扳倒井股份有限公司,山東 高青,256300)
白酒獨特的生產工藝和風味特征使其成為世界蒸餾酒的典型代表,是中國最具民族文化特色的產品之一,在我國擁有龐大的消費群體和文化基礎[1]。芝麻香型白酒作為我國傳統白酒的創新香型,以獨特的清濃醬融合的風味特點和優雅的芝麻香而聞名,符合白酒淡雅、爽凈的消費趨勢[2-4]。高溫大曲作為芝麻香型白酒釀造的微生物載體和糖化發酵劑,為白酒釀造提供了豐富的微生物菌種、生物酶類以及獨特的芝麻香味成分和前體物質,是芝麻香型白酒特殊風味形成的關鍵因素之一[5-7]。微生物作為大曲制備的關鍵性因素,以功能基因為基礎產生多種生物酶類和香味成分及其前體物質,對白酒獨特風味的形成具有重要作用[8-11]。
高溫大曲中的功能菌與白酒產香關系密切,采用16S rRNA基因克隆文庫技術分析芝麻香型白酒高溫大曲,結果表明,在大曲入房時以泛菌屬(Pantoea)為優勢類群,隨著制曲時間的延長,溫度升高,高溫放線菌(Thermoactinomyces)等耐高溫菌屬成為優勢菌系,其變化趨勢與品溫較一致,呈現先升高再降低的趨勢[12];16S rRNA基因高通量測序結果也表明在高溫大曲中高溫放線菌為優勢類群[13]。通過ARDRA技術和分離培養方法可從高溫大曲中獲得普通高溫放線菌(T.vulgaris)、中間型高溫放線菌(T.intermedius)、大曲高溫放線菌(T.daqus)等多株高溫放線菌屬菌種[14]。該屬微生物常見于自然界高溫場所,具備耐高溫特性,適應大曲發酵中的高溫環境,具備開發高溫淀粉酶、蛋白酶、酯酶、脫氫酶和多酚氧化酶等潛力[15-18],可促進蛋白降解產生多種氨基酸,為酯化反應及美拉德反應提供前體物質,促進芝麻香風味的形成,在芝麻香白酒釀造中起到重要作用[19-23]。這些微生物作用均與功能基因緊密相關,高溫大曲為白酒釀造提供豐富的微生物資源和功能基因,明析高溫放線菌中功能基因在大曲制備過程中的分布及變化規律,有助于深入解析該菌屬在大曲及白酒釀造過程的作用機制。
但目前對芝麻香型白酒高溫大曲的研究主要集中在菌種的分離篩選及微生物群落結構分析上,對于芝麻香型大曲制備過程中特定菌種的功能基因組成及動態變化規律研究還處于起步階段。為此,本研究針對芝麻香型白酒高溫大曲的制備過程,應用宏基因組學分析技術,揭示白酒釀造高溫大曲中高溫放線菌及其功能基因的組成及動態變化規律,為高溫大曲中特定功能酶系及菌株的篩選提供理論基礎,為解析高溫放線菌在白酒釀造中的具體功能作用及定向調控提供技術支撐,對探究芝麻香白酒風味物質形成機理、提升芝麻香型白酒生產品質具有重要意義。
1.1.1 試劑
E.Z.N.A.TMSoil DNA Kit DNA提取試劑盒,Omega Bio-tek, Inc., USA;MGIEasy DNA文庫制備試劑盒,深圳華大智造科技有限公司;Qubit?dsDNA HS Assay Kit試劑盒,賽默飛世爾科技(中國)有限公司;DNA Marker,北京全式金生物技術有限公司;Gold View,北京塞百盛基因技術有限公司;實驗中所使用的各種其他無特別說明的化學試劑均為進口或國產分析純產品。
1.1.2 儀器與設備
BGISEQ-500基因測序儀,深圳華大智造科技有限公司; Centrifuge 5424 R臺式高速冷凍離心機,德國Eppendorf公司;Eppendorf微量移液器,德國Eppendorf公司;HH-3A電熱恒溫水浴鍋,常州國華電器;DG-Ⅲ型雙穩數顯電泳儀,北京鼎國生物技術發展公司;DYY-Ⅲ型水平電泳槽,北京六一儀器廠;紫外/可見凝膠成像系統,Bio-Rad公司。
1.2.1 樣品采集
2017年7月開展山東扳倒井股份有限公司18#曲房大曲的跟蹤采樣工作,根據不同發酵時期的發酵特點結合大曲發酵過程的操作工藝,對大曲制備過程中各個工藝階段樣品進行采集,工藝階段包括入房(A,32 ℃)、入房第2天(B,34.5 ℃)、一翻前(C,入房4 d,41.3 ℃)、一翻(D,入房5 d,42.7 ℃)、一翻后(E,入房6 d,40.7 ℃)、二翻前(F,入房7 d,41.0 ℃)、二翻(G,入房8 d,41.7 ℃)、二翻后(H,入房9 d,45.5 ℃)、頂溫(I,入房29 d,60.0 ℃)、出房(J,入房36 d,36.3 ℃);采用五點法在曲房的四周和中間各取一塊曲樣,共5塊大曲,粉碎曲樣,采用四分法進行隨機取樣,樣品均分為兩部分,一部分用于微生物菌群分析,另一部分用于理化指標分析[17-18]。對取樣時發酵時間、曲樣品溫、曲房環境溫度及相對濕度變化進行記錄。采用山東扳倒井股份有限公司企業標準《大曲評分標準》(BDJ/JW—WSW-06)及《釀酒大曲通用分析方法》(QB/T 4257—2011)對大曲樣品水分、酸度、糖化力、發酵力、液化力和酯化力等理化性質進行測定。
1.2.2 大曲總DNA提取
采用E.Z.N.A.TMSoil DNA Kit提取第2批取樣的18#曲房大曲總DNA。基因組提取操作流程按照試劑盒說明書進行。
1.2.3 宏基因組測序
1.2.3.1 DNA文庫構建及測序
采用Qubit?dsDNA HS Assay Kit試劑盒檢測大曲總DNA樣品的濃度,進而采用MGIEasy DNA文庫制備試劑盒構建測序文庫,操作流程嚴格按照使用說明書進行。
1.2.3.2 DNA文庫測序
采用BGISEQ-500基因測序儀對構建的DNA文庫進行測序,操作流程按照使用說明書進行。
1.2.4 宏基因組數據分析
1.2.4.1 數據質控過濾
利用metaWRAP軟件(v1.0.2) 結合SOAPnuke(v1.5.6)軟件完成下機數據的質控過濾,由于大曲中主要原料為小麥,在提取DNA過程中會引入小麥DNA,從而造成宿主污染,通過比對小麥基因組序列去除大曲DNA樣品中宿主序列,免除小麥宿主序列對后續分析的干擾。
1.2.4.2 宏基因組De Novo拼接
metaWRAP軟件(v1.0.2)整合了metaSPAdes和megaHIT兩個用于宏基因組組裝的軟件,使用metaSPAdes完成宏基因組拼接。
1.2.4.3 基因預測及基因集構建
首先使用metaGeneMark(v2.10)在組裝結果中預測開放閱讀框(ORFs),然后將不用樣品預測出的基因合并在一起,使用CD-Hit進行聚類(序列相似度在95%以上),以去除冗余序列。以大曲宏基因組注釋基因為基礎,將高溫放線菌屬中典型種的基因組序列在大曲宏基因組注釋基因數據中進行比對,得到高溫放線菌屬功能基因分布情況。
1.2.4.4 物種組成分析
利用metaWRAP軟件(v1.0.2)結合Kraken(V2.0.7-beta)軟件完成物種組成分析。
1.2.4.5 基因注釋分析
利用GhostKOALA將數據在線提交至KEGG數據庫完成KEGG pathway分析;預測的基因使用blast與CAZy數據庫比對得到碳水化合物活性酶基因信息。
1.2.5 數據統計處理
相關數據的統計及繪圖利用Excel和R(v3.5.0)等完成。利用R語言中的Hmisc包開展數據的相關性分析,利用R語言中的performance analytics包開展相關性分析結果的可視化。
采用BGISEQ-500基因測序儀對大曲宏基因組樣品進行測序,原始數據經質控過濾、去宿主序列、拼接組裝后,所得contig數量維持在5 000以上,平均contig長度大于2 000 bp,滿足后續物種及基因注釋要求。
高溫放線菌屬(Thermoactinomyces)菌種在各樣品中隨入房時間的變化趨勢與品溫變化有較高的一致性,入房時基本無高溫放線菌屬菌種分布,隨著入房時間延長,大曲品溫升高,高溫放線菌屬也隨之富集,在大曲頂溫過后溫度下降時,其相對豐度也呈下降趨勢(圖1)。這可能與高溫環境對不耐熱微生物的淘汰作用有關,也與高溫放線菌屬菌種生長特性一致,在品溫40 ℃以上時,高溫放線菌屬菌種生長良好,有利于其在大曲中的富集。

圖1 高溫放線菌屬在各樣品中的分布及變化情況Fig.1 Distribution and variation of Thermoactinomyces in Daqu samples
以高溫放線菌屬的分布情況與大曲理化性相關性分析表明,水分、酸度、液化力、品溫、入房時間均與大曲高溫放線菌屬顯著相關,其與大曲理化性質等環境因子的相關性處于較強的水平,與水分、酸度呈顯著負相關關系,與液化力、品溫及入房時間呈顯著正相關關系(表1)。

表1 大曲核心微生物與理化性質相關性分析Table 1 Correlation analysis between core microbiome and physicochemical properties of Daqu
注:只標注顯著相關的因素,非顯著相關的因素為空白。
由表1可見,大曲中高溫放線菌屬與大曲理化性質具備相互影響的可能性,也表明大曲的理化因素如發酵力、液化力、品溫等對于大曲中微生物群落具備潛在的調節作用,詳細了解兩者的相關關系,有助于解析微生物對大曲品質的作用,可為定向調控大曲中微生物組成進而提升大曲品質提供理論基礎。
以大曲宏基因組注釋基因為基礎,將高溫放線菌屬中典型種的基因組序列在大曲宏基因組注釋基因數據中進行比對,得到高溫放線菌屬的功能基因分布,結果表明在大曲宏基因數據中共比對到1 449個KEGG注釋基因(圖2)。KEGG注釋的基因主要分為genetic information processing(210),environmental information processing(160),metabolism(666)(global and overview maps、carbohydrate metabolism、amino acid metabolism、nucleotide metabolism、engry metabolism、lipid metabolism、metabolism of cofactors and vitamins),cellular process(78)、organismal system(41)、human diseases(81)6個主要功能組別。其中與metabolism相關的基因數量約占被注釋全部基因的45.96%。metabolism中具有較多基因數目的代謝途徑有carbohydrate metabolism、amino acid metabolism、nucleotide metabolism等途徑,與細胞基本代謝相關。

圖2 高溫放線菌在大曲宏基因組中比對到的KEGG注釋基因數量Fig.2 Annotation of Daqu metagenomic genes in KEGG database
對高溫放線菌基因在各工藝階段大曲樣品中的分布和變化情況統計如圖3,入房至二翻的工藝階段,其占宏基因組的相對豐度總量相似,在二翻后、頂溫及出房大曲中功能基因相對豐度升高,這與該菌屬的相對豐度分布較為一致。入房大曲中,轉運ATP酶(K02112)、精氨基琥珀酸裂解酶(K01755)、丙酮酸激酶(K00873)為優勢基因,這些基因主要參與微生物的基礎代謝,涉及微生物的氧化磷酸化反應、氨基酸代謝反應以及糖酵解反應。

圖3 各工藝階段大曲中高溫放線菌KEGG注釋基因分布Fig.3 Distribution of Thermoactinomyces genes annotated in KEGG database in Daqu with different fermentation stages (10 genes with the highest relative abundance in each sample were selected)
隨入房時間延長大曲品溫升高,堿性磷酸酶蛋白(Clp, K03695)、groEL分子伴侶(K04077)、磷酸轉運系統ATP結合蛋白(pstB, K02036)等成為優勢基因(圖4),Clp屬于熱休克蛋白HSP100家族,在高溫脅迫下可與其他結構不穩定的蛋白結合促進蛋白質的穩定性,防止蛋白質凝聚變性,并可協同其他分子伴侶修復變形的蛋白,在抵抗高溫脅迫過程中起到重要作用[24-25]。groEL分子伴侶屬于熱休克蛋白HSP60家族,可提高蛋白質的正確折疊與組裝效率,在熱脅迫的變性蛋白恢復過程中發揮重要作用[26-27]。pstB屬于ABC轉運子家族,可以結合并水解ATP,可為細胞的磷酸轉運系統提供能量,參與磷的轉運功能,與細胞生物活性密切相關[28]。這些與微生物耐熱相關的基因菌存在隨溫度升高而上升的趨勢,說明隨大曲品溫升高,高溫放線菌啟動了相應的耐熱應答機制,相關耐熱基因含量提升,為其在高溫環境中的生存提供良好的物質基礎。

圖4 各工藝階段大曲中高溫放線菌耐熱基因分布Fig.4 Distribution of Clp, groEL and pstB genes of Thermoactinomyces in Daqu samples
相關性分析顯示,Clp,groEL,pstB基因和高溫放線菌豐度及大曲品溫之間,均呈顯著正相關關系(圖5)。

圖5 Clp, groEL, pstB基因、高溫放線菌豐度和大曲品溫的相關性分析Fig.5 Correlation analysis of Clp, groEL, pstB genes,Thermoactinomyces and Daqu temperature
這也說明了這些潛在耐熱基因的豐度與高溫放線菌保持較高的一致性,都在大曲品溫提升時,高溫放線菌相對豐度升高,相應的耐熱基因數量也呈現增高趨勢,從而提升高溫放線菌在高溫下的生存能力進而發揮其功能作用。
大曲作為白酒釀造的糖化發酵劑,含豐富的碳水化合物活性酶,解析其中相關酶的基因分布及變化規律,有助于明析其對原料碳水化合物的代謝能力及作用機制,為進一步研究大曲中微生物的作用機制及調控技術奠定理論基礎。以大曲宏基因組的碳水化合物活性酶數據庫(CAZy)注釋基因為基礎,高溫放線菌在其中共比對到17個基因,主要分為糖基水解酶(GH,8個)、糖酯酶(GE,4個)、糖基轉移酶(GT,4個)、碳水化合物結合結構域(CBM,1個)(圖6)。

圖6 高溫放線菌在大曲宏基因組中比對到的CAZy注釋基因數量Fig.6 Annotation of Daqu metagenomic genes in CAZy database
高溫放線菌CAZy注釋基因在入房至二翻前的工藝階段占宏基因組的相對豐度總量相似,在二翻之后大曲中功能基因相對豐度逐漸升高,出房曲中碳水化合物活性酶基因的種類和豐度達到峰值(圖7),預示高溫放線菌相關碳水化合物代謝能力在出房曲中大幅提升,也有助于大曲發揮相應功能作用。入房大曲中,高溫放線菌只有α-淀粉酶基因分布,隨制曲時間延長,大曲高溫放線菌中碳水化合物活性酶基因數量與種類增多,出房大曲中相關基因達17種,主要由α-淀粉酶、乙酰基木聚糖酯酶和葡萄糖苷酶等組成,這些基因的富集可促進大曲原料中的碳水化合物的降解,為微生物生長提供必要的能量及代謝底物。

圖7 各工藝階段大曲中高溫放線菌CAZy注釋基因分布Fig.7 Distribution of Thermoactinomyces genes annotated in CAZy database in Daqu with different fermentation stages
相關性分析顯示,高溫放線菌中糖基水解酶(GH)、糖基轉移酶(GT)基因與大曲糖化力顯著正相關,糖基水解酶(GH)、糖基轉移酶(GT)、糖酯酶(GE)基因與大曲酯化力顯著正相關(圖8),可見高溫放線菌中碳水化合物活性酶相關基因對大曲糖化力與酯化力的提升有潛在的促進作用,也預示了高溫放線菌具備潛在的碳水化合物降解能力,促進大曲中原料的利用,有助于提升大曲發酵品質。入房時間與糖基水解酶(GH)基因、糖基轉移酶(GT)基因、CZAy注釋基因、高溫放線菌豐度、糖化力及酯化力均顯著正相關,與水分、酸度顯著負相關,說明隨大曲發酵時間延長,大曲本身水分降低,酸度下降,其中高溫放線菌豐度上升,碳水化合物降解相關基因逐漸富集,糖化力與酯化力提升,促使大曲發酵成熟。

圖8 高溫放線菌CAZy注釋基因與理化性質相關性分析Fig.8 Correlation analysis between Thermoactinomyces genes annotated in CAZy database and physicochemical properties of Daqu
本研究以芝麻香型白酒高溫大曲為研究對象,通過宏基因組測序技術解析了其制備過程中高溫放線菌屬及其功能基因的動態變化規律,結果表明高溫放線菌屬在大曲入房時基本無分布,隨著大曲品溫升高,高溫放線菌屬也隨之富集,整體呈現先升高再降低的變化過程,其變化趨勢與品溫呈顯著正相關關系;高溫放線菌功能基因在入房大曲中以轉運ATP酶、精氨基琥珀酸裂解酶、丙酮酸激酶為優勢基因,隨入房時間延長大曲品溫升高,Clp堿性磷酸酶蛋白、groEL分子伴侶、磷酸轉運系統ATP結合蛋白等潛在耐熱基因成為優勢基因,從而有效提升高溫放線菌在高溫下的生存能力,為其在大曲中發揮相關功能奠定基礎。入房時間與CZAy注釋基因、高溫放線菌豐度、糖化力及酯化力均顯著正相關,與水分、酸度顯著負相關,糖基水解酶、糖基轉移酶基因與大曲糖化力與酯化力顯著正相關,說明大曲發酵過程中水分與酸度降低,其中高溫放線菌豐度上升,碳水化合物降解相關基因逐漸富集,促進大曲糖化力與酯化力提升,初步揭示了高溫放線菌及其功能基因與大曲理化性質的關系,為微生物及高溫大曲在白酒釀造中的功能作用解析及定向調控提供技術支撐,對提升芝麻香型白酒生產品質具有重要意義。