徐友強,孫寶國,蔣玥鳳,鹿發展,張成楠,鄒 偉,王文華,楊 然,滕 超,范光森,李秀婷,*
(1.北京食品營養與人類健康高精尖創新中心,北京工商大學,北京 100048;2.北京市食品添加劑工程技術研究中心,北京工商大學,北京 100048;3.四川理工學院 釀酒生物技術及應用四川省重點實驗室,四川 自貢 643000)
白酒是中國特色發酵酒類飲品,也是世界知名蒸餾酒之一[1]。依據香氣特征,中國白酒分為12 種香型,其中濃香型白酒目前銷量占白酒市場份額的70%以上,屬于白酒行業的支柱型產品[1-2]。研究發現,濃香型白酒的主體風味物質為己酸乙酯。國家標準規定,優級高度酒的總酯質量濃度不低于2.0 g/L,其中己酸乙酯質量濃度不低于1.2 g/L,優級低度酒的總酯質量濃度不低于1.5 g/L,其中己酸乙酯質量濃度不低于0.7 g/L[3]。生產實踐中,以己酸乙酯含量的高低作為濃香型白酒品質的重要衡量參數已成為業內共識[4-6]。這充分說明己酸乙酯對濃香型白酒品質的重要作用。己酸乙酯合成的前體物質為己酸和乙醇。其中,白酒釀造過程己酸的合成代謝對于己酸乙酯的生成具有決定性的作用[7]。研究發現,濃香型白酒釀造過程Clostridium屬的微生物具有較高豐度,且對于酒醅己酸的產生具有重要貢獻[7]。其中,Clostridium kluyveri是白酒來源Clostridium屬微生物的典型代表[8]。20世紀60年代,C. kluyveri自白酒窖泥被分離,并經研究證實對于己酸代謝合成和己酸乙酯生成具有顯著促進作用,繼而通過微生物的外源添加,保障白酒釀造過程己酸乙酯的生成,使酒體呈現濃香型白酒的感官和風味,進而推動濃香型白酒的生產突破傳統白酒釀造的地域依賴性,目前全國多個地區均能夠生產優質濃香型白酒[1]。這也充分說明微生物對于白酒釀造的重要性。
C. kluyveri是己酸的重要代謝生產菌種之一,所代謝合成的己酸具有重要用途。作為六碳的小分子脂肪酸,己酸可用于香料、醫藥前體、食品添加劑、潤滑油、煙草調香、橡膠和印染領域,同時可作為前體合成己酸酯如己酸乙酯,是食品領域的重要風味酯類,用途廣泛[9-12]。因此,有研究對微生物的己酸代謝進行探索,如通過基因組測序和注釋,解析己酸代謝途徑等[8,10]。另有文獻報道,Clostridium屬的其他菌株、Megasphaera elsdenii、基因工程改造的Escherichia coli和Kluyveromyces marxianus等也具有己酸的代謝合成能力[9-12]。但目前研究顯示,C. kluyveri己酸代謝合成的產量和生產速率均居于前列[10]。由于己酸廣泛的用途和C.kluyveri突出的己酸代謝合成性能,C. kluyveri的己酸代謝已有文獻報道。Seedorf等[8]解析C. kluyveri模式菌株DSM 555的基因組信息,對乙醇代謝合成丁酸的途徑進行詳細分析。之后,Tao Yong等[10]對另一株己酸高產菌株Clostridium sp. CPB6的基因組序列進行解析和注釋,并分析該菌株代謝合成己酸的可能途徑。
目前研究認為,C. kluyveri合成己酸的經典代謝過程是通過乙醇作為底物和電子供體的反向β-氧化循環鏈延長機制實現的。其代謝途徑見圖1。乙醇首先經乙醇脫氫酶(Adh)轉化為乙醛,經乙醛脫氫酶(Ald)轉化為乙酰輔酶A,這兩步轉化均偶合NAD+轉化為NADH。乙酰輔酶A經磷酸轉乙酰酶(Pta)生成乙酰磷酸,經乙酸激酶(Ack)轉化生成乙酸,該步催化伴隨ADP生成ATP。乙酰輔酶A還可經乙酰輔酶A乙酰轉移酶(又名硫解酶)(ThlA)轉化為乙酰乙酰輔酶A,經3-羥基丁酰輔酶A脫氫酶(Hbd)轉化為3-羥基丁酰輔酶A并消耗NADH。3-羥基丁酰輔酶A經3-羥基丁酰輔酶A脫水酶(Crt)轉化為丁烯酰輔酶A。丁烯酰輔酶A在丁酰輔酶A脫氫酶(Bcd)的催化下,轉化為丁酰輔酶A,該步催化偶合FAD依賴型的電子轉移黃素蛋白(Etf)和鐵氧化還原蛋白氧化還原酶(Rnf),并伴隨電子的轉移。丁酰輔酶A和乙酸經丁酰輔酶A:乙酸輔酶A轉移酶(Cat3)轉化為乙酰輔酶A和丁酸,實現以乙酸合成丁酸的過程。再經類似的催化過程,實現由丁酰輔酶A到己酰輔酶A,經酰基輔酶A硫酯酶(Tes1)催化生成己酸。代謝途徑分析表明,由乙酰輔酶A到己酸代謝的主要催化酶包括乙酰輔酶A乙酰轉移酶/硫解酶(ThlA)、3-羥基丁酰輔酶A脫氫酶(Hbd)、3-羥基丁酰輔酶A脫水酶(Crt)和丁酰輔酶A脫氫酶(Bcd)。
基于代謝途徑的解析,利用代謝工程技術進行微生物的遺傳改造,改良微生物的代謝特性,是實現目標化合物微生物高產的有效途徑。然而,由于C. kluyveri遺傳操作體系的匱乏,目前通過基因工程手段利用微生物進行己酸的生產優化主要集中于在大腸桿菌或者酵母菌株中異源重構己酸的代謝途徑來實現[11-12]。相關研究發現,乙酰輔酶A乙酰轉移酶是己酸代謝途徑的關鍵酶,其表達強度對于己酸代謝的產量和速率具有決定作用[12]。然而到目前為止,已知的C. kluyveri基因組測序和注釋結果關于己酸代謝核心催化酶以及關鍵酶的注釋及功能分析仍不深入,甚至存在欠缺和謬誤,不利于后續對己酸代謝的深入研究。基于此,本研究通過比較基因組學和生物信息學相結合的方法,對3 株遺傳信息全面解析的C. kluyveri進行己酸代謝途徑核心催化酶的重新注釋和關鍵酶硫解酶的結構及催化機制分析,為后續的深入研究提供參考。

圖1 C. kluyveri的己酸代謝途徑Fig. 1 Hexanoic acid metabolic pathway in C. kluyveri
檢索NCBI的基因組數據庫,共獲得已知全基因組信息的3 株C. kluyveri,編號分別為DSM 555[8]、NBRC 12016[13]和JZZ[12],以其為研究對象,將全基因組序列信息下載到本地進行分析。
1.2.1 比較基因組學分析
利用軟件MAUVE 2.3.1進行3 株C. kluyveri菌株全基因組序列分析[14]。利用文本編輯軟件fasta編輯符合比對要求的基因組序列文件,通過MAUVE細菌基因組比對默認參數進行比較基因組學分析。
1.2.2 關鍵酶序列和基本性質分析
序列比對選用DNAMAN 7.0軟件完成、酶的基本性質分析采用ExPASy-ProtParam tool完成(http://web.expasy.org/protparam/)[15]。
蛋白質系統發育樹構建:選取代表性的不同乙酰輔酶A乙酰轉移酶序列,按照系統發育分析軟件MEGA 5.0的要求制作序列比對文件,通過Neighbour-Joining算法構建系統發育樹,Bootstrap values:1 000[16]。
1.2.3 關鍵酶親水/疏水性分析、信號肽和跨膜區預測
蛋白親水/疏水性分析通過軟件ExPASy-ProtScale完成(http://web.expasy.org/protscale/)[15],信號肽的預測通過SignalP 4.1網站進行(http://www.cbs.dtu.dk/services/SignalP/)[17],利用在線軟件TMHMM 2.0進行蛋白跨膜區的預測(http://www.cbs.dtu.dk/services/TMHMM)。
1.2.4 關鍵酶二級、三維結構預測和催化機制分析
蛋白二級結構利用軟件SOPMA(Secondary Structure Prediction Method)(https://npsa-prabi.ibcp.fr/ cgi-bin/npsa_automat.pl?page=npsa_sopma.html)進行分析[18]。蛋白三維結構預測通過SWISS-MODEL(http://swissmodel.expasy.org/)完成[19]。分子對接分析酶與底物作用關系通過DISCOVERY STUDIO 2.5軟件完成[20]。

圖2 3 株C. kluyveri全基因組序列比對(A)和己酸代謝途徑基因分布分析(B)Fig. 2 Whole genome sequence alignment (A) of three C. kluyveri and gene distribution of hexanoic acid metabolic pathway
比較基因組分析發現,模式菌株DSM 555與NBRC 12016的基因組長度接近,但均明顯短于JZZ,說明DSM 555與NBRC 12016在進化關系上更加接近,而JZZ可能存在區別于DSM 555和NBRC 12016的獨有遺傳信息(圖2A)。文獻研究表明,菌株JZZ分離自白酒釀造過程,該菌株基因組獨有的遺傳信息可能與基因水平轉移有關[21],來自白酒釀造過程中其他微生物所攜帶的遺傳信息,賦予該菌株區別于DSM 555和NBRC 12016的生物學功能,使其在白酒釀造的獨特生境下可以更好地生存和繁殖。另外,比較基因組學分析表明,3 株菌株均不存在明顯的基因組DNA片段的轉換或者顛換。基于比較基因組學分析和基因組基因注釋結果,研究繪制不同拷貝的己酸代謝核心催化酶編碼基因在基因組上的相對位置圖譜(圖2B)。3 株菌株均攜帶己酸代謝的核心催化酶編碼基因,表明具有代謝合成己酸的能力,且每一株菌對應核心催化酶編碼基因的拷貝數一致,但同一株菌不同酶編碼基因的拷貝數不同(圖2B)。3 株菌株攜帶己酸代謝的核心催化酶編碼基因均為多拷貝,說明該代謝途徑屬于C. kluyveri的關鍵代謝途徑,對于維持菌株的生存和基本代謝至關重要。

表1 3 株C. kluyveri己酸代謝途徑的核心催化酶重新注釋Table 1 Re-annotation of the core enzymes of the hexanoic acid metabolic pathway in three C. kluyveri strains

表2 關鍵硫解酶基本性質分析Table 2 Characteristics of the key thiolases
對核心代謝酶的注釋信息進行比較分析,由表1可知,NBRC 12016由于基因組測序較早,非冗余蛋白質數據庫的信息相對不完善,導致己酸代謝途徑的注釋信息匱乏。與之相比,DSM 555和JZZ的注釋信息較為完善,但JZZ存在酰基輔酶A脫氫酶注釋的錯誤,編碼酰基輔酶A脫氫酶的基因被錯誤預測為編號BS101_04340和BS101_04345的兩個基因,對應編碼蛋白的注釋信息亦需更正。另外,基因bcd2編碼蛋白的注釋信息為酰基輔酶A脫氫酶、短鏈特異的,表明源于DSM 555的基因bcd1和bcd2編碼蛋白的底物特異性可能存在差別,有待后續研究證實。由于己酸代謝合成是脂肪酸代謝鏈延長的過程,C. kluyveri攜帶的己酸代謝關鍵酶硫解酶的序列多態性可能與催化過程鏈延長循環的底物特異性有關,但目前鮮見相關的研究報道。
對3 株C.kluyveri菌株己酸代謝途徑的關鍵酶乙酰輔酶A乙酰轉移酶(硫解酶)進行基本酶學性質分析,包括氨基酸殘基數量、分子質量、等電點、帶負電荷氨基酸、帶正電荷氨基酸、分子式、原子總數、消光系數和不穩定指數(表2)。不同菌株來源對應的硫解酶以及同一菌株來源不同拷貝的硫解酶的基本性質包括分子質量、等電點、分子式、原子總數、消光系數和不穩定指數均存在區別。其中,不同硫解酶的不穩定指數均小于40,說明蛋白本身在結構上是穩定的[22]。蛋白的穩定性與序列的二肽組成緊密相關[22],不同硫解酶的序列存在差別(圖3),導致氨基酸序列中的二肽組成具有差異,是穩定性差別的內在原因。另外,ThlA1、ThlA3、BS101_21010、BS101_21025、CKR_3261和CKR_3263雖然帶正負電荷氨基酸總數分別相等,但是經統計,組成正負電荷的氨基酸不同(圖3),不同氨基酸的解離系數存在差別,導致酶的等電點存在微小差別。上述分析對于后續該類關鍵酶的分離純化和催化特性研究具有一定的指導意義。
在硫解酶基本理化性質解析基礎上,研究對酶的氨基酸序列進行比對和系統發育分析。結果表明,C. kluyveri不同種均攜帶3 個拷貝的硫解酶,同一菌株來源的3 個硫解酶的序列和不同菌株來源對應硫解酶的序列均存在差別(圖3),且不同來源硫解酶在系統發育樹上明顯聚于不同的分支(圖4)。同時,C. kluyveri來源硫解酶與Clostridium屬其余種來源的硫解酶具有序列的差異。硫解酶催化短鏈的酰基輔酶A合成長鏈的酰基輔酶A,是脂肪酸合成代謝的關鍵酶之一[23]。研究發現,微生物中脂肪酸合成代謝一般存在3 種類型的硫解酶,I型脂肪酸合成酶(fatty-acid synthesis type I,FAS I),II型脂肪酸合成酶(FAS II)和III型脂肪酸合成酶(FAS III)。其中,FAS I和FAS II與脂肪酸的鏈延長相關,而FAS III與脂肪酸合成的反應起始相關[23-24]。由于C. kluyveri來源硫解酶的研究較少,目前尚鮮見關于不同拷貝硫解酶底物特異性的文獻報道。圖4表明,以C. kluyveri來源硫解酶為對象進行深入研究,對于解析C. kluyveri己酸代謝途徑具有重要意義。

圖3 關鍵硫解酶序列比對Fig. 3 Sequence alignment of the key thiolases

圖4 關鍵硫解酶系統發育分析Fig. 4 Phylogenetic analysis of the key thiolases


圖5 C. kluyveri DSM 555關鍵酶ThlA疏水性分析(A)、信號肽(B)和跨膜區(C)預測Fig. 5 Hydrophobic analysis (A), signal peptide (B) and transmembrane domain (C) prediction of the key enzymes ThlA from C. kluyveri DSM 555
在酶的理化性質和系統發育分析基礎上,研究以C.kluyveri模式菌株DSM 555來源硫解酶ThlA為代表性對象,采用Hphob/Kyte & Doolittle算法計算ThlA1、ThlA2和ThlA3的疏水性(圖5A)[25]。ThlA1疏水指數最小值為-2.556(370位),最大值為2.322(30位),總平均親水性指數(grand average of hydropathicity,GRAVY)為0.049;ThlA2疏水指數最小值為-2.622(368位),最大值為2.322(30位),GRAVY為0.104;ThlA3疏水指數最小值為-2.622(368位),最大值為2.289(30位),GRAVY為0.076。特定位點的氨基酸疏水性指數越大,表明該位點的疏水性越高[25]。3 個ThlA的GRAVY存在差別,說明三者雖然都是疏水蛋白,但是疏水性有差別。蛋白質的疏水作用與其穩定性具有密切的相關性,通過蛋白氨基酸位點的疏水性分析,結合蛋白質工程技術,進行關鍵位點或者區域的理性設計和改造,對于改善蛋白的穩定性具有重要作用[26]。圖5B表明,3 拷貝的ThlA均不具有信號肽,不能分泌到胞外,是具有重要催化功能的胞內酶。跨膜區預測顯示,3 個酶均不具有明顯的跨膜區,是非跨膜蛋白(圖5C)。但與ThlA1相比,ThlA2和ThlA3的C端具有更強的疏水性,疏水性的差別可能會影響蛋白的結構,進而影響酶的催化特性[27]。不同硫解酶的催化特性存在差異,最近研究發現可能與硫解酶C端loop區的空間結構有關[28],但C端疏水性對催化的具體影響仍需要通過實驗加以解析。通過生物信息學的技術手段對酶的可能催化機制進行先期分析,可為后續的研究提供借鑒。

圖6 關鍵酶ThlA1二級結構預測Fig. 6 Prediction of the secondary structure of the key enzyme ThlA1
以C. kluyveri DSM 555來源ThlA1為例,進行酶的結構和催化機制解析。二級結構預測表明,ThlA1蛋白具有15 個α-螺旋和9 個β-折疊,占序列總長的60.3%。另經與相近序列的比對分析,確定Cys88、His350和Cys380為催化關鍵位點(圖6三角標示位點的氨基酸),其中,His350行使激活酶催化的功能;Cys88與Cys380可以形成二硫鍵,二硫鍵的形成或者斷開會直接影響酶的催化,是調節酶催化與否的關鍵位點[23,28]。研究發現,綠色下劃線部分的loop結構在空間上位于Cys88和Cys380之間,當二硫鍵形成時,loop區會發生空間上的旋轉,進一步阻礙乙酰輔酶A與酶催化活性中心的結合[28]。二級結構的預測對于蛋白的研究具有重要幫助,例如,當序列同源性較低時,二級結構的預測有助于確定蛋白質之間結構與功能的關系;借助于蛋白二級結構統計分析的規律,可以用于全新蛋白的從頭設計;另外,二級結構的預測有助于多維核磁共振中二級結構的確認和晶體結構的解析[26,29]。
利用軟件SWISS MODEL以C. acetobutylicum來源硫解酶CaTHL(PDB:4xl4.1.A)為模板,構建三維結構模型(圖7A)。4xl4.1.A與ThlA1序列相似度為72.82%。目前研究發現,硫解酶一般以四聚體的形式存在,利用SWISS MODEL同時進行了四聚體結構的預測(參考蛋白PDB:4wyr.1.A)(圖7D)。四聚體是通過單體的L-結構域(圖7A兩β折疊及其之間的無規則卷曲)結合形成的規則對稱結構。研究同時進行分子對接,確定酶與底物分子乙酰輔酶A的最佳結合角度和取向,并分析酶與底物可能的成鍵(圖7B和7C)。結構解析結合文獻總結表明,Clostridium屬微生物來源的ThlA具有不同于已知硫解酶的獨特調控催化機制——氧化還原開關調控機制[28]。當酶處于還原狀態時,Cys88與Cys380保持還原狀態,之間不形成二硫鍵,Cys88的硫原子失去氫離子被激活,進而起始催化反應(圖7E I);當酶處于氧化狀態時,Cys88與Cys380失去氫離子并形成二硫鍵,酶處于無活性狀態,不行使催化反應(圖7E II)。

圖7 關鍵酶ThlA1單體的三維結構模擬(A)、分子對接(B)、酶-底物作用關系分析(C)、四聚體結構預測(D)、氧化還原開關催化調控(E)和具體催化機制(F)Fig. 7 Monomer modeling (A), molecular docking (B), enzymesubstrate interaction analysis (C), tetramer structure prediction (D),redox-switch catalytic regulation (E) and catalytic mechanism (F) of the key enzyme ThlA1
基于結構解析和分子對接,推測ThlA1的催化機制如下:His350通過親核攻擊并轉移Cys88與硫原子連接的氫離子激活Cys88,Cys88的硫原子與酰基輔酶A的羰基碳原子作用生成共價鍵,形成酰基-酶復合體,同時Cys380與硫原子連接的氫離子轉移到失去酰基的輔酶A上(圖7F I和II)。之后,失去氫離子的Cys380與另一分子的酰基輔酶A發生作用,獲取底物酰基的氫離子,并激活底物的甲基碳原子向酰基-酶復合體的羰基碳原子進行親核攻擊,形成共價鍵,獲得以C2單位延長的酰基輔酶A(圖7F III和IV)[23-24,28,30]。碳鏈延長的酰基輔酶A最終經硫酯酶的催化作用脫去輔酶A生成對應鏈長的脂肪酸[11](圖1)。
由于己酸對中國傳統釀造濃香型白酒風味與品質的重要作用和C. kluyveri對己酸合成的突出貢獻,研究對已知遺傳信息的3 株C. kluyveri進行比較基因組學分析和己酸代謝途徑關鍵基因的深度挖掘及重新注釋。通過代謝途徑分析結合文獻研究,聚焦于C. kluyveri DSM 555來源己酸代謝途徑關鍵基因編碼的硫解酶ThlA1,對其序列和結構進行全面的生物信息學分析,發現C. kluyveri來源ThlA1具有獨特的氧化還原開關調控機制,并結合分子對接,對具體催化的過程進行闡釋。上述研究對于白酒重要功能微生物C. kluyveri己酸代謝合成途徑的科學解析,以及基于此改造菌株的己酸代謝性能,進而科學調控傳統濃香型白酒的釀造具有重要意義。