楊偉杰 楊周林 朱浩東 魏煜 劉君,2 劉訓
(1.四川輕化工大學生物工程學院,宜賓 644000;2.釀酒生物技術及應用四川省重點實驗室,宜賓 644000)
地衣素(lichenysin)是由7 位氨基酸多肽和羥基脂肪酸形成的環脂肽化合物,具有一定的抗腫瘤[1]、抗病毒[2]、抗炎[3]、抗癌[4]等活性,對白酒風味形成有促進作用[5-6]。地衣素可由地衣芽孢桿菌[7](Bacillus licheniforms)以葡萄糖為底物,經過非核糖體多肽合成酶(nonribosomal peptide synthetase, NRPS)催化合成(圖1?A),NRPS 在地衣素合成途徑中被稱為地衣素合成酶。已發現的地衣素生物合成過程如圖1?B 所示,腺苷化(adenylation,A)結構域激活氨基酸,各氨基酸在硫酯化(thiolation,T)結構域的運輸下,在縮合(condensation, C)結構域上形成肽鍵,形成的多肽鏈-脂肪酸鏈復合體在硫脂酶(thioesterase, TE)結構域的作用下環化并釋放出地衣素[8]。地衣素合成酶含有一個單獨的模塊,硫酯酶模塊LchAD 蛋白。LchAD 蛋白可作為載體,將β-脂肪酸運送到地衣素合成酶的第一個C結構域[9],與谷氨酰胺(glutamine, Gln)結合以保證多肽鏈和脂肪酸鏈的連接,為后續環化提供基礎(圖1?B)。LchAD 蛋白可能參與編輯修正錯誤激活的氨基酸,確保地衣素合成酶行使正常功能,從而保證地衣素的正確合成[8]。由此可見,LchAD 蛋白對地衣素的產生和產量具有較大影響。因此,研究LchAD 蛋白的性質和功能將對深入解析地衣素生物合成途徑具有重要理論意義,同時對地衣素的工業生產及應用具有一定促進作用。
LchAD 蛋白屬于II 型硫酯酶(type II thioester?ase, TE II),該類型硫酯酶屬于α/β 水解酶超家族,含有保守的催化三元件(Ser?His?Asp),具有水解、環化和釋放的功能[10]。但有文獻指出并不是所有的TE II 都含有同樣的催化三元件,在某些TE II 中Ser殘基會被Cys 殘基所替代,從而導致TE II 酶活降低[11]。NRPS 參與多種微生物次生代謝產物的合成,其關鍵模塊TE II 影響著多種非核糖體多肽類物質的合成和產量。研究發現,在萬古霉素(vancomycin)生物合成過程中,肽鏈只有在TE II 的氧化修飾下,才能形成生物活性肽[12]。Schneider 等[13]通過刪除編碼表面活性素(surfactin)生物合成酶的TE II,導致表面活性素產量減少84%。Wu 等[14]研究發現在卡西霉素(calcimycin)生物合成過程中,TE II 的失活能導致其前體物質產量下降。同樣,Kotowska等[15]報道了TE II 的失活導致非核糖體多肽類物質Coelimycin 的生物合成無法繼續。這些研究結果表明,TE II 直接參與了多種非核糖體多肽類物質的生物合成,且能對這些物質的生物合成產生不同程度的影響。
截至目前,已有多種TE II 蛋白晶體被成功解析,例如來自合成利福霉素(rifamycin)途徑中的RifR蛋白晶體[16]、參與合成表面活性素的SrfD 蛋白晶體[9]和靈菌紅素(prodiginine)合成途徑中的RedJ蛋白晶體[17]。研究發現TE II 蛋白具有多種構象,構象的變化使其能與其他結構域相互作用,從而發揮生物學功能。此外TE II 蛋白還具有靈活的蓋子結構(lid structure),可以通過改變活性位點的大小和形狀來控制底物的進入[18]。然而,對地衣素合成途徑中的關鍵模塊LchAD蛋白的相關研究還未見報道。
本研究為探究地衣素合成途徑中關鍵模塊LchAD 蛋白的性質和功能,首先從釀酒大曲中篩選地衣素產生菌,對其進行鑒定和命名,并以其基因組DNA 為模板克隆LchAD 基因,隨后探究LchAD蛋白異源表達及純化的最適條件,最后利用生物信息學在線軟件分析其性質和功能,旨在為地衣素生物合成途徑的進一步解析奠定基礎。
大曲樣品取自于四川某酒廠(2022 年5 月)。蛋白胨、牛肉膏、氯化鈉、瓊脂、明膠、過氧化氫、磷酸二氫鈉、無水乙醇、硝酸鉀、葡萄糖、可溶性淀粉、番紅試劑、溴麝香草酚藍、α-萘酚、碘、碘化鉀等試劑均為分析純,購自上海源葉生物科技有限公司。限制性內切酶Xho I、BamH I、T4 連接酶,購自大連寶生物公司。細菌DNA 抽提試劑盒購自全氏金生物有限公司。
牛肉膏蛋白胨培養基(g/L):牛肉膏3,蛋白胨10,NaCl 5,pH 7.0-8.0。明膠液化培養基(g/L):牛肉膏3,蛋白胨10,NaCl 5,明膠120,pH 7.2-7.4。V?P 半固體培養基(g/L):蛋白胨12,酵母浸粉1,葡萄糖10,NaCl 5,瓊脂3,pH 7.0-7.5。葡萄糖發酵培養基(g/L):酵母浸粉5,蛋白胨10,NaCl 10,葡萄糖10,pH 7.0-8.0。淀粉培養基(g/L):牛肉膏3,蛋白胨10,NaCl 5,可溶性淀粉2,瓊脂15-20,pH 7.0-8.0。Cooper 培養基[19](g/L):葡萄糖25,NH4NO34,KH2PO44.082 7,Na2HPO45.68,MgSO4·7H2O 0.197 2,CaCl20.000 8,Na2?EDTA 0.001 5,pH 7.2-7.4。
1.2.1 大曲中芽孢桿菌的篩選 稱取10 g 大曲樣品,加入已滅菌的生理鹽水90 mL,在37℃、180 r/min 條件下富集30 min,隨后在85℃水浴中處理15 min[20]。參照梁慧珍等[21]方法進行菌株篩選,獲得純種后,冷藏菌株并編號。
1.2.2 菌株發酵產物的檢測 液態發酵:制備種子液,使其OD600值為0.8-1.0 時。將種子液按體積分數3%的接種量接種到Cooper 發酵培養基中,搖床37℃,250 r/min 培養72 h。
發酵產物的提純:將發酵液離心20 min(8 000 r/min),收集上清液,用6 mol/L 的HCl 調節上清液的pH 至2.0,4℃過夜放置。8 000 r/min 離心20 min收集沉淀,用30 mL 甲醇分3 次浸提沉淀物[22],均在4℃浸提4 h。收集浸提液用0.22 μm微孔濾膜過濾。保存樣品用于一級質譜和二級質譜的檢測。
發酵產物的檢測:目標物質在正級模式下檢測,檢測條件:DP 167 V,EP 6.9 V,CE 40 V,針泵流速0.07 mL/min,掃描范圍:一級質譜100-1 100 Da,二級質譜100-1 000 Da。
1.2.3 生理生化實驗鑒定 過氧化氫酶實驗、硝酸鹽還原實驗、糖醇發酵實驗、接觸酶測試、淀粉水解實驗、V?P 實驗和明膠液化實驗采用王成俊等[23]方法。
1.2.4 分子生物學鑒定 使用27F/1492R 通用引物對菌株基因組進行PCR 擴增,擴增片段送至成都擎科有限公司進行測序。測序序列在NCBI 數據庫中BLAST 比對后,選擇相似度高的菌株序列,采用MEGA 7 軟件的Neighbor?joining 法(bootstrap=1 000)建立系統發育樹,確定菌株YC7 的種屬[24]。
1.2.5 LchAD 基因的克隆和重組質粒的構建
(1)基因克隆。使用primer primer 5 軟件設計引物,送至成都擎科有限公司合成,上游引物:5'?CGGATCCATGAACGAGATCATTAAGCA?3',下 游引物:5'?CCTCGAGACACACCGATTTTCCGTT?3'。以篩選的地衣素產生菌基因組DNA 為模板進行PCR擴增。
(2)重組質粒的構建。將克隆的LchAD 基因和載體pET?28a 分別進行雙酶切(Xho I 和BamH I),隨后過夜連接,轉入大腸桿菌(Escherichia coli)DH5α 感受態細胞,具體參照Ngo 等[25]方法。
1.2.6 LchAD 蛋白的異源表達與純化 制備含有重組質粒的E.coli BL21(DE3)菌懸液,OD600在0.6-0.8 時,加入IPTG(終濃度為100 μg/mL)誘導表達,20℃,180 r/min 誘導16 h。收集菌體,超聲破碎細胞壁,收集上清液,用鎳柱進行純化。使用不同濃度的咪唑洗脫雜蛋白。具體參照Ngo 等[25]方法。
1.2.7 生物信息學分析 利用Prot Param 預測LchAD 蛋白的理化性質;NCBI Conserved Domain 在線軟件預測LchAD 蛋白的保守結構域;Prot Scale在線軟件對LchAD 蛋白進行親疏水性的分析;利用在線網站(https://services.healthtech.dtu.dk/service.php?SignalP?5.0)對LchAD 蛋 白 進 行 信 號 肽 的 預測;利用SOPMA 進行二級結構分析與預測;利用SWISS?MOOEL 和Alpfold 開源數據庫進行三級結構預測[26]。
從大曲樣品中篩選獲得3 株純種菌株,編號為YC1、YC2 和YC7,各菌株的菌落形態描述見表1。

表1 菌落形態Table 1 Colony morphology
對3 株菌株進行質譜檢測發現,只有菌株YC7有地衣素結構離子峰。一級質譜結果(圖2)顯示,圖中出現了m/z 為1 007.4、1 021.5 和1 035.4 的離子峰,分別對應地衣素同系物的質子化峰。同時出現了m/z 是1 029.3、1 043.4 和1 057.4 的離子 峰,分別是1 007.4、1 021.5 和1 035.4 相應的[M+Na]+峰。因此,推測菌株YC7 發酵產物中有地衣素的同系物。于是對1 007.4、1 021.5 和1 035.4 離子峰進行ms/ms 分析以期確認其主成分的結構。

圖2 一級質譜圖Fig.2 Primary mass spectrogram
ms/ms 分析圖譜(圖3?A)顯示,m/z 為1 007.4的離子峰有兩種類型的碎片離子,一種是發生簡單斷裂形成的片段[M+H]+峰,如m/z 是337.2、468.1、581.2 和680.2 等, 這 些 特 征 值 與 圖3?B中[C14?lichenysin+H+]的理論值b2、a3、a4 和a5相吻合;另一種是雙氫轉移(double H transfer)斷裂機制,即脂肽物質的內酯結構在斷裂時,脂肪酸鏈上的兩個氫原子轉移到羥基端的氨基酸殘基上(圖3?C),使C 端殘基的分子量比簡單的酰胺鍵斷裂產生的碎片質量少18(即少一個H2O),如m/z為355.3 的離子峰可以表示為[C14?OH?Gln+H+]片段,符合地衣素D 斷裂后的理論值。在圖3 中還有一個主要的碎片離子是m/z 為671.1,其產生的原因是位于第7 位的Val 發生雙氫轉移斷裂產生的特征碎片離子,且ms/ms 的檢測結果與圖3?C 中[C14?lichenysin+H+]的理論值相符合,所以推斷此部分是脂肪酸鏈為14 個C 的地衣素G。從m/z 為1 021.5的離子峰結果可以看出,有m/z 為685.2 和337.3 的離子峰,符合地衣素A 斷裂產生的特征峰(附圖1)。另外,分析m/z 為1 035.4 的離子峰結果發現,有m/z 為685.0 的特征峰,該值與附圖2 中脂肪酸鏈碳原子為15 的地衣素理論值相符。以上結果表明菌株YC7 為地衣素產生菌。

圖3 m/z 為1 007.4 離子峰的二級質譜圖(A)及該離子峰發生簡單斷裂(B)和發生雙氫轉移斷裂(C)產生的特征離子碎片理論值Fig.3 Secondary mass spectrometry of ion peak with m/z of 1 007.4(A)and theoretical values of characteristic ion fragments generated by simple cleavage(B)and double hydrogen transfer cleavage(C)of this ion peak
2.3.1 生理生化鑒定結果 由表2 可知,菌株YC7為革蘭氏陽性菌,芽孢橢圓形,兼性厭氧,化能異氧型,葡萄糖產氣陰性,接觸酶、葡萄糖產酸、淀粉分解、V?P 實驗及明膠分解均為陽性。

表2 生理生化結果Table 2 Physiological and biochemical results
2.3.2 分子生物學鑒定結果 利用通用引物27F/1492R 擴增獲得菌株YC7 的16S rDNA,測序比對后發現,菌株YC7 與Bacillus licheniformis strain DSM13的16S rDNA 序列相似度為99.65%。下載10 株不同種的標準菌株的序列,使用軟件MEGA 7 構建系統進化樹。結果(圖4)顯示,菌株YC7 與Bacilluslicheniformis strain DSM13 的自展值為89,故菌株YC7 被命名為地衣芽孢桿菌YC7 并用于后續實驗。

圖4 菌株YC7 的系統進化樹Fig.4 Phylogenetic tree of strain YC7
重組質粒pET?28a?LchAD 雙酶切后,電泳結果顯示有兩條清晰條帶(圖5?A)。其中一條條帶的大小為750 bp 左右,與LchAD 基因大小一致;另一條條帶大小為5 000 bp 左右,與pET?28a 載體大小一致,雙酶切結果說明重組質粒構建成功。在溫度為20℃,IPTG 終濃度為100 μg/mL 的條件下,重組質粒pET?28a?LchAD 在E.coli 中的表達結果如圖5?B所示,目的蛋白條帶在27.62 kD 左右。同時,在泳道1 和2 中未見有目的蛋白,而在泳道3、4 和5 中均出現目的蛋白,該結果說明,在此條件下能成功誘導LchAD 蛋白表達,且能形成可溶性蛋白。在使用不同濃度咪唑洗脫雜蛋白的實驗中發現,在咪唑濃度為250 mmol/L 時能最大程度洗脫雜蛋白,獲得比較純的目的蛋白(圖5?C)。

圖5 重組質粒pET-28a-LchAD 雙酶切(A)和 LchAD 蛋白表達(B)及純化(C)結果Fig.5 Results of double digestion of recombinant plasmid pET-28a-LchAD(A)and LchAD protein expression(B)and purification(C)
2.5.1 LchAD 蛋白理化性質預測 Prot Param 預測該蛋白質的分子質量約為27.62 kD,理論等電點(pI)為7.23;氨基酸序列由20 種氨基酸組成,其中丙氨酸(Ala)占比最高達到10.6%,亮氨酸(Leu)占比次之達到10.2%,色氨酸(Trp)和半胱氨酸(Cys)占比最少分別是0.8%和1.2%;帶負電荷殘基(Asp+Glu)總數和帶正電荷殘基(Arg+Lys)的總數相同均為26;其分子式為 C1243H1929N341O345S14,總原子數是3 872;同時該蛋白的不穩定指數為36.03,屬于穩定蛋白;脂肪系數(aliphatic index)為83.01。
2.5.2 LchAD 蛋白的保守結構域、親疏水性和信號肽預測 使用NCBI Conserved Domain 在線軟件預測LchAD 蛋白的保守結構域(圖6?A)發現,LchAD蛋白的氨基酸序列只有一個GrsT 保守結構域,說明LchAD 屬于GrsT 基因家族;使用Prot Scale 在線軟件對LchAD 基因進行親疏水性分析,結果如圖6?B所示,最大的位點是108 號位點,疏水值是2.156,最小的位點在125 和126 號位點,親水值均為?2.511,其中親水性的位點多于疏水性的位點,所以推測該蛋白是親水性蛋白。根據在線軟件的預測,LchAD蛋白存在信號肽的可能性為0.028 4(圖6?C)。

圖6 LchAD 蛋白的保守結構域(A)、親疏水性(B)和信號肽(C)預測Fig.6 Prediction of conserved domain(A), hydrophilicity and hydrophobicity(B)and signal peptide(C)of LchAD protein
2.5.3 LchAD 蛋白的二級和三級結構預測 利用SOPMA 軟件預測LchAD 蛋白的二級結構(圖7?A)。LchAD 蛋白中α-螺旋(Hh)占比43.5%,β-折疊(Ee)占比13.82%,β-轉角(Tt)占比5.69%,無規則卷曲(Cc)占比36.99%。在該蛋白中α-螺旋、β-折疊和β-轉角總量占比63.01%,由此說明該蛋白可能比較穩定。

圖7 LchAD 蛋白的二級結構(A)和三級結構(B)預測結果Fig.7 Predicted results of secondary structure(A)and tertiary structure(B)of LchAD protein
采用SWISS?MODEL 服務器和Alaphfold 開源數據庫對LchAD 蛋白的三級結構進行預測,SWISS?MODEL 服務器共預測出一致度大于30%的模型有6種,最高的一致度為94.31%,但是該UniProtKB 條目未知,很可能已過時,其次是一致度為63.52%的模型,該模型來自于表面活性素合成酶的硫脂酶模塊(surfactin synthetase thioesterase subunit),此結果與Alaphfold 開源數據庫預測結果一致,該蛋白預測的模型如圖7?B 所示。在預測模型圖中可觀察到較多的α-螺旋與β-折疊,說明該預測結果與二級結構預測結果相符。
TE II 蛋白在非核糖體多肽類物質的生物合成中發揮著重要的生理功能[18]。研究表明,TE II 的失活將影響多種非核糖體多肽類物質的生物合成量,例如TE II 失活導致卡西霉素生物合成的前體物質產量下降[14];在非核糖體多肽類物質Coelimycin 的生物合成過程中,TE II 失活直接導致其合成無法繼續[15]。
地衣素生物合成酶的關鍵模塊LchAD 蛋白屬于TE II 家族[27-28],在地衣素生物合成中發揮著重要作用[8-9]。截至目前,對LchAD 蛋白的研究還相對較少。為探究該蛋白的性質和功能,本研究參照鐘桂芳等[20]方法從釀酒大曲中篩選目標菌株,篩菌處理條件為85℃水浴15 min,最終獲得3 株菌株。所獲得的菌株數量與已報道的多數篩菌實驗的結果有差異[29-31]。但該結果與明紅梅等[32]報道的結果相似,其篩菌處理條件為80℃水浴10 min,獲得4 株菌株。本研究所采用的水浴處理溫度和時間對于多數微生物來說相對苛刻,但有利于獲得目標菌株。篩選菌株的發酵產物經質譜串聯方法檢測,在菌株YC7 的發酵產物中出現m/z 為1 007.4、1 021.5 和1 035.4 的離子峰。該檢測結果與R?nning 等[33]的結果相比,缺少m/z 為996.3 的離子峰,但二者所使用的菌株不同,可能是導致最終發酵產物中所含地衣素同系物不完全一致的原因。因此,確認菌株YC7 為地衣素產生菌。
研究發現TE II 蛋白在大腸桿菌中異源表達較易形成可溶性蛋白,但不同的TE II 蛋白所需的誘導條件不盡相同[34-35]。Suharti 等[34]發現硫酯酶TESITB 蛋白能在溫度為37℃,IPTG 濃度為1 mmol/L,誘導4 h 后形成可溶性蛋白。陳維斌[35]在納他霉素(natamycin)工業生產菌株Streptomycetes chattanoogensis L10 中發現了硫酯酶ScnI 蛋白,在0.4 mmol/L IPTG,37℃條件下誘導6 h 后獲得可溶性蛋白。本研究在IPTG 濃度為100 μg/mL,20℃條件下,誘導16 h,獲得分子量為27.62 kD 的可溶性蛋白。本研究首次探索了LchAD 蛋白異源表達及純化的條件,在相對較低的溫度條件下,成功獲得在大腸桿菌中異源表達的LchAD 蛋白,為后續研究奠定基礎。
不同蛋白的結構差異導致功能的多樣性。本研究預測LchAD 蛋白為親水性蛋白,無信號肽,含有一個GrsT 保守結構域。研究表明,TE II 蛋白具有GrsT 保守結構域[36],目前已報道的TE II 的功能包括可作為啟動單元控制物質的合成、水解釋放產物、提供或者去除異常中間體以及去除非活性酰基殘基[18]。GrsT 是一種由短桿菌環肽素(gramicidin S)生物合成基因簇編碼形成的蛋白酶[37],盡管目前對短桿菌環肽素的NRPS 進行了大量的研究,但是GrsT 蛋白的功能依舊未知[38]。Berditsch 等[39]推測GrsT 蛋白可能參與催化酰基載體蛋白(acyl carrier protein, ACP)中脂肪酰基鏈的水解及磷酸化。LchAD 蛋白的二級結構預測結果顯示,該蛋白主要由α-螺旋、β-折疊和β-轉角組成,且在其三級結構預測結果中也可觀察到許多α-螺旋和β-折疊。LchAD 蛋白的三級結構與表面活性素合成酶中硫酯酶模塊相似。地衣素和表面活性素同屬于表面活性素家族(surfactin family)[40]。研究表明表面活性素合成酶和地衣素合成酶極為相似,二者之間只存在細微的差別[41]。這與本研究中LchAD 蛋白的三級結構類似于表面活性素合成酶中硫酯酶模塊的結果一致。研究發現含有α/β 水解酶折疊結構的蛋白具有水解和釋放產物的功能[10,28,42]。Koglin 等[9]分析了表面活性素合成酶中硫酯酶模塊的三維結構發現,該蛋白呈現典型的α/β 水解酶折疊,位于中間的7 個β-折疊被8 個α-螺旋包圍。LchAD 蛋白與表面活性素合成酶中硫酯酶模塊的結構相似,推測LchAD 蛋白可能具有與之相似的功能,但不同蛋白在結構上的微小差異仍能導致其功能的不同。Whicher 等[17]對 RifR 和 RedJ 的結構研究發現,二者的“lid” 結構具有相同的折疊,但仍存在細微的差別,這些差異導致RedJ 的疏水口袋比RifR 大,最終使二者的功能存在一定差異。因此,想要揭示LchAD 蛋白的生物學功能,尚需進一步解析其結構特征。
綜上所述,本研究通過對LchAD 蛋白的二級、三級結構及理化性質預測分析,為該蛋白的結晶條件篩選提供了理論依據,也為利用X 射線衍射解析其結構奠定基礎。但對LchAD 蛋白如何發揮作用及其如何與其他模塊相互作用還有待進一步明確,以便全面認識LchAD 蛋白的生物學功能,進而促進對地衣素生物合成機制的深入解析。研究結果將為深入探究LchAD 蛋白的生物學功能提供理論依據,為解析地衣素生物合成途徑的相關分子機制奠定基礎。
從釀酒大曲中篩選出地衣素產生菌,鑒定并命名為地衣芽孢桿菌YC7。從該菌株中成功克隆LchAD 基因,在IPTG 終濃度為100 μg/mL,溫度為20℃條件下獲得可溶性LchAD 蛋白,其分子量約為27.62 kD。在咪唑濃度為250 mmol/L 時,獲得較高純度的LchAD 蛋白。預測LchAD 蛋白為穩定的親水性蛋白,無信號肽,含有一個GrsT 保守結構域,其三級結構與表面活性素合成酶的硫脂酶模塊相似。
文章所有附圖數據請到本刊官網下載(http://biotech.aiijournal.com/CN/1002?5464/home.shtml)。