方岫琴 王文璟 李華東 張曉婷 朱天驕 車茜 李德海 張國建



摘要:微生物次級代謝產物是微生物在生長過程中產生的非必需性代謝產物,其往往具有獨特的生物活性。隨著對微生物次級代謝產物多樣性研究的不斷深入開展,研究者逐漸發現在實驗室的常規培養條件下微生物的代謝潛能不能完全被激發,從中可獲得的天然產物結構類型遠遠少于其代謝潛能所決定的數量。近年來,隨著基因組技術、分子生物學技術特別是合成生物學相關技術的發展,研究人員開發了如OSMAC、表觀遺傳、異源表達等多種方法,從多個角度多層次地發掘次級代謝產物多樣性。這些方法有效激活潛在的生物合成基因簇、提高了微生物次級代謝產物多樣性,加之與高通量篩選方法聯合應用,能夠顯著改善了微生物活性天然產物的發現效率。本文綜述了微生物次級代謝潛能的激活以及代謝產物高效篩選的方法和技術,為提高微生物次級代謝產物多樣性發掘,加快先導化合物的發現提供參考。
關鍵詞:微生物次級代謝產物;沉默基因簇;代謝潛能;激活;結構多樣性
中圖分類號:R978.1文獻標志碼:A
Methods for exploring the chemical diversity of microbial secondary metabolites
Fang Xiuqin1, Wang Wenjing1, Li Huadong1, Zhang Xiaoting1, Zhu Tianjiao1, Che Qian1,?Li Dehai1, 2, and Zhang Guojian1, 2, 3
(1 Key Laboratory of Marine Drugs, Ministry of Education, School of Medicine and Pharmacy, Ocean University of China, Qingdao 266003; 2 Laboratory for Marine Drugs and Bioproducts of Qingdao National Laboratory for Marine Science and Technology, Qingdao 266237; 3 Marine Biomedical Research Institute of Qingdao, Qingdao 266100)
Abstract Microbial secondary metabolites are non-essential metabolites created by microorganisms throughout the development process, but they frequently exhibit unique biological activities. As research on microbial natural products went on, researchers gradually found that the metabolic capacity of microorganisms could not be completely activated under normal laboratory growth conditions, which led to the fact that the skeletal diversities of natural products obtained from some microbial strains were significantly less than the amount indicated by their potential metabolic capacity. With recent years' development in genomic technology and molecular biology technology, especially synthetic biology-related technologies, several advanced approaches, including OSMAC, epigenetic expression and heterologous expression, have been applied to investigate the diversity of secondary metabolites at the multi-angle and multi-level. Combined with proper screening techniques, those above methods showed increased efficiency in activating silent biosynthetic gene clusters and obtaining diversified secondary metabolites from microbial strains. This article reviewed practical methodologies and strategies for tapping up microbial metabolic potential and screening unique metabolites to provide references for efficiently exploring the variety of microbial natural products and speeding up the identification of drug lead compounds.
Key words? Microbial secondary metabolites; Silent gene clusters; Metabolic potential; Activation; Structural diversity
微生物來源廣泛、成本低廉、基因組較小、次級代謝產物豐富,是重要的藥用資源。微生物次級代謝產物是微生物在特定條件下以初級代謝產物為基礎,經過不同生源途徑合成的生長非必需的代謝產物,其具有結構多樣復雜、生物活性廣泛等特點[1]。自1928年Fleming從真菌中發現青霉素以來,微生物次級代謝產物研究一直作為藥物研發的熱點領域為人們所關注。
研究發現,在微生物體內存在著在常規培養中未激活的次級代謝產物生物合成途徑,而與之相關的系列基因則稱為沉默基因簇(silent biosyntheic gene clusters)[2-3]。例如,通過對青霉菌Penicillium基因組測序分析結果表明,從24個青霉菌的基因組中發現的1317個生物合成基因簇中有61%(798個)編碼PKS、NRPS或PKS-NRPS雜交途徑,其中僅有16%的PKS和NRPS基因簇可以確定生產某類天然產物[4];同樣,關于維吉芽胞桿菌Virgibacillus的基因組測序分析結果表明,在已發現的215個合成基因簇中,僅有少數被發現與次級代謝產物相關,其中約79%的合成基因簇均為未知基因簇[5]。上述實例說明在實驗室常規培養條件下,微生物體內存在著大量處于沉默的基因簇尚未激活。這些沉默的基因資源中蘊含著巨大的次級代謝產物生產潛能,成為微生物藥用資源亟待開發的“暗物質”。因此,如何激活沉默基因簇,點亮這些“暗物質”并獲得新穎的活性先導化合物結構,是進一步探尋微生物次級代謝產物多樣性的重要的途徑。
圍繞著“如何激活沉默基因簇”這一問題,世界各國的微生物學家、化學家近年來發展了諸多新穎的技術和策略,如:OSMAC(one strain many compounds)策略、共培養技術、表觀遺傳修飾、啟動子工程、核糖體工程、合成生物學技術等。上述方法的應用,進一步揭示了微生物次級代謝產物的多樣性。同時,這些技術和策略結合下游的分子網絡、高通量篩選等技術,大大提高了微生物次級代謝產物的發現效率。如圖1所示,本文將從培養條件的優化、基因轉錄與表達的調控、合成生物學的應用和篩選方法的優化4個角度概括微生物次級代謝產物開發技術的進展及其應用,旨在為未來的微生物次級代謝產物多樣性發掘提供思路。
1 培養條件的改變
1.1 OSMAC策略
1999年,Zeeck等[6]提出了OSMAC策略,該策略通過系統地改變培養條件(如:培養基成分、溫度、通氣量等)來發掘微生物次級代謝產物的多樣性。OSMAC策略可能激活微生物體內的沉默基因簇表達,進而產生更多樣的次級代謝產物,該方法操作簡便,效果顯著,已被廣泛應用。
Chen等[7]通過向培養基中添加3% NaBr或3% KI從紅樹林真菌Phomopsis sp. QYM-13中分離得到12個新的細胞松弛素phomopchalasins D-O (1-3,5-12,14),包括1種溴化和2種碘化的細胞松弛素。其中,溴化細胞松弛素對人癌細胞系MDAMB-435具有選擇性細胞毒性(IC50=7.4 μmol/L)。
Lei等[8]通過向大米培養基中添加3%人工海鹽,從海綿來源真菌異角疫霉Pestaltiopsis heterocornis XWS03F09中分離出9個新化合物,包括8個新的聚酮衍生物heterocornols Q-X和1個新的神經酰胺ceramide,其中heterocornols W-X可以顯著抑制LPS誘導的NO的產生,其活性與抗炎藥物地塞米松相當。
通過OSMAC策略發掘微生物次級代謝產物多樣性的例子多有報道,但其背后的調控機制仍不甚明了。隨著相關菌株生理生化功能的不斷揭示,OSMAC策略對沉默基因表達調控的影響機制會越來越清晰,這將為培養條件的優化提供更為清晰的指導。
1.2 共培養技術
近幾十年來,研究者們逐漸意識到一些生化過程需要多種微生物的共同參與才能進行,并且不同菌株在同一生境中相互作用、相互影響,對復雜次級代謝產物的產生有促進作用。在此基礎上,共培養技術(coculture)應運而生。共培養技術是指在相對封閉的環境中培養2種或2種以上微生物,通過對其原始生存環境的模擬,達到改變相應微生物次級代謝產物的效果[9-11]。共培養技術可以看作OSMAC策略的延伸,該技術已然成為了發掘微生物次級代謝產物多樣性的有效途徑之一。例如,Thissera等[12]將小麥植物根系相關細菌Pantoea aggolomerans和棗棕櫚葉衍生真菌Penicillium citrinum(PC)使用PDA培養基進行共培養,發現了2個新的普利西汀衍生物pulicatin H、I和6個已知化合物,其中pulicatin H對PC具有較強的抗菌活性。Li等[13]運用多代謝物交叉喂養(multi-metabolite cross-feeding,MMCF)的方法,通過對氨基酸合成代謝和能量代謝進行調控,成功構建了穩定的微生物共培養體系,并且在體系中引入代謝物響應性的生物傳感器,進一步提高了體系的可調節性。將該體系運用于3菌株的共培養體系中,最終實現了水飛薊賓(silybin)和異水飛薊賓(isosilybin)的合成。
雖然共培養技術應用廣泛,但是微生物生態關系復雜,且易受環境影響,故深入研究菌株之間的相互作用機制,對進一步拓展共培養技術在次級代謝產物挖掘中具有重要意義。目前,楊志超等[14]總結了群體感應現象對乳酸菌產細菌素的調控機制,并解析了不同因素對其產細菌素的促進機制。李洪濤等[15]總結了微生物共培養互作機制研究的方法及進展。徐德陽等[9]也對微生物共培養中存在的協同代謝作用、誘導作用和基因轉移現象進行了分析與總結。然而,微生物間的相互作用機制十分復雜,尚未完全解析,仍待進一步研究闡明。
1.3 表觀遺傳修飾劑的添加
自2007年首次報道微生物次級代謝的調控與表觀遺傳修飾具有相關性開始,表觀遺傳修飾方法成為了進一步發掘微生物次級代謝產物多樣性的新方法[16]。表觀遺傳修飾是指在DNA的序列不發生改變的條件下,基因的表達發生穩定且可遺傳變化的現象。其主要作用機制包含2個方面:①針對DNA的甲基化修飾和各種組蛋白的修飾;②非編碼的RNA分子參與影響翻譯后修飾過程[17-21]。其中,組蛋白的修飾部分因操作簡便、對菌株次級代謝行為影響明顯,在實驗室研究中具有廣泛的應用。向培養基中添加表觀遺傳化學調控劑是該方法最直接的應用。用于添加的表觀遺傳化學修飾抑制劑主要包括2種:DNA甲基轉移酶抑制劑(DNA methyltransferase inhibitors,DNMTi)和組蛋白去乙酰化酶抑制劑(histone deacetylase inhibitors,HDACi)。
朱靜軒等[22]通過向培養基中添加化學表觀遺傳調控劑——組蛋白去乙酰化抑制劑(C646)對海洋來源雜色曲霉(Aspergillus versicolo)進行化學表觀遺傳調控,最終得到3個新化合物——彎孢霉菌素(curvularin)、環形(L-色氨酸-L-苯丙氨酸)[cyclo-(L-Trp-L-Phe)]和二苯二酚(diorcinol);Wu等[23-24]通過向培養基中添加表觀遺傳化學調控劑—組蛋白去乙酰化酶抑制劑辛二酸苯胺異羥肟酸(SAHA),使1株海兔來源的土曲霉(Aspergillus terreus)RA2905的代謝譜發生變化,最終分離得到兩個新的阿斯呋喃酮(asperfuranone)對映體及兩個新的阿斯呋喃酮化合物asperfuranone A和B,這是首次報道的從天然產物中發現含有芐基呋喃酮和芐基吡喃酮骨架的結構。
2 基因轉錄和表達的調控
通過改變微生物的培養狀態激活沉默基因簇的表達,其最適培養條件的確定需要重復大量的篩選工作,且受菌株內在轉錄過程變化的影響,其不同培養批次的代謝產物圖譜依然存在重現性差的問題。隨著分子生物學技術的不斷更新,從基因層面對菌株進行定向改造越來越受到重視,尤其是轉錄調控、啟動子工程和核糖體工程等方法的應用,可以更為精準地調控代謝過程,獲得多樣化的次級代謝產物(圖2)。
2.1 轉錄調控
直接添加表觀遺傳化學調控劑的方法無須了解菌株的遺傳背景,應用簡便,但該方法缺乏深入的機制解析,使用存在不確定性,且目前能選擇的表觀遺傳修飾劑種類較少[25-26]。因此,直接從基因或蛋白層面進行定向改造可以更好地提高微生物次級代謝產物的多樣性。DNA甲基轉移酶(DNA methyltransferase,DNMT,如保守調控因子laeA、llm1等),與組蛋白脫乙酰酶(histone deacetylase,HDAC)功能的解析在分子酶學層面為實現表觀遺傳調控提供了可能。
早在2004年,Keller等[27]首次報道了laeA基因作為絲狀真菌次級代謝的轉錄調控因子,可以調節多種次級代謝產物基因簇的表達,從而影響菌株的次級代謝圖譜。近年來,本課題組還應用過表達轉錄調控因子laeA的方法對真菌次級代謝產物進行發掘,并獲得了許多結構多樣的活性代謝產物。2019年,本課題組通過高表達1株雙齒青霉菌(Penicillium dipodomyis) YJ-11自身的laeA基因,豐富了其中sorbicillinoid類化合物的代謝圖譜,從中分離得到了2個該類新化合物10,11-dihydrobislongiquinolide和10,11,16,17-tetrahydrobislongiquinolide[28];2020年,通過對laeA基因的過表達,從1株溴化青霉(Penicillium brocae) HDN-12-143中分離得到1個新的煙熏氯醇(fumigatin chlorohydrin)和1個新的異煙熏氯醇(iso-fumigatin chlorohydrin),這兩個化合物均對HL-60癌細胞系均表現出一定的細胞毒作用[29];2022年,同時對laeA基因和生物合成剪切酶MpaB基因進行過表達,從1株海洋來源鏈格孢菌(Alternaria alternata) JJY-32分離得到4種新的ACTG-毒素-硫代萜類三環交鏈芳烴O-R(meroterpenoids tricycloalternarenes O-R),其對TLR4轉染的巨噬細胞(RAW264.7)均表現出較強的抗炎活性[30]。
llm1基因與laeA基因具有類似的結構域,故調控llm1基因表達量也可能促進微生物次級代謝產物多樣性的產生。王云勝[31]構建了llm1基因過表達的冠突散囊菌(Eurotium cristatum)突變體,在PDB培養基中進行培養,最終通過HPLC檢測發現llm1過表達的突變體相比于野生型產生了3個新的色譜峰,并且通過antiSMASH數據庫對轉錄組數據進行分析,結果表明過表達llm1基因能激活冠突散囊菌次級代謝基因簇的表達。
2.2 啟動子工程
對于微生物來說,影響基因表達水平的最重要因素是轉錄水平,基因的啟動子序列在其中發揮著重要作用[32]。目前,啟動子工程采用了許多策略,如:內源性啟動子的改造和替換、啟動子文庫的篩選和構建等。
啟動子改造和替換是激活基因簇的有力手段,前者直接對內源啟動子進行突變改造或用特定的轉錄因子與之結合來改變啟動子強度[33];后者將原有啟動子替換,徹底改變受控基因的表達譜,在轉錄水平上實現對關鍵基因的精準控制。
Wu等[34]在枯草芽胞桿菌(Bacillus subtilis)中將啟動子PgamA中轉錄因子GamR的結合位點gamO2插入到Pveg啟動子序列中,實現了對轉錄因子結合位點(transcription factor binding site,TFBS)的優化,成功構建了可以響應胞內6-磷酸氨基葡萄糖(glucosamine-6-phosphate,GlcN6P)的合成啟動子,成功激活了GlcN6P的沉默生物合成基因簇。Wang等[35]將包含兩個廣泛應用的人工啟動子kasOp*的片段插入TiaP2和聚酮骨架的編碼基因,首次在鏈霉菌Streptomycetaceae宿主中成功異源表達了非達霉素(fidaxomicin)生物合成基因簇,獲得了6個苷元,其中4個為新化合物,補充和拓展了非達霉素苷元的合成途徑。
啟動子文庫的篩選和構建也是啟動子工程常用的方法。但是傳統啟動子文庫的構建耗時費力,且難以獲得理想的啟動子。因此,利用生物信息學和計算機科學工具,預測、設計、優選和改造啟動子[36]等方法正受到越來越多的關注和研究。
非保守區隨機突變(non conservative random mutation,NCR)可用于快速生成不同強度的大規模啟動子庫,并被廣泛應用于代謝途徑的通量優化。Wei等[37]設計了一個基于谷氨酰胺-10(NNTANANT)和-35(NNGNCN)共識區、保守RBS(AAAGGA)元件和60個隨機核苷酸的啟動子庫,其所獲得的啟動子可以有效地調控基因的表達,并在很大范圍內表現出不同的強度。在此基礎上,該團隊還開發了一種全新的基于啟動子庫的多模塊組合(promoter library-based module combination,PLMC)技術,以有效地優化谷氨酰胺中基因的表達。
啟動子工程也常與其他技術聯用,以提高啟動子工程的效率。Wei等[38]建立了一種基于流式細胞術、在單細胞分辨率下檢測超折疊綠色熒光蛋白的絲狀真菌啟動子的定量評估方法,其中所鑒定的活性最強的啟動子PzipA和PsltA分別比常用的組成型啟動子PgpdA高2.9倍和1.5倍,并應用這兩個啟動子激活原生宿主煙曲霉(Aspergillus fumigatus)及異源宿主構巢曲霉(Aspergillus nidulans)中的沉默非核糖體肽合成酶基因Afpes1,并最終在其代謝產物中發現了多種新的環狀四肽衍生物,為真菌中的天然產物發現提供了一種創新策略。
人工智能在啟動子工程方面展現出良好前景,Lafleur等[39]通過大規模并行分析,將生物物理學和機器學習相結合,開發出一個可預測任何σ70啟動子序列的特異性轉錄起始率的346參數模型。同時,利用機器學習進行人工啟動子的設計、創制和優化的研究已經蓬勃興起,并取得了一系列突破性的成果。Wang等[40]以大腸埃希菌中天然啟動子序列為基礎,通過研究不同位置核苷酸的互作關系,利用計算機從頭設計啟動子,將預測模型與深度生成模型相結合,經過兩輪優化后發現超過70%的啟動子具有功能性,且與大腸埃希菌的基因組沒有明顯的序列相似性,從而建立了啟動子設計“從端到端”的方法,最終成功構建了基于人工智能從頭設計啟動子的框架;Van Brempt等[41]通過使用來自熒光激活細胞分類啟動子庫的高通量DNA測序數據來訓練卷積神經網絡,從而實現對啟動子轉錄起始頻率和σ因子特異性啟動子正交性的預測,并以此作為在線啟動子設計工具(ProD)的基礎,為定制的遺傳系統提供定制的啟動子。
2.3 核糖體工程
“核糖體工程(ribosome engineering)”這一概念由日本國家食品研究所的Ochi教授首先提出[42]。該技術基于微生物嚴謹反應的激活,通過引入抗生素選擇壓力,其核糖體蛋白或RNA聚合酶發生突變,使突變后菌株對環境脅迫的耐受性增強,并伴隨次級代謝產物多樣性的產生,以此篩選耐藥菌株。核糖體工程在天然產物發現方面的應用潛力受到研究者持續的關注。
在抗生素壓力的選擇上,鏈霉素、利福平和慶大霉素的研究開展較多,且篩選效果相對較好。Hosaka等[43]使用上述3種抗生素對1068株土壤放線菌進行了大規模的篩選,他們發現在這種壓力下,土壤中43%的鏈霉菌和6%的非鏈霉菌放線原本具備不生產抗生素的菌株最終都能夠明顯進化出生產抗生素的能力,最后從1株放線菌突變株中分離得到一系列新型的大環內酰胺類抗生素piperidamycin。深入研究發現其突變體生產抗生素的能力得到顯著提高是由于其RNA聚合酶的突變,或者核糖體蛋白基因s12的突變而引起二者親和力的增加所導致。
核糖體工程的應用還可以激活沉默的BGC,并在其他細菌或真菌中發現新的活性化合物。Wu等[44]用新霉素和DMSO對海洋產紫青霉(Penicillium purpurogenum) G59進行抗性篩選,與之前培養結果相比,發現了5種新的次級代謝產物:curvularin, citrinin, penicitrinone A, erythro-23-O-methylneocyclocitrinol和22E-7α-methoxy-5α,6α-epoxyergosta-8(14),22-dien-3β-ol,并且這5個化合物對人癌細胞系K562、HL-60、HeLa和BGC-823均有不同程度的抑制。
目前核糖體工程與代謝工程聯用的例子較多,其主要的應用方向為微生物次級代謝產物產量的提升,但是其對于微生物次級代謝產物多樣性的發掘也具有廣闊的前景。
3 合成生物學和異源表達技術的應用
合成生物學是將工程化的思維邏輯應用到生物合成中來,學習自然的生物合成機制,在此基礎上設計和構建全新的生物元件、裝置和系統,或改良和優化已有的天然生物合成系統。其中,微生物的生物合成基因簇是應用基礎。合成生物學通過對合成基因簇的改造及表達調控,借助不同的底盤細胞,如酵母菌、大腸埃希菌等,實現高效異源表達所需化合物的目的,該方法也是目前研究的熱點之一(圖3)。如何合理設計和構建生物元件、高效獲取目的基因片段、構建良好的異源表達體系等問題是該技術所涉及的關鍵環節。
3.1 基因簇直接克隆與異源表達
隨著生物信息學技術的發展,微生物的合成基因簇得到了快速的解析,在此基礎上利用合成生物學和異源表達的方法,研究者可以高效獲得結構新穎的天然產物。但是,目標基因的獲取,尤其是大片段目標基因能否成功獲取直接決定了異源表達能否開展實施。
傳統方法通常通過構建基因組文庫來進行篩選,該方法不僅資源投入大,還受到片段長度的限制,無法對大片段的目的基因進行有效提取。基于此,越來越多的基因簇克隆技術不斷涌現,為微生物異源表達及微生物次級代謝產物多樣性的發掘注入了新的活力。
Fu等[45]提出了RecET直接克隆技術,即利用大腸埃希菌全長Rac前噬菌體蛋白RecE和其伴侶RecT重組蛋白將目的基因直接克隆到表達載體中,運用該技術對發光桿菌(Photorhabdus luminescens) TT01的基因組進行挖掘,成功克隆出10個未知PKS-NRPS基因簇中的9個,并異源表達出了其中2個基因簇,最終鑒定得到了3個新的次級代謝產物——發光霉素A(luminmycin A)和發光酰胺A/B(luminmide A/B)。但RecET直接克隆技術不能克隆大于50 kb的DNA片段。對此,Wang等[46-47]將RecET系統和Redαβ DNA修飾系統整合到一個大腸埃希菌宿主中,實現了對基因組克隆、轉移和異源表達的無縫對接,并將該技術命名為Red/ET重組技術;同時,該團隊利用核酸外切酶介導的體外多分子組裝和RecET直接克隆技術實現了將克隆載體和目的基因導入同一個宿主的同時,完成對大于100 kb的細菌基因組DNA進行直接克隆,并將該技術命名為ExoCET技術。在此基礎上,Song等[48]利用Redαβ介導的線環重組、CcdB介導的反向篩選和核酸外切酶介導的體外同源重組,實現了對大型復雜基因簇中的基因編輯,并且通過該方法完成了對多殺菌素的基因簇的改造,獲得了新穎的丁烯基多殺菌素A(butenyl-spinosyn A),并將該技術命名為RedEx技術。
TAR(Transformation associated recombination)克隆技術,即轉化偶聯重組技術,是1種基于酵母的同源重組系統、從復雜基因組中選擇性地快速克隆目的DNA片段的方法,該方法也是目前已報道的唯一能選擇性克隆300 kb及以上大片段的方法。例如,Yamanaka等[49]利用TAR克隆技術對海洋放線菌Saccharomonospora sp. CNQ-490進行產物多樣性發掘,表達出一個67 kb的非核糖體肽合成酶生物合成基因簇并在模型宿主細胞Streptomyces coelicolor中生產出一種新的抗生素taromycin A,成功激活沉默的生物合成途徑,體現了TAR直接克隆技術對生物合成流水線的轉移、激活,以及多樣化次級代謝物生產方面的便捷和高效。
與此同時,基因編輯與基因簇克隆的結合也催生出許多新方法。Jiang等[50]利用CRISPR/Cas9和Gibson組裝開發了1種在體外將細菌基因組中特定的基因簇直接克隆的方法,稱為CATCH技術(Cas9-assisted targeting of chromosome segments),該技術可在1個步驟內,完成對幾乎任意的、長達100 kb的細菌基因組序列的有效靶向克隆。Liang等[51]開發了一種CRISPR-Cas12a介導的快速直接生物合成基因簇克隆法,稱為CAT-FISHING,用于直接捕獲大型BGCs。
3.2 功能基因的整合重構及異源表達
天然產物生物合成途徑的異源表達不僅可以結合基因組挖掘技術,將隱性生物合成基因簇在異源宿主細胞中進行功能性表達,還可以結合生物合成工程,將不同來源的基因進行組合和重新排列來產生一系列新的類似物。這種策略極大地促進了新活性化合物的發現,為進一步發掘微生物次級代謝產物多樣性提供新思路。下面我們主要介紹在合成生物學指導下,重組基因或重構生物合成途徑在異源表達方面的應用。
Zhang等[52]借助基于“脫氧單糖的重構”和“糖基模塊替換” 對紅霉素的基因簇進行了重構整合,在大環內酯苷元上引入不同的糖基化修飾,生產了一系列對紅霉素耐藥菌株具有抑制活性的紅霉素類似物。Huffman等[53]從細菌核苷酸合成途徑中的補救合成途徑入手,設計了逆向合成路線,通過定向進化獲得5種穩定的合成酶,在4種輔酶的輔助下實現了抗HIV藥物伊斯拉曲韋(islatravir)生物全合成,相比于化學全合成工藝,步驟更少,產量更高。
隨著啟動子工程、基因簇克隆以及基因編輯技術的不斷發展,未來在合成生物學理論指導下的異源表達技術在微生物次級代謝產物多樣性發掘中具有廣闊的應用前景。
3.3 人工智能指導合成生物學技術應用
生物元件的設計是合成生物學的基石,其固有的復雜性限制了對其工程化的改造,因此如何實現合成核心元件的標準化并提高其與底盤細胞的適配性是合成生物學領域的一個核心的研究方向。
生物信息學與人工智能(artificial intelligence,AI)不斷發展,人們有望于在設計和優化生物元件、代謝工程和合成途徑等方面取得更進一步的突破。Li等[54]通過人工智能技術對芽胞桿菌Bacillus sp.中催化碳-碳雙鍵的不對稱氫胺化中所使用的天冬氨酸酶YM55-1進行重新設計,獲得了具有高度選擇性的β-氨基酸合成酶,從而構建了高效合成β-氨基酸的工程菌,首次完成了由計算指導來發現新型合成酶的應用,實現了人工智能技術在微生物次級代謝產物多樣性挖掘方面的成功運用。Yeh等[55]開發了一種基于深度學習的蛋白設計策略——family-wide hallucination,該策略可以產生大量不同結合口袋的理想蛋白結構,并設計出編碼這些結構的序列,通過該策略,團隊成功實現了可選擇性催化化學發光的人造熒光素酶的從頭設計,該策略的成功應用,在人工設計酶領域堪稱里程碑意義的突破,這一突破意味著利用計算機可以實現尚未在自然界中發現的人工酶的從頭設計,從而完成對化學反應定制酶的需求。
此外,人工智能還可以用于合成生物學的預測,極大地減少逆向設計的大量試錯成本。然而,人工智能對合成生物學的影響依舊有限,仍局限于特定的數據集和研究問題。
目前,研究者們面臨的挑戰仍是如何使其適用于更廣泛的應用程序和其他數據集。對此,人工智能技術已經結合了生物物理、機器學習和強化學習模型,以求更有效地進行預測,如:ReFeaFi[56]、生成對抗網絡(generative adversarial network,GAN)[57]等,為調控元件的識別、活性強度預測、元件從頭設計等方面提供了新思路[58]。
4 篩選方法的優化
微生物次級代謝產物的篩選方法是影響發掘效率的關鍵因素之一。一旦獲得或即將獲得這些產物,高效地篩選和分離目標化合物成為亟須解決的問題。針對這一問題,研究者們致力于改進篩選體系,力求簡化和加速篩選、分離過程,以提高微生物次級代謝產物多樣性的發掘效率。
4.1 高通量篩選策略
高通量篩選技術(high throughput screening,HTS)將多種技術(如組合化學、基因組學、生物信息學、自動化和機器人技術)相結合,實現快速、高效、自動化的篩選。這種方法已廣泛應用于微生物次級代謝產物的篩選,隨著應用范圍的擴大,其重要性逐漸凸顯,在微生物定向進化中也發揮著至關重要的作用。
定向進化(directed evolution)是利用實驗室的條件來模擬自然進化的過程[59],通過對突變體次級代謝產物的篩選,可以用于發掘微生物次級代謝產物的多樣性。這一過程需要對大量的突變體進行篩選,因而一個靈敏、可靠且快速的高通量篩選方法十分重要。熒光激活細胞分選技術(fluorescence-activated cell sorting,FACS)[60],即一種將酶活性轉化為熒光信號以對單細胞進行高效快速分選的技術。Tan等[61]開發了一種熒光激活細胞的分選系統,運用超高通量篩選的方法(107個突變體/h)對突變體進行篩選,成功從幽門螺桿菌(Helicobacter pylori) strain NCTC 11639的突變體中篩選得到了α-1,3-巖藻糖基轉移酶活性提高14倍的突變體M32。近年來,微流控技術(fluidics)也從最初的微電子工業應用逐漸發展到生命科學領域當中。微流控技術是一種將單個細胞包埋于液滴中,以實現對單細胞及其胞外代謝產物的分析技術。應用微流控技術,張道遠等[62]綜合考慮了基于液滴的數字PCR(Droplet Digital PCR,ddPCR)和基于芯片的ddPCR的優勢及不足,設計并制備了高集成度的數字PCR微流控芯片,完成了PCR的高通量、高通用及高進樣效率的要求,為PCR反應的高通量篩選提供了可能。高通量篩選技術為定向進化賦能將有助于高效解析生物合成的基因簇,并將其運用于微生物次級代謝產物多樣性的發掘中。通過對微生物定向進化中突變體的高通量篩選,可以定向得到合成生物學的進化元件,其篩選效率直接決定了微生物次級代謝產物多樣性發掘的效率。
隨著計算機技術的不斷進步,人工智能同樣在輔助篩選領域得到越來越多的應用。如朱尤卓等[63]詳述了深度學習模型——卷積神經網絡、生成對抗網絡和循環神經網絡等在抗菌肽藥物篩選和設計中的應用,但由于深度學習生成的抗菌肽缺乏指導理論,仍存在臨床毒副作用過大等弊端;宋益東等[64]針對目前較新的蛋白質功能及結合位點的預測方法進行了總結及優劣分析,并提出了對目前預測方法的改進方向,為更好地預測蛋白質功能及結合位點提供了新的思路;胡如云等[65]詳闡了機器學習在合成生物學領域的調控元件設計、酶催化元件的設計、功能多肽設計和代謝過程等方面的應用。可見計算機技術為高效篩選微生物次級代謝產物提供了新思路。
4.2 分子網絡技術
近年來,隨著生化信息學的快速發展,一大批強大的工具和網絡平臺不斷涌出,掀起了一場“天然產物分離藝術”的革命。其中,基于質譜的分子網絡分析技術是最具代表性的一類多功能便捷工具,其在天然產物分離工作中表現出的快速去重復化、低成本、高效性,極大地簡化了傳統的分離工作,為研究者發現新的生物活性分子提供了一條更為科學和便捷的方法。
基于串聯質譜(MS/MS)的分子網絡是一種生物信息學策略,用于可視化和解釋非目標MS數據。MS/MS分子網絡利用藥物代謝物中分子間結構的相似性,通過比較每個MS/MS光譜之間的光譜相似程度,將MS/MS光譜作為分子網絡映射到數據集中。分子網絡在天然產物分離上的應用大致可以分為3類:①利用現有質譜數據庫對已知化合物進行自動查詢;②利用已知的光譜特征對待查詢的光譜進行分析;③利用現有數據庫對所有化合物進行全面注釋并生成推定結構。關于分子網絡技術的原理及應用進展近期已有多篇綜述進行評述總結[66-68],這里就不再贅述。
在MS/MS分子網絡的指導下,本實驗室[69]從海洋沉積物中衍生的放線菌Nocardiopsis sp. HDN154086中獲得了5個新穎的對三聯苯并噻唑衍生物(p-terphenyl derivatives)nocarterphenyls D-H(1~5),其中化合物1對MRSA具有顯著的抗菌。Han等[70]采用分子網絡方法從海綿衍生的雜色曲霉(Aspergillus versicolor)中靶向分離出一系列新的柄曲霉素衍生物sterigmatocystins A~C。本單位Shao等[71]在MS/MS分子網絡的指導下,從珊瑚衍生真菌花斑曲霉中分離出4個新的環七肽(cycloheptapeptides)與3個曲霉酰胺類似物asperversiamide A~C,并在此基礎上半合成出一系列衍生物,進而系統評價了其潛在的抗結核活性。
5 總結與展望
一直以來,從微生物中尋找活性次級代謝產物就是先導化合物開發的重要途徑,但是現有的技術和方法在產物多樣性的開發及高通量篩選等方面仍存在局限性,尤其是常規培養中無法被激活的沉默生物合成途徑,更是微生物次級代謝產物研究的最大阻礙。為此,研究者開發了多種策略,試圖從不同層面解決這一問題。
在改變培養條件層面,OSMAC策略與共培養技術通過改變培養環境來激活菌株代謝潛能,表觀遺傳修飾則可通過簡單地添加化學調控劑挖掘多種結構新穎的次級代謝產物。在基因轉錄和表達層面,啟動子工程和核糖體工程可以在轉錄和翻譯水平上實現對目標基因更為精細化的調控,以達到提高產量,獲取更多新穎次級代謝產物的目的。此外,通過合成生物學技術對功能基因實施突變改造,并完成對生物合成流水線的重構甚至異源表達能夠實現對天然產物的精準合成,高效獲得多樣化的活性天然產物。在篩選方法優化層面,基于測序技術的高通量篩選新策略與分子網絡技術的指導為高效篩選微生物次級代謝產物提供了新思路、指明了發展方向。
然而方法與技術的應用與發展并不是彼此割裂、相互獨立的,在實際科研中,研究人員常采用多方法聯用、多技術交叉的策略,多角度挖掘和改良微生物的代謝潛力與代謝能力。同時,基因組學、代謝組學和生物信息學的蓬勃發展也為微生物代謝潛力探索挖掘提供了強有力的支持。隨著更多更全面的次級代謝產物的基因信息被解析,其生物合成途徑與機制逐漸被揭示,越來越多的沉默基因簇將會被發現并激活,迎來微生物次級代謝產物快速開發的新時代。
參 考 文 獻
Keller N P, Hohn T M. Metabolic pathway gene clusters in filamentous fungi[J]. Fungal Genet Biol, 1997, 21(1): 17-29.
Scherlach K, Hertweck C. Mining and unearthing hidden biosynthetic potential[J]. Nat Commun, 2021, 12(1): 3864.
Reen F J, Romano S, Dobson A D, et al. The sound of silence: Activating silent biosynthetic gene clusters in marine microorganisms[J]. Mar Drugs, 2015, 13(8): 4754-4783.
Van Lanen S G, Shen B. Microbial genomics for the improvement of natural product discovery[J]. Curr Opin Microbiol, 2006, 9(3): 252-260.
Othoum G, Bougouffa S, Bokhari A, et al. Mining biosynthetic gene clusters in Virgibacillus genomes[J]. Bmc Genomics, 2019, 20(1): 696.
Schiewe H J, Zeeck A. Cineromycins, gamma-butyrolactones and ansamycins by analysis of the secondary metabolite pattern created by a single strain of Streptomyces[J]. J Antibiot (Tokyo), 1999, 52(7): 635-642.
Chen Y, Yang W, Zou G, et al. Cytotoxic bromine- and iodine-containing cytochalasins produced by the mangrove endophytic fungus Phomopsis sp. QYM-13 using the OSMAC approach[J]. J Nat Prod, 2022, 85(5): 1229-1238.
Lei H, Bi X, Lin X, et al. Heterocornols from the sponge-derived fungus Pestalotiopsis heterocornis with anti-inflammatory activity[J]. Mar Drugs, 2021, 19(11): 585.
徐德陽, 王莉莉, 杜春梅. 微生物共培養技術的研究進展[J]. 微生物學報, 2015, 55(9): 1089-1096.
Okada B K, Seyedsayamdost M R. Antibiotic dialogues: Induction of silent biosynthetic gene clusters by exogenous small molecules[J]. Fems Microbiol Rev, 2017, 41(1): 19-33.
陳雷, 申琳溪, 王光玉. 海洋動物來源微生物的共培養研究進展[J]. 微生物學通報, 2021, 48(1): 278-287.
Thissera B, Alhadrami H A, Hassan M, et al. Induction of cryptic antifungal pulicatin derivatives from Pantoea agglomerans by microbial co-culture[J]. Biomolecules, 2020, 10(2): 268.
Li X, Zhou Z, Li W, et al. Design of stable and self-regulated microbial consortia for chemical synthesis[J]. Nat Commun, 2022, 13(1): 1554.
楊志超, 顏挺威, 邱薇, 等. 共培養條件下群體感應系統對乳酸菌產細菌素的研究進展[J]. 中國農學通報, 2023, 39(15): 139-146.
李洪濤, 周皓, 丁中濤. 微生物共培養產生新穎活性次生代謝產物的研究進展[J]. 云南大學學報(自然科學版), 2023, 45(2): 493-512.
Shwab E K, Bok J W, Tribus M, et al. Histone deacetylase activity regulates chemical diversity in Aspergillus[J]. Eukaryot Cell, 2007, 6(9): 1656-1664.
黃祿. 三株真菌次級代謝產物的化學表觀遺傳調控研究[D]. 杭州: 浙江工業大學, 2019.
Mohammad H P, Barbash O, Creasy C L. Targeting epigenetic modifications in cancer therapy: erasing the roadmap to cancer[J]. Nat Med, 2019, 25(3): 403-418.
Zhao S, Allis C D, Wang G G. The language of chromatin modification in human cancers[J]. Nat Rev Cancer, 2021, 21(7): 413-430.
Ye Y, Li L, Dai Q, et al. Comprehensive analysis of histone methylation modification regulators for predicting prognosis and drug sensitivity in lung adenocarcinoma[J]. Front Cell? Devel Biol, 2022, 10: 991980.
Millan-Zambrano G, Burton A, Bannister A J, et al. Histone post-translational modifications-cause and consequence of genome function[J]. Nat Rev Genet, 2022, 23(9): 563-580.
朱靜軒, 王婷婷, 周珂欣, 等. 表觀遺傳試劑誘導海洋真菌Aspergillus versicolor DJ013產生次級代謝產物的研究[J]. 中國海洋藥物, 2017, 36(1): 14-18.
Wu J S, Shi X H, Yao G S, et al. New Thiodiketopiperazine and 3,4-dihydroisocoumarin derivatives from the marine-derived fungus Aspergillus terreus[J]. Mar Drugs, 2020, 18(3): 132.
Wu J S, Shi X H, Zhang Y H, et al. Benzyl furanones and pyrones from the marine-derived fungus Aspergillus terreus induced by chemical epigenetic modification[J]. Molecules, 2020, 25(17): 3927.
吳金濤, 彭曉月, 繆莉, 等. 表觀遺傳修飾法增加真菌次級代謝產物化學多樣性的應用[J]. 中國海洋藥物, 2021, 40(4): 64-71.
Pacheco Tapia R, Vásquez-Ocmín P, Duthen S, et al. Chemical modulation of the metabolism of an endophytic fungal strain of cophinforma mamane using epigenetic modifiers and amino-acids[J]. Fungal Biol-Uk, 2022, 126(5): 385-394.
Bok J W, Keller N P. LaeA, a regulator of secondary metabolism in Aspergillus spp.[J]. Eukaryot Cell, 2004, 3(2): 527-535.
Yu J, Han H, Zhang X, et al. Discovery of two new sorbicillinoids by overexpression of the global regulator LaeA in a marine-derived fungus Penicillium dipodomyis YJ-11[J]. Mar Drugs, 2019, 17(8): 446.
Wang L, Zhang X, Zhang K, et al. Overexpression of global regulator pbrlaea leads to the discovery of new polyketide in fungus Penicillium brocae HDN-12-143[J]. Front Chem, 2020, 8: 270.
Wang L, Jiao J, Liu D, et al. Cytotoxic meroterpenoids from the fungus Alternaria sp. JJY-32[J]. Chem Biodivers, 2020, 17(7): e2000226.
王云勝. 過表達llm1基因對冠突散囊菌次級代謝及發育的影響[D]. 貴陽: 貴州師范大學, 2022.
Blazeck J, Alper H S. Promoter engineering: Recent advances in controlling transcription at the most fundamental level[J]. Biotechnol J, 2013, 8(1): 46-58.
Blazeck J, Alper H. Systems metabolic engineering: genome-scale models and beyond[J]. Biotechnol J, 2010, 5(7): 647-659.
Wu Y, Chen T, Liu Y, et al. Design of a programmable biosensor-CRISPRi genetic circuits for dynamic and autonomous dual-control of metabolic flux in Bacillus subtilis[J]. Nucleic Acids Res, 2020, 48(2): 996-1009.
Wang W, Li X, Wang J, et al. An engineered strong promoter for streptomycetes[J]. Appl Environ Microbiol, 2013, 79(14): 4484-4492.
Gilman J, Singleton C, Tennant R K, et al. Rapid, heuristic discovery and design of promoter collections in non-model microbes for industrial applications[J]. Acs Synth Biol, 2019, 8(5): 1175-1186.
Wei L, Xu N, Wang Y, et al. Promoter library-based module combination (PLMC) technology for optimization of threonine biosynthesis in Corynebacterium glutamicum[J]. Appl Microbiol Biotechnol, 2018, 102(9): 4117-4130.
Wei P L, Fan J, Yu J, et al. Quantitative characterization of filamentous fungal promoters on a single-cell resolution to discover cryptic natural products[J]. Sci China Lif Sci, 2023, 66(4): 848-860.
Lafleur T L, Hossain A, Salis H M. Automated model-predictive design of synthetic promoters to control transcriptional profiles in bacteria[J]. Nat Commun, 2022, 13(1): 5159.
Wang Y, Wang H, Wei L, et al. Synthetic promoter design in Escherichia coli based on a deep generative network[J]. Nucleic Acids Res, 2020, 48(12): 6403-6412.
Van Brempt M, Clauwaert J, Mey F, et al. Predictive design of sigma factor-specific promoters[J]. Nat Commun, 2020, 11(1): 5822.
Ochi K. From microbial differentiation to ribosome engineering[J]. Biosci Biotechnol Biochem, 2007, 71(6): 1373-1386.
Hosaka T, Ohnishi-Kameyama M, Muramatsu H, et al. Antibacterial discovery in actinomycetes strains with mutations in RNA polymerase or ribosomal protein S12[J]. Nat Biotechnol, 2009, 27(5): 462-464.
Wu C J, Yi L, Cui C B, et al. Activation of the silent secondary metabolite production by introducing neomycin-resistance in a marine-derived Penicillium purpurogenum G59[J]. Mar Drugs, 2015, 13(4): 2465-2487.
Fu J, Bian X, Hu S, et al. Full-length RecE enhances linear-linear homologous recombination and facilitates direct cloning for bioprospecting[J]. Nat Biotechnol, 2012, 30(5): 440-446.
Wang H, Li Z, Jia R, et al. RecET direct cloning and redalphabeta recombineering of biosynthetic gene clusters, large operons or single genes for heterologous expression[J]. Nat Protoc, 2016, 11(7): 1175-1190.
Wang H, Li Z, Jia R, et al. ExoCET: Exonuclease in vitro assembly combined with RecET recombination for highly efficient direct DNA cloning from complex genomes[J]. Nucleic Acids Res, 2018, 46(5): e28.
Song C, Luan J, Li R, et al. RedEx: a method for seamless DNA insertion and deletion in large multimodular polyketide synthase gene clusters[J]. Nucleic Acids Res, 2020, 48(22): e130.
Yamanaka K, Reynolds K A, Kersten R D, et al. Direct cloning and refactoring of a silent lipopeptide biosynthetic gene cluster yields the antibiotic taromycin A[J]. Proc Natl Acad Sci U S A, 2014, 111(5): 1957-1962.
Jiang W, Zhao X, Gabrieli T, et al. Cas9-assisted targeting of chromosome segments CATCH enables one-step targeted cloning of large gene clusters[J]. Nat Commun, 2015, 6: 8101.
Liang M, Liu L, Xu F, et al. Activating cryptic biosynthetic gene cluster through a CRISPR-Cas12a-mediated direct cloning approach[J]. Nucleic Acids Res, 2022, 50(6): 3581-3592.
Zhang G, Li Y, Fang L, et al. Tailoring pathway modularity in the biosynthesis of erythromycin analogs heterologously engineered in E. coli[J]. Sci Adv, 2015, 1(4): e1500077.
Huffman M A, Fryszkowska A, Alvizo O, et al. Design of an in vitro biocatalytic cascade for the manufacture of islatravir[J]. Science, 2019, 366(6470): 1255-1259.
Li R, Wijma H J, Song L, et al. Computational redesign of enzymes for regio- and enantioselective hydroamination[J]. Nat Chem Biol, 2018, 14(7): 664-670.
Yeh A H, Norn C, Kipnis Y, et al. De novo design of luciferases using deep learning[J]. Nature, 2023, 614(7949): 774-780.
Umarov R, Li Y, Arakawa T, et al. ReFeaFi: Genome-wide prediction of regulatory elements driving transcription initiation[J]. PLoS Comput Biol, 2021, 17(9): e1009376.
Repecka D, Jauniskis V, Karpus L, et al. Expanding functional protein sequence spaces using generative adversarial networks[J]. Nat Mach Intell, 2021, 3(4): 324-333.
Eslami M, Adler A, Caceres R S, et al. Artificial intelligence for synthetic biology[J]. Assoc Comp Mach, 2022, 5(65): 88-97.
Kilgore M B, Kutchan T M. The amaryllidaceae alkaloids: Biosynthesis and methods for enzyme discovery[J]. Phytochem Rev, 2016, 15(3): 317-337.
Yang G, Withers S G. Ultrahigh-throughput FACS-based screening for directed enzyme evolution[J]. ChemBiochem, 2009, 10(17): 2704-2715.
Tan Y, Zhang Y, Han Y, et al. Directed evolution of an alpha1,3-fucosyltransferase using a single-cell ultrahigh-throughput screening method[J]. Sci Adv, 2019, 5(10): w8451.
張道遠, 林樹靖, 王菲, 等. 用于高集成度數字PCR平臺的微流控芯片[J]. 微納電子技術, 2022, 59(3): 242-249.
朱尤卓, 劉紅玉, 游宇豪, 等. 深度學習在抗菌肽藥物研究中的應用進展[J]. 中國抗生素雜志, 2023, 48(4): 374-380.
宋益東, 袁乾沐, 楊躍東. 深度學習在蛋白質功能預測中的應用[J]. 合成生物學, 2023, 4(3): 488-506.
胡如云, 張嵩亞, 蒙海林, 等. 面向合成生物學的機器學習方法及應用[J]. 科學通報, 2021, 66(3): 284-299.
Panditrao G, Bhowmick R, Meena C, et al. Emerging landscape of molecular interaction networks: Opportunities, challenges and prospects[J]. J Biosci, 2022, 47(2): 1-26.
Fox R A, Evanno L, Poupon E, et al. Natural products targeting strategies involving molecular networking: Different manners, one goal[J]. Nat Prod Rep, 2019, 36(7): 960-980.
Zhang M, Otsuki K, Li W. Molecular networking as a natural products discovery strategy[J]. Acta Materia Medica, 2023.
Chang Y, Che Q, Xing L, et al. Antibacterial p-terphenyl with a rare 2,2-bithiazole substructure and related compounds isolated from the marine-derived actinomycete Nocardiopsis sp. HDN154086[J]. J Nat Prod, 2021, 84(4): 1226-1231.
Han X, Tang X, Luo X, et al. Isolation and identification of three new sterigmatocystin derivatives from the fungus Aspergillus versicolor guided by molecular networking approach[J]. Chem Biodivers, 2020, 17(6): e2000208.
Chao R, Hou X M, Xu W F, et al. Targeted isolation of asperheptatides from a coral-derived fungus using LC-MS/MS-based molecular networking and antitubercular activities of modified cinnamate derivatives[J]. J Nat Prod, 2021, 84(1): 11-19.
基金項目:國家自然科學基金面上項目(No. 41976105);山東省泰山學者青年專家項目(No. tsqn202103153)
作者簡介:方岫琴,女,生于2002年,主要研究方向為微生物天然產物,E-mail: fangxiuqin@stu.ouc.edu.cn
*通信作者,E-mail: zhangguojian@ouc.edu.cn