晁二昆,蘇新堯,陳士林,劉佳柔,3,朱智慧,盛瑋*,王彩霞*
1.淮北師范大學 生命科學學院,安徽 淮北 235000;2.中國中醫科學院 中藥研究所,北京 100700;3.河北科技大學,河北 石家莊 050018
大多數藥用活性成分在原植物中含量很低,且植物生長周期長,受時間、空間、氣候等諸多因素的限制,化學合成難度大,副產物多,提取成本高,且產生的廢棄物會對生態環境造成不可逆破壞。因此,傳統的天然提取和人工化學合成的方法已經很難滿足現代可持續發展的要求,中藥合成生物學的產生與發展,將會有效地解決這些矛盾[1]。
1979年,Har Gobind Khorana人工合成了207個堿基對的DNA序列,并因此獲得諾貝爾化學獎,合成生物學由此開始[2]。20世紀90年代初,隨著測序技術和信息技術的快速發展,對生命科學的研究進入了基因組時代,大量的研究結果為合成生物學的產生奠定了堅實基礎。2010年,Venter研究所[3]在《Science》雜志上報道了首例“人造細胞”的誕生,這是世界上第一個由人類制造并能夠自我復制的新物種,同年合成生物學被《Science》雜志評為年度十大科學突破之一。2018年,覃重軍團隊[14]將釀酒酵母16條染色體的全基因組進行修建和重拍,最終獲得只有1條染色體的釀酒酵母,這一重大成果使得人類距離實現合成生命的目標更近了一步。
現今,合成生物學已在醫藥、能源、環境等領域取得了舉世矚目的成就[5]。
中藥合成生物學的目的在于將復雜的自然生物代謝系統改造為簡單且可控的功能元件,如啟動子、終止子、功能蛋白等,然后經計算機輔助設計對其進行模擬預測,從而構建由天然或非天然的功能元件或模塊組成的生物系統,來產生藥用植物的活性成分。
藥用植物活性成分生物合成途徑解析的策略見圖1。首先根據化學原理和已經分離鑒定的中間產物推測出可能的生物合成途徑,必要時可以通過同位素追蹤的手段對推測途徑進行進一步確認;其次通過轉錄組分析和生物信息學分析篩選和挖掘特定代謝途徑的功能基因并解析其合成途徑;然后將合成途徑組裝成細胞工廠;最后設計并構建細胞工廠。

圖1 天然產物的細胞工廠生產技術路線
藥用植物活性成分細胞合成技術策略(見圖2),即在解析較為清楚的天然產物代謝途徑的基礎上,結合底盤細胞自身的代謝途徑,對目標代謝途徑進行復制或轉移;或根據現有目標成分或中間體的化學結構,在底盤細胞中重新集成一條新的代謝途徑。無論是原有代謝路徑的轉移還是新代謝途徑的創建,其在工程菌株中的生物合成都不是相互獨立的,而是相互交錯而成的一個動態平衡的代謝網絡,在構建工程菌株的同時,需從整體上對其代謝網絡進行優化調控,以期更有利于目標藥用活性成分的合成及積累。

圖2 藥用植物活性成分細胞合成技術策略
天然產物代謝途徑在異源底盤細胞中的重構,可以使原本不能產生天然產物的底盤細胞產生甚至高產目的產物,有利于驗證各種基因的功能,有助于理解細胞的代謝行為和生命現象。然而,編碼整個代謝途徑或重組長的DNA片段具有重大難度,科研人員對此做了許多工作。如2009年,Shao等[6]創建了一種新的重組方法——DNA assembler,它通過釀酒酵母中的體內同源重組,在一步組裝整個生物途徑中用此方法可以快速組裝功能性D-木糖利用途徑(由3個基因組成的9 kb DNA)、功能性玉米黃質生物合成途徑(由5個基因組成的5 kb DNA)、功能性組合D-木糖利用和玉米黃質生物合成途徑(由8個基因組成的19 kb DNA),整合到酵母染色體上的效率高達70%。2016年,Jin等[7]發明了一種新的無縫克隆方法——DATEL(DNA Assembly method using Thermostable Exonucleases and Ligase)。此方法設計具有重疊的5′磷酸化DNA片段并置于一個管中,在變性和退火后,相鄰DNA片段突出的重疊端互補并形成發卡結構,剩余的ssDNA被Taq聚合酶完全消化,3′端同理,以此精確連接目的片段。該團隊使用此方法在大腸桿菌中快速構建了β-胡蘿卜素的合成路徑,結合核糖體結合位點(RBS)調控代謝途徑中crtE、crtX、crtY、crtI、crtB5個基因,最終β-胡蘿卜素產量為3.57 g·L-1。
天然產物代謝途徑是復雜的,如果前體物質能較少流入,甚至不流入目的產物代謝流的競爭支路,可能獲得更多的目的產物,CRISPR-Cas9技術的開發利用很好地解決了這一難題。CRISPR-Cas9技術是一種革命性基因編輯技術,其功能強大,可以用來刪除、添加、抑制或激活生物體的目標基因,可以廣泛用于生物技術[8-9]。


表1 酵母CRISPR基因編輯技術研究進展
中藥合成生物學首先是要根據天然產物的合成途徑和微生物代謝調控來構建底盤細胞。這個過程常用的微生物有大腸桿菌、酵母、枯草芽孢桿菌等。
2.3.1 構建大腸桿菌底盤細胞 大腸桿菌是最為簡單的模式生物,其遺傳背景清晰、生長周期短、易于操作,一些DNA重組技術以及分子生物學工具的應用都是先在大腸桿菌中試驗,然后推廣到其他生物中,其作為生物合成學的底盤菌株有著其他生物無可比擬的優勢[25]。Stephanopoulos課題組將強效抗癌藥物——紫杉醇合成途徑進行重構。并通過優化中間基因的表達以及代謝通量,重構大腸桿菌發酵葡萄糖生產紫杉醇的前體紫杉二烯的能力與改造前相比提高了15 000倍,紫杉二烯產量達到了1 g·L-1的水平[26]。2018年,Wang等[27]構建了一種能定向合成黃芩素或野黃芩素的大腸桿菌,只需提供苯丙氨酸或酪氨酸兩種不同的前體,就可以獲得這兩種黃酮化合物。該團隊首先將來自歐芹的4CL、FNS I,紅酵母的PAL、矮牽牛的CHS、苜蓿的CHI等酶的6個基因轉入酵母中,構建了黃酮的重要中間體芹菜素的代謝通路。然后通過克隆黃芩來源的F6H及擬南芥來源的AtCPR基因,實現了黃芩素和野黃芩素的異源合成。在此基礎上,該團隊通過過量表達丙二酰輔酶A合成基因acs和脂肪酸合成基因fabF,并引入三葉草根瘤菌來源的丙二酰輔酶A合酶基因matB與丙二酸鹽載體蛋白基因matC,最終大腸桿菌可產黃芩素23.6 mg·L-1、野黃芩素106.5 mg·L-1。
2.3.2 構建酵母底盤細胞 大腸桿菌作為底盤細胞生產天然化合物,由于其是原核細胞,不能很好地表達植物或其他真核生物來源的酶,限制了蛋白后期的加工修飾,尤其是細胞色素P450酶。釀酒酵母為安全的模式生物,能夠高效表達P450酶,重組釀酒酵母基因,使用酵母發酵生產植物源天然藥物己成為微生物發酵法的研究熱點[28-29]。美國麻省理工學院Stephanopoulos教授課題組[26]通過嘗試不同物種來源的關鍵基因HMGS和HMGR,對途徑中基因表達量進行優化,結合發酵過程優化,青蒿二烯的產量在大腸桿菌中達到27 g·L-1。但青蒿二烯向青蒿酸的這步轉化由P450氧化酶CYP71AV1催化,是一步氧化反應。由于P450氧化酶在大腸桿菌中一直都不能高效表達,所以表達CYP71AV1的重組大腸桿菌只能生產1 g·L-1的青蒿酸,即轉化率只有4%左右。2006年,Ro等[30]通過對酵母中的MVA途徑代謝調控關系的調整、關鍵基因表達量優化、前體物FPP代謝支路的削弱,結合氧化酶CYP71AV1的表達,成功構建產青蒿酸的酵母菌株,產量達到115 mg·L-1,通過發酵優化青蒿酸的產量可以進一步提高到2.5 g·L-1。通過進一步的基因挖掘,他們找到了3個由青蒿二烯向青蒿酸轉化的基因,即細胞色素b5基因、青蒿醇脫氫酶基因、青蒿醛脫氫酶基因。在合成青蒿二烯酵母菌株中表達這3個基因,同時優化CYP71AV1輔助還原酶CPR1的表達量和發酵過程,青蒿酸產量提高到25 g·L-1[31]。此時酵母作為底盤菌株的優勢顯而易見。
2.3.3 構建枯草芽孢桿菌底盤細胞 枯草芽孢桿菌作為國內研究最早的微生物之一,具有超強的分泌系統,可以通過特殊的運輸機制將其體內表達的蛋白或多糖運輸到體外,只需簡單處理發酵液就可以收集目的產物,省去了繁瑣的破碎細胞過程[32]。Liu等[33]首次在枯草芽孢桿菌中“從頭”設計合成人工啟動子文庫,對其代謝網絡優化,以肌苷生產菌株為出發菌,利用弱啟動子弱表達肌苷生產菌株的嘌呤途徑必需基因purA,使肌苷產量提高了7倍,且對工程菌的生長無影響;利用強啟動子TP2過表達木聚糖酶基因xynA,提高了木聚糖分解和利用能力,在以木聚糖為唯一碳源的培養基中,利用木聚糖產乙偶姻工程菌株表現出更好的生長能力,且乙偶姻產量提高44%。
藥用植物細胞合成技術即在對藥用源植物復雜代謝路徑解析較為清楚的基礎上,結合底盤細胞自身的代謝途徑,對目標代謝途徑進行復制或轉移;或根據現有目標成分或中間體的化學結構,在底盤細胞中重新集成一條新的代謝途徑。無論是原有代謝路徑的轉移還是新代謝途徑的創建,其在工程菌株中的生物合成都不是相互獨立的,而是相互交錯而成的一個動態平衡的代謝網絡,在構建工程菌株的同時,需從整體上對其代謝網絡進行優化調控,以期更有利于目標藥用成分的合成及積累。
核糖體結合位點(RBS位點)是控制翻譯起始的關鍵區域額,因此也是調節翻譯強度的重要原件。通過尋找或人工設計合適的RBS可以增強蛋白表達,從而提高目的產物。Sun等[34]使用可產生162.98 mg·L-1色氨酸的谷氨酸棒桿菌ATCC 21850作為代謝工程底盤菌株,將來自紫色色桿菌的異源操縱子在具有組成型啟動子的ATCC 21850菌株中過量表達,獲得532 mg·L-1紫色桿菌素。考慮到紫色桿菌素的毒性,其使用誘導型啟動子表達vio操縱子,并發酵獲得629 mg·L-1紫色桿菌素。由于vio操縱子的經濟編碼性質,vio基因的壓縮RBS被替換為強表達的谷氨酸棒桿菌。并將擴展表達單元組裝成一個合成操縱子。通過該策略,發酵獲得了1116 mg·L-1紫色桿菌素。然后通過優化發酵時間、濃度、培養組成和發酵溫度等,最終將紫色桿菌素發酵濃度提升到了5436 mg·L-1。
微生物發酵產生目的產物的過程中往往也會產生許多不必要的副產物,副產物的產生不僅浪費目的產物前體物質,同時也增加了目的產物的提取難度。使用動態調節策略來調控代謝產物濃度和代謝途徑通量,從而獲得更多的目的產物。將法呢基二磷酸(FPP)響應性啟動子轉入大腸桿菌中的紫穗槐二烯生物合成途徑中,以降低毒性前體FPP的積累。篩選對細胞內FPP水平有響應的內源性大腸桿菌啟動子,隨后用于實施上游FPP產生途徑中8種酶表達的負反饋調節方式,以及對紫穗槐-4,11-二烯合酶表達的正反饋調節方式,將FPP轉化為紫穗槐二烯。與靜態調控策略相比,這種動態調控策略使紫穗槐二烯的產量從700 mg·L-1增加到了1.6 g·L-1[35]。2018年,Yan等[36]在大腸桿菌中構建了己二烯二酸(MA)啟動子調控系統,在缺乏MA的情況下,兩個MA響應轉錄因子(CatR)形成一個四聚體,然后與26 bp的抑制序列(rbs)和14 bp的激活序列(abs)序列結合使DNA彎曲,并阻斷RNA聚合酶Rep激活catBCA啟動子,關閉基因catBCA的轉錄。在MA的存在下,MA引發CatR構象變化,從而減輕DNA彎曲并使RNA聚合酶激活catBCA的轉錄。然后結合RNAi技術,形成雙功能動態調控代謝網絡技術,最終使MA產量達到1.8 g·L-1,遠高于動態調控。
隨著合成生物學的發展,人工設計合成代謝途徑越來越復雜,使得底盤菌株代謝負荷越來越大,利用兩種或多種菌種對這些代謝網絡進行分工合作,可以減輕菌株的代謝負荷,完成更復雜的代謝調控,從而提高效率。Liu等[37]將3種不同的菌進行混合發酵。首先,利用大腸桿菌將葡萄糖轉化為乳酸提供C源和電子,枯草芽孢桿菌生產黃核素,瓦氏菌從中獲得能量氧化乙酸為乙酸酯,為大腸桿菌和枯草芽孢桿菌提供C源。這3種微生物形成了交叉喂養的微生物聯合體。在瓦氏菌、枯草桿菌和大腸桿菌的聯合作用下,11 mmol·L-1葡萄糖轉化為17.7 mmol·L-1乳酸,乳酸產量提高了10倍以上,枯草芽孢桿菌產生28.3 mol·L-1核黃素,提高了1.5倍,通過“分工”生產使乳酸和核黃素的產量達到最高水平。Zhou等[38]將細胞色素P450紫杉烯5α-羥化酶(5αCYP)及其還原酶(5αCYP-CPR)轉入釀酒酵母細胞中表達,用來催化紫杉醇生物合成途徑中的第一步氧化反應。接下來,將該菌與產紫杉烯大腸桿菌共同培養,以葡萄糖為唯一碳源,混合培養72 h產生了2 mg·L-1含氧紫杉烷。當只培養大腸桿菌或釀酒酵母時,未產生含氧紫杉醇類化合物。然而,由于酵母利用葡糖糖產生的乙醇抑制了大腸桿菌的生長代謝,在酵母存在時大腸桿菌的細胞密度和紫杉烯的濃度下顯著降低。為了克服這個問題,將C源換成木糖,然而大腸桿菌代謝木糖產生的乙酸對它自己的生長有抑制作用。另一方面,酵母不能代謝木糖,但可以使用乙酸生長代謝并且不產生乙醇。因此,釀酒酵母只有在大腸桿菌存在下才能在木糖培養基中生長,大腸桿菌的細胞密度和紫杉烯的濃度也沒太大波動。然后調節代謝通路和發酵優化,最終含氧紫杉烷的產量達到了33 mg·L-1。合成混菌體系已成為合成生物學的前沿之一,是合成生物學第二次浪潮的重要研究。
藥用植物活性成分微生物細胞是通過設計并構建合成藥用植物功效成分的細胞工廠來發酵生產植物天然產物(見表2),如今已有了飛速發展。其中最典型的例子是加州大學伯克利分校Jay Keasling研究團隊[41]構建了一個高效生產青蒿素前體青蒿酸的釀酒酵母人工細胞,其產量高達25 g·L-1,并進一步通過化學半合成轉化,實現了青蒿素的全合成[31]。在此工作的啟發下,一些中藥的功效成分如人參皂苷[39]、紫杉醇[40]、丹參酮、大黃素[42]等都陸續實現在微生物系統中合成。如Ajikumar等[26]通過將上游模塊的4個關鍵酶基因以及下游模塊的GGPP合酶基因和紫杉二烯合成酶基因導入大腸桿菌中,并通過進一步優化,紫杉醇二烯合成量最高達1.02 g·L-1,但由于由紫杉烯到紫杉醇的合成過程未完全解析,因此,通過合成微生物細胞工廠構建產紫杉醇仍需進一步探索;Wang等[43]在釀酒酵母底盤菌株BY4742中過表達甲羥戊酸(MVA)途徑的所有基因包括上游模塊的7個基因ERG10、ERG13、ERG12、ERG8、ERG19、IDI、tHMG1以及6個下游模塊基因ERG1、ERG20、ERG9、synPgDDS、synPgPPDS、synPgCPR1,同時通過染色體整合增加一個synPgPPDS的拷貝數,通過條件優化,最終在10 L補料分批發酵中人參皂苷Rh2產量為2.25 g·L-1,是現有報道中產量最高的。大麻素(cannabinoids)是僅存在于大麻中的一類藥用活性分子,其生物合成途徑在20世紀90年代中期才被基本解析清楚。Luo等[44]通過在酵母中引入EfmvaE、EfmvaS基因,同時過表達ERG12、ERG8、ERG19和IDI1以及一個突變的ERG20基因,實現對釀酒酵母天然的的甲羥戊酸途徑(mevalonate pathway)的改造,使其代謝流更多地流向大麻素重要中間體——香葉基焦磷酸(GPP);隨后,該課題組通過引入RebktB、CnpaaH1、Cacrt、Tdter4個基因,在該菌株中引入了一條新的己酰輔酶A(hexanoyl-CoA)的代謝途徑,GPP合成量達到了1.6 mg·L-1,較原菌株提高了7倍。Sun等[42]通過重組不同來源的酶,首先在釀酒酵母中構建內黃素和大黃素的合成通路,將來源于S.lycopersici的TE-less NR-PKS(SlACAS)與釀酒酵母中的不同MβL-TE共表達,當與HyTE偶聯時,SlACAS產內黃素產率提高了115.6%,為了得到更多的大黃素,將鑒定的與HyDC具有高度同源性的7種脫羧酶分別引入生物合成途徑中,挑選出催化活性最高的AfDC,進一步引入雙點突變體乙酰輔酶A羧化酶ACC1S659A、S1157A以增加蒽醌的前體丙二酰輔酶A的產生,內黃素和大黃素的產量隨后急劇增加到(233.6±20.3)、(253.2)mg·L-1,最終通過發酵優化,內黃素和大黃素滴度分別為(661±50.5)、(528.4±62.7)mg·L-1,均高于此前報道的水平。
相較于微生物,植物與天然產物的親緣關系更加接近,并且自身的催化系統更有利于天然產物相關基因的正確表達,由于植物自身可進行光合作用,有利于降低成本,一些模式植物如煙草、擬南芥、番茄等也都用來構建產天然產物底盤細胞(見表3)。

表3 藥用植物活性成分植物細胞工廠研究進展
2011年Farhi等[67]在pSAT載體上同時整合紫穗槐-4,11-二烯合酶(ADS)、細胞色素P450家族的(CPR)還原酶、CYP71AV1羥化酶以及青蒿醛雙鍵還原酶(DBR2)4個基因,并通過農桿菌轉化技術首次實現了青蒿素在煙草中的異源合成。然后過表達甲羥戊酸(MVA)途徑限速酶3-羥基-3-甲基戊二酰輔酶A還原酶(tHMG),以增加青蒿素的前體物質,最后運用信號ADS定位到線粒體上的方式,使煙草中青蒿素質量分數達到6.8 μg·g,-1。該工作展示了利用煙草等植物底盤進行青蒿素合成的可能。2016年,Fuentes等[68]將青蒿酸的合成途徑的完整基因全部整合到煙草葉綠體的基因組中,同時引入一些基因使系統更加穩定,最終獲得了120 mg(以1 kg生物量計)青蒿酸。2016年,Malhotra等[69]把在煙草細胞中合成青蒿素的途徑進行模塊化:先利用信號肽cox4融合將ADS定位在線粒體中,再通過質體導肽將CYP71AV1、CPR、DBR2定位在葉綠體內,最后在葉綠體中引入酵母的整條MVA途徑來增加萜類前體供應,最終獲得0.8 mg·g-1的青蒿素。
Hallard等[70]將長春花中的TDC基因轉入煙草細胞,并將TDC基因過表達,3α(S)-異胡豆苷的產量分別增加到5.3 mg·L-1。Miettinen等[71]把長春花馬錢子苷途徑中的4個酶(8-HGO、IO、7-DLGT、7-DLH)以及TDC與STR酶轉入煙草中,在異源植物煙草中重構了整個MIA途徑,實現3α(S)-異胡豆苷的合成。
英國植物代謝工程專家Cathie Martin團隊[72]以番茄為底盤,將擬南芥的轉錄因子AMYB12等在番茄中進行過表達,大幅提高番茄中黃酮醇等物質的含量,干物質質量分數達到100 mg·g-1。Tohge等[73]在番茄中引入金魚草來源的轉錄因子Delila和Rosea1后,檢測到花青素和苯丙類黃酮衍生物的含量都有所增加。隨后該團隊通過在番茄中引入擬南芥來源的黃酮特異性調控因子AtMYB12,檢測到黃酮類化合物和對羥基肉桂酸乙酯的質量分數達到了果實干質量的10%。
在紫杉醇的生物合成途徑中,牻牛兒基焦磷酸(GGPP)在taxadiene合酶(TXS)的作用下生成紫杉烯,然后經過大約12步酶促反應最終合成紫杉醇[74]。在擬南芥中表達紫杉(Taxus baccata)的TXS基因,轉基因植株雖然可以積累紫杉烯,但同時出現生長遲緩和光合色素含量減少等現象。OSCAR等[75]采用誘導表達系統,用糖皮質激素處理后,紫杉烯含量比組成型表達得到的轉基因植株提高30倍,達到了600 ng干質量。
NKB K等[76]將ADS、CYP71AV1、ADH1、DBR2和ALDH1 5個基因在苔蘚中共表達后,經過進一步的光氧化后,青蒿素產量為0.21 mg·g-1。Anterola等[77]將紅豆杉來源的紫杉二烯合酶轉入小立碗蘚中并表達,獲得了產紫杉二烯5 μg·g-1的轉基因植株。
如今運用合成生物學生產藥用植物功效成分已取得了一定的發展,但仍有一些問題需要克服:1)天然產物代謝復雜及解析方法技術的不完備限制了代謝途徑的解析效率。植物天然產物代謝途徑復雜往往呈交叉網絡狀,牽一發動全身,甚至受時空影響,大大增加了其解析難度;解析天然代謝途徑需要做大量的工作及技術的支持。生物信息學的快速發展為找代謝通路中的相關基因簇做出了巨大貢獻,但目前代謝組學和基因組學的發展限制了其功能基因驗證的效率。因此,目前首要任務是加快代謝組學和基因組學方法技術的創新,提高鑒定基因簇的效率。2)基因元件數量少、異源表達效率低且模塊化與標準化不完善是重構代謝途徑的障礙。目前雖然已建立有基因元件庫,但其中的基因元件數量和自然中基因元件資源相比仍是冰山一角。植物中的基因元件轉入異源微生物中后效率較低,如“萬能生物催化劑”細胞色素P450酶(CYPs)。CYPs活性的發揮往往需要細胞色素P450氧化還原酶(CPR)的協助,而大腸桿菌中并沒CPR;相對來說酵母表達系統自帶CPR,具有一定的優勢,但仍要需注意CYPs的偏好性,以保證其能高效表達。通過蛋白定向進化、代謝突變、基因編輯等手段對基因元件進行模塊化和標準化修改,將基因元件變為可“即插即用”的標準“零件”,有利于代謝通路的簡約化設計和工程化構建。3)營養物質在底盤細胞中更多的是流向了初級代謝流,只有很少一部分才流向目的代謝流。如碳流在酵母細胞中主要流向了乙醇合成途徑,合成天然產物則希望碳流少流入甚至不流入乙醇合成途徑,更多地流入目的代謝流。將底盤細胞基因組簡化,將會大大改善這種情況。目前有“自上而下”和“自下而上”兩種手段來實現此目的,即在原有的基因組上敲除非必需基因和人工合成基因組來獲得最簡基因組。但基因組的簡化會影響到正常的細胞功能,因此,找到兩者的平衡點至關重要。目前設計最簡基因組還處于比較初期的階段,科研人員仍需努力。