黃莎莎, 蘇正定
工業發酵教育部重點實驗室和湖北省工業微生物重點實驗室湖北工業大學生物工程與食品學院,武漢 430068
甾體(steroids)是一類結構非常特殊的天然產物,其分子母體結構中都含有環戊烷并多氫菲(cyclopentano-perhydrophenanthrene)碳骨架,此骨架又稱甾核(steroid nucleus)。甾體化合物又稱為類固醇,屬于脂類的一種,自然界中有上千種甾類物質,存在于動、植物及某些微生物細胞中。甾體類藥物在臨床上具有廣泛的應用,為僅次于抗生素的第二大類藥物。目前工業上主要利用分枝桿菌轉化甾醇制備甾體藥物起始和中間體原料。目前,人們已對分枝桿菌甾體降解途徑中的許多關鍵酶進行了研究,但對降解途徑尚未完全了解。近年來,工業微生物分枝桿菌甾體降解途徑基因組分析的重要性引起廣泛的注意。為了更深入地了解甾體降解途徑,本文介紹了分枝桿菌基因組學、代謝組學的研究進展。
甾類化合物是一類特殊的多元環萜化合物,結構上由(A、B、C)三個完整封閉的六元環和一個五元環(D)的環戊烷多氫菲及一些官能取代基組成。甾類化合物包括甾醇、膽汁酸、維生素D、神經甾體以及類固醇激素等,具有重要的生理醫藥功能[1-2],如腎上腺皮質激素具有抗炎癥等功效。甾類化合物市場需求大,利用微生物法制備甾類化合物的工藝具有環境污染小、專一性較強、反應步驟少、產品回收率高等優點[3,35]。眾多微生物菌屬中分枝桿菌能夠降解甾醇轉化關鍵甾類藥物中間體4-雄烯二酮(4-Androstene-3,17-dione,4-AD)、1,4-雄烯二酮(Androsta-1,4-diene-3,17-dione,ADD)、雄甾醇-4-烯-3,17-二酮(9-Hydroxy-4-androstene-3,17-dione,9-OH-AD)。
分枝桿菌(Mycobacterium sp.)屬于放線菌目,是一類細長略帶彎曲的桿菌,有分枝桿菌生長趨勢,可分為三組:結核桿菌、非結核桿菌與麻風桿菌;結核桿菌和麻風桿菌以危害嚴重的傳染性病原菌聞名,多年來是醫學和分子生物學等領域的研究熱點。截至2021年6月為止,Genome Online database數據庫中共記錄了244株分枝桿菌的全基因組測序信息,其中完成測序的為216株,正在測序的有25株,計劃測序的有1株,針對性測序的有1例(https://www.genomesonline.com)。
非致病型分枝桿菌是常用的工業菌株,具有眾多分枝桿菌的重要生理特征,例如該菌細胞壁含有大量的脂質影響甾醇轉化活性,主要成分為分支菌酸等[4-5],其中以膽固醇營養物質等甾醇為唯一碳源并開環降解為自身提供能量。2008年PANDEY等研究中[6]證實結核桿菌降解膽固醇并從中獲取能源和能源化合物,結核分枝桿菌維持較慢的感染能力與它獲得膽固醇的能力密切相關,也是造成肺結核長時間不愈的重要原因[7]。但是,分枝桿菌降解膽固醇的能力也有其利用價值的一面,即分枝桿菌可轉化膽固醇等天然植物甾醇生成系列代謝中間體和藥物前體,因而具有重要應用價值。1944年TURFITT等[8]等發現分枝桿菌可完全降解代謝膽固醇側鏈和骨架;1972年MARSHECK等[9]利用不需要添加抑制劑的誘變選育方法得到了分枝桿菌NRRL B-3805,能有效轉化4AD為睪酮,轉化ADD成為AD,從而奠定了分枝桿菌降解甾醇工業化應用的基礎。
多種可降解甾類的微生物菌屬中,其中以紅球菌屬與分枝桿菌屬代謝能力受到最為廣泛的關注,利用誘變選育可作為積累甾藥中間體AD等的重要微生物工廠[1,10-14]。紅球菌曾經很長一段時間被認為是紫紅分枝桿菌,直到1978年才正式承認紅球菌這個屬名,是介于分枝桿菌與諾卡氏菌Nocardia之間的一類微生物,具有好氧、革蘭氏陽性、多形態菌、菌落粗糙與分枝桿菌類似的特點[15]。紅球菌屬與分枝桿菌屬微生物都適用于甾類藥物中間體的生產;它們細胞壁產生的表面活性劑有親水和疏水兩種基團,能在水相和油相移動,提高細胞的耐受力,適用于油水兩相體系發酵及促進分枝桿菌對甾體化合物底物的攝取[16-18],擁有完善的甾類降解基因簇、種類豐富的特異性加氧酶、氧化還原酶以及β-氧化酶、確保了微生物對底物的快速代謝[19-22,32];多數紅球菌屬與分枝桿菌具有快速生長特點,易培養繁殖,是理想的甾類生物轉化媒介。
自1998年第一個分枝桿菌的M.tuberulosis H37Rv全基因組[23]發布以來,越來越多的研究機構對不同分枝桿菌進行了全基因組測序,分析其基因組特征,不斷解析和完善分枝桿菌甾醇降解代謝途徑的各個關鍵酶基因功能,初步繪制甾醇代謝圖譜,闡明代謝機制及明確降解機制[33-34]。截至目前為止,多數典型分枝桿菌已經完成全基因組測序(表1)[24],部分進行了甾醇關鍵酶的活性測定。通過對不同分枝桿菌進行基因組分析,研究發現分枝桿菌甾體代謝相關基因聚集成簇。GRIFFIN[25]等在對M.tuberulosis H37Rv高通量測序發現攝取甾醇過程中起作用的基因很多,約60%的重要基因位于簇外的基因組其他位置,因此給系統性研究分枝桿菌代謝途徑帶來極大的挑戰。除此之外,一些快速生長型分枝桿菌中廣泛存在的同工酶序列與模糊功能基因,也給甾醇降解機制的解析與甾藥工程菌的開發構建增加了難度[19,26]。

表1 完成測序的典型甾類代謝微生物
2010年魏巍[27]等以M.neoaurum NWIB-01為菌種,以質粒為載體對該菌株進行Fosmid單克隆基因組測序,通過基因標簽的PCR篩選及測序的方法,得到部分的基因簇序列片段約81 kb,發現很多甾醇代謝關鍵酶。關鍵酶基因ksdd、ksha、kshb的序列分別為1056 bp、1701 bp、1188 bp。由于分枝桿菌基因組復雜的特殊結構以及有限的測序技術條件,這些先導性基因組學研究難以拼接完整的基因簇,可能錯失一些重要的起調控作用基因的信息。
2014年,姚抗[28]對M.neoaurum ATCC 25795全基因組進行了測序和分析,結合基因組測序的重要信息,對代謝通路分子的認識,分別得出三種關鍵代謝酶,兩個編碼CHO的基因choM1(編碼1746 bp,完整編碼581個氨基酸)與choM2(編碼1617 bp,編碼538個氨基酸)以及一個編碼3β-HSD(編碼1065 bp,編碼354個氨基酸)基因;編碼KstD的基因MN-ksD1(編碼1701 bp,編碼566個氨基酸)、基因MN-ksD2(編碼1677 bp,編碼558個氨基酸)及基因MN-ksD3(編碼1548 bp,編碼515個氨基酸),編碼KSH的基因還原酶MN-KshB(編碼1 069 bp基,編碼351個氨基酸)及加氧酶MN-KshA(編碼1 188 bp,編碼395個氨基酸)。
2017年,徐玲霞[29]等通過Illumina高通量測序技術對M.neoaurum MN4和M.neoaurum MN2進行全基因組測序,采用NGSQCTool kit軟件對原始數據進行過濾,再通過Velvet軟件對過濾后的數據進行組裝,基因組序列如下特點:
M.neoaurum MN4基因組大小為539.053 bp,其基因組共包含5 049個基因,46個tRNA,3個(5 s-16 s-23 s)rRNA;4920編碼序列,其中992個CDS編碼保守的假定蛋白,3 684個CDS編碼具有明確功能的產物;編碼序列占整個基因組的90.6%,平均長度為992,GC含量為66.9%,假基因個數為325個。
M.neoaurum MN2基因組的大小為538.301bp,其基因組包含5 049個基因,46個tRNA,3個(5 s-16 s-23 s)rRNA,4 890個編碼序列;其中1 435個CDS編碼保守的假定蛋白,3455個CDS編碼具有明確功能的產物;編碼序列占整個基因組的89.8%,平均長度為989,GC含量為66.8%,假基因個數為105個。
通過對兩株菌進行基因組進行分析分別得到16條和17條次級代謝產物基因簇,在MN2菌株中發現與甾醇提取相關基因choM1、choM2、3βhsd,MN4中發現關鍵基因choM1、choM2、3β-hsd以及Kstd-1、Kstd-2、KstA-1、KstB。
2018年,本實驗室對分枝桿菌M.neoaurum HGMS2進行全基因組測序[30],發現其基因組中含有1條染色體,基因組總長度為5 421 383 bp,5 133個基因,占基因組的92.10%。含有5 078個具有編碼功能的編碼序列,5 001個編碼基因,77個假定基因,55個RNA,6個rRNA(2個5S,2個16S,2個23S),46個tRNAs,3個ncRNA。菌株HGMS2基因組圈圖如圖1所示。

圖1 菌株HGMS2基因組圈圖
以NRRL B-3805為參考基因,發現菌株M.neoaurum HGMS2多出512個堿基對,無插入突變,32個缺失突變和6個位于編碼序列區域的Indel。基于該菌株全基因組序列得到編碼三種關鍵酶的六個基因,分別為:編碼3-甾酮-1,2脫氫酶的基因KsdD211為1 692 bp、9α-羥化酶的基因KshA226約為1 185 bp、基因KshA395約為1 149 bp、基因KshB122約為1 056 bp、編碼末端碳單氧化酶的基因Mono164約為1 254 bp和基因Mono1973約為1 275 bp。通過基因組信息,預測了三種膽固醇氧化酶(ChoM組1:ChoM1、ChoM2和hsd),兩種單加氧酶(Mon組2:Mon164和Mon197),一組側鏈降解酶,一組3-酮甾體-1,2-脫氫酶(KstD;組4:KstD211)和3個3-酮甾體-9a-羥化酶(Ksh;組5:KshA226、KshA395和KshB122)。一個編碼Mon164、KstD211、KshA226、KshB122和β脂肪酸的基因簇,共同參與M.neoaurum HGMS2中的植物甾醇降解途徑。
ASMAR[31]等2014年對分枝桿菌M.DSM 44074菌株進行了基因組測序,其基因編碼量為5 112 765 bp,(編碼率為92.35%,共鑒定出5 274個基因,其中239個(4.53%)編碼假定蛋白,822個(15.59%)編碼假定蛋白。此外,5 220個基因在COG數據庫中至少匹配一個序列。
研究發現分枝桿菌可降解甾醇類物質并將其作為碳源,先降解甾醇的側鏈,其次多步催化反應降解為二氧化碳和水。如新金分枝桿菌轉化植物甾醇產AD、ADD、9-OH-AD、1,4-HBC、4-HBC等甾體藥物中間體。甾醇轉化過程中由于代謝分支多,步驟長。基于基因組學獲得分枝桿菌的關鍵基因簇序列,針對代謝途徑中的關鍵基因進行敲除改造微生物分枝桿菌,轉化植物甾醇產AD、ADD、9-OH-AD、1,4-HBC和4-HBC等甾體藥物中間體代謝產物,采用LC-MS、TLC、HPLC等代謝組學技術定性定量的方法,分析這些菌株甾醇轉化代謝途徑及組分,確定對應的關鍵酶是否調控植物甾醇代謝途徑。
魏巍[27]等對利用NI+親和層析柱分別得到產物3-甾酮-△1-脫氫酶,3-Ketosteroid-9α-羥化酶還原酶。分別通過對野生菌型及KSdD基因敲除菌進行植物甾醇轉化進行實驗,采用基于高分辨質譜平臺的非靶向代謝組學方法得到野生菌主要積累ADD而KSdD基因敲除菌主要積累AD,證實KSdD是AD到ADD轉化的主要酶。
姚抗[28]等通過敲除同工酶的編碼基因,構建六株不同的工業分枝桿菌,分析目標基因在不同底物誘導時的轉錄差異,利用代謝組學證實這些酶在分枝桿菌中的甾醇代謝功能。通過出發菌株M.neoaurum ATCC 257795的基因組信息分析,鑒定出編碼Kstd的基因,構建9-OHAD高效生產菌株轉化植物甾醇,運用GC-MS技術分析MN-Kstd敲除菌中生成的未知代謝產物,得出3-甾酮-△1-脫氫酶(Kstds)是催化9-OHAD轉化為不穩定中間體9-OHADD反應的關鍵酶。運用TLC、HPLC及LC/MS技術對MN-kshA敲除菌代謝產物分析得到MN-KshA1為KSH的關鍵加氧酶,對9α-羥基化過程起著無可替代的意義。
徐玲霞[29]等基于分枝桿菌M.neoaurum MN2和MN4全基因信息測序進行甾醇降解關鍵基因簇分析,通過HPLC技術分析MN2和MN4植物甾醇轉化產物得到代謝基因突變導致突變株MN2能夠耐受高底物的植物甾醇使得其AD與ADD的比例為13∶1,MN4中轉成AD與ADD的比例為20∶1。
WANG[30]等基于分枝桿菌Mycobacterium neoaurum sp HGMS2基因組的分析,鑒定出轉化植物甾醇關鍵基因,利用TLC技術驗證KshD基因表達的產物酶的活性;HPLC技術分析得到9α-羥基化酶基因編碼的蛋白KsnA395、KsnB122有活性,KsnA266無活性。
分枝桿菌對甾醇體的代謝有很好的生物轉化功能,近幾年對分枝桿菌不同菌株進行基因組測序,深度挖掘測序數據去發現其代謝通路關鍵酶基因,探索其關鍵基因功能。推測關鍵酶在分枝桿菌的代謝途徑的分解機制,通過分析其代謝組學,提高甾體藥物中間體的產量。分枝桿菌甾醇降解分子機制的相關研究遠遠還不夠,還需要對分枝桿菌降解甾醇的分子生物學機制進行深入的研究。相信隨著微生物代謝甾體的機制及其功能簇基因不斷被揭示,微生物轉化法在甾體藥物的生產中將發揮越來越重要的作用。