廖麗 陳波
研究綜述
極地微生物基因組挖掘現狀與展望
廖麗 陳波
(中國極地研究中心, 上海 200136)
測序技術的快速發展極大地促進了微生物基因組相關研究。極地微生物基因組的測序與研究雖然啟動略晚, 但迅速成為極地微生物研究的一個重要內容。極地微生物基因資源具有重要的戰略意義與社會效益, 但針對極地微生物基因組的深入研究以及基因資源的深度挖掘仍然非常有限, 沒有真正發揮基因組測序的作用與價值。本文總結了國際上極地微生物基因組相關研究現狀與主要的研究方向, 分析了極地微生物基因組挖掘潛力與目前研究的不足之處, 并在此基礎上提出了重點需要突破的方向。極地微生物基因資源潛力巨大, 加強對極地微生物基因資源的挖掘將為未來生物技術的發展提供更多可能性。
極地微生物 基因組 基因資源 基因組挖掘
極地具備最極端的自然環境與氣候特征, 例如長期低溫、常年冰雪覆蓋、高輻射等極端條件對生命提出了諸多挑戰。然而即便如此, 在極地各種生境中仍然存在豐富多樣的微生物, 在極地生態系統中占據舉足輕重的地位, 并在長期極端環境壓力的選擇下, 進化出適應極端環境的生理、遺傳與代謝特征, 因而具有重要的基礎研究價值與巨大的應用潛力。同時, 在《南極條約》的限制下, 微生物是目前可以開發利用的自然資源, 因此具有重要的戰略意義, 也成為各國生物勘探的重點對象。
基因組測序技術的發展為極地微生物基因組及其基因資源的研究提供了新的機遇, 增加了我們對于極地微生物基因組特征與環境適應機制的認識, 也揭示了極地微生物基因資源的新穎性與潛在的應用價值。相比于模式物種或者常規環境中微生物的基因組測序, 極地微生物基因組測序研究歷史并不長, 但完成基因組測序的極地微生物數量每年都在增加, 表明極地微生物基因組的研究越來越受到關注。但總體而言, 極地微生物基因組相關研究與基因資源的挖掘仍處于初級階段。了解極地微生物基因組測序與研究的現狀, 能更好地把握研究與發展趨勢, 為開展極地微生物基因組相關研究與基因資源的挖掘提供指導。因此本文總結了極地微生物基因組研究現狀、趨勢與不足, 并提出了相應的建議, 以期為相關研究與政策制定提供參考。
2003年首次報道了兩個極地微生物基因組[1], 即來自南極埃斯湖(Ace Lake)的產甲烷古菌()和甲烷球菌()。在隨后的數年里, 極地微生物基因組的研究與報道并沒有大量增加, 2008年前總共才發表了7個極地微生物基因組, 以嗜冷或耐冷細菌為主, 例如比較經典的TAC 125基因組[2]和34H[3]。隨著二代高通量測序技術的飛速發展, 測序成本能被更多的實驗室接受, 極地微生物基因組報道在2011年之后迅速增加, 且呈現每年持續增加的趨勢(圖1)。據不完全統計, 截止2019年6月底共公布了168個極地微生物基因組, 其中2017、2018年最多, 分別發表了27、29個極地微生物基因組的測序與分析(圖1)。2019年截至目前也已報道了8個極地微生物基因組, 并還會繼續增加。根據美國國立生物技術信息中心(National Center for Biotechnology Information, NCBI)和美國能源部聯合基因組研究所(Depar-tment of Energy-Joint Genome Institute, DOE-JGI)的數據庫分析, 還可能有大量的基因組提交了數據庫但尚未公布, 以及有一些基因組正在測序中。目前在專業公司或者高校、院所公用平臺完成一個細菌的基因組草圖測序價格低至1000元左右, 基因組測序成為了一種常規手段, 而且隨著極地微生物菌株資源收集的增加, 將會有更多的極地微生物基因組完成測序, 進一步充實極地微生物基因組數據庫。
從公布的極地微生物基因組種屬分析, 絕大部分是細菌基因組, 僅有1個酵母基因組、2個病毒基因組、3個真菌基因組、5個古菌基因組以及6個藻類基因組。從屬水平分析細菌基因組(圖2), 共涵蓋了68個屬, 其中屬共有20個基因組完成序列測定, 為目前基因組測序數量最多的屬, 其次為和兩個屬, 各有10個基因組完成測序。余下大部分屬類別僅有少數幾個基因組甚至僅有1個基因組公布。可見, 完成基因組測序的極地微生物種屬分布較廣, 但集中研究的種屬僅有少數幾個。在測序的極地微生物基因組中, 也包括多個極地新物種, 例如南極新屬[4]、南極新種[5]、北極新種[5]、北極新種[6]、南極新種[7]等。

圖1 極地微生物基因組發表數量年度統計
Fig.1. Number of genomes of polar microorganisms announced annually

圖2 極地細菌基因組在屬水平的分類分布. 其他指的是僅有1個基因組測序的屬類別總數
Fig.2. Distribution of bacterial genomes at the genus level. Others include genera containing only one genome
從已完成基因組測序的極地微生物來源環境分析, 所覆蓋的范圍很廣, 包括來自南北極海水、沉積物、凍土、南極發草根際與葉際、冰川、南極湖泊、南極海綿、南極干谷土壤、南極“血瀑布”等環境樣品。
極地微生物基因組的研究目前還處于比較初級的階段, 多數報道僅為基因組測序、注釋與簡單的分析, 僅有少數研究對基因組進行了較為深入的分析與挖掘。涉及的研究內容最常見的是跟極地低溫等極端環境適應性相關的基因組特征認識, 僅有少數基因組研究提及功能基因及其產物資源, 但也未進行深入挖掘。以下總結分析了目前極地微生物基因組研究與資源挖掘的現狀。
絕大部分極地微生物基因組的研究是圍繞極端環境適應機制開展的基礎研究, 并不涉及具體的基因資源認識, 但間接為耐逆基因等功能基因的發現與認識提供了信息。代表性研究包括基因組分析南極甲烷代謝古菌的低溫適應機制[1]、從基因組與蛋白質組水平解析北極34H低溫適應機制[3]、從基因組水平揭示北極TAC 125的適冷機制[2]、從基因組與轉錄組水平揭示北極BSW20308的溫度適應機制[8]。這些研究從基因組層面分析了極地微生物適應低溫相關的基因組特征, 發現極地微生物在蛋白質組成、基因組GC含量等方面存在適應特征。
同時, 從基因組分析了跟抗逆或環境適應相關的功能基因。例如抗凍蛋白/抑制重結晶蛋白編碼基因、冷激蛋白編碼基因、維持細胞膜在低溫下流動性相關的基因、活性氧自由基抗性基因等[2,8-9]。這些功能基因在極地微生物的生存與環境適應中起到關鍵作用, 同時也可能在抗氧化、耐低溫等方面具有實際的應用價值。代表性研究如南極發草葉際與根際的植物促生長菌株基因組的研究, 測序了5個屬的細菌和1個15PA的基因組, 從基因組中發現了多個具有抑制重結晶功能的蛋白質編碼基因, 可能在極地冰凍環境的適應中具有重要意義, 同時也可能應用于抗凍相關的生物技術與生物醫藥領域[9]。
微生物, 尤其真菌和放線菌, 是天然產物的重要合成者。天然產物既是微生物防御、競爭與交流的化學工具, 也是人類尋找藥物先導化合物的重要來源。極地微生物在適應極端環境的長時間尺度進化過程中, 可能產生了合成新穎天然產物的功能基因。傳統的化學分離與鑒定手段受到諸多因素的限制, 例如多數基因或基因簇在一般條件下處于沉默狀態, 得到的化合物僅是其合成天然產物潛力的極少部分。而從基因組測序入手, 通過生物信息學分析能全面了解和挖掘微生物的天然產物合成能力, 極大地促進了天然產物及其生物合成的研究。例如上面提到的南極發草菌株基因組中檢測到編碼合成生物活性物質(例如吲哚、氫氰酸、pyoverdine載鐵蛋白)的基因[9]; 對產橘黃色色素的南極新屬標準菌株ZS314T的基因組進行研究, 挖掘了5個次級代謝產物合成基因簇, 并對其中合成類胡蘿卜素的基因簇進行了預測與產物驗證(圖3); 對極地海洋放線菌sp P6-10-X1[10]、strain NOCA502F[11]與sp. A1–2[12]的基因組測序, 分析了次級代謝產物合成相關基因簇, 并發現多個基因簇尚未研究, 預示著合成新化合物的可能性; 針對產抗菌活性物質的南極菌株sp. CAL-575開展基因組研究, 發現跟次級代謝產物合成相關的基因資源[13]; 對南極海綿來源的菌株進行基因組測序, 發現有抑菌作用的揮發性有機物合成基因[14]; 以及南極3個具有抗菌活性物質合成能力的基因組測序研究[15]。

圖3 南極新屬標準菌株Marisediminicola antarctica ZS314T基因組中5個次級代謝產物合成基因簇以及基因簇2合成的類胡蘿卜素分析. 該圖修改自文獻[4], 紅色基因為關鍵合成基因, 黑色基因為合成輔助基因, 綠色基因為調控基因, 藍色基因為轉運基因, 白色為無關或者未知基因. 發酵液與菌體沉淀呈現典型的類胡蘿卜色素特征
Fig. 3. The five secondary metabolite biosynthetic gene clusters predicted in the genome of the Antarctic type strainZS314Tand the analysis of carotenoids produced by cluster 2. The figure is modified from Liao et al[4], with red for core biosynthetic genes, black for additional biosynthetic genes, green for regulatory genes, blue for transporter genes and white for unrelated or unknown genes. The broth and the cell pellets are reddish orange due to the presence of carotenoids
這些研究極大地促進了對極地微生物天然產物合成潛力的快速認識, 為尋找新的天然產物及其合成基因提供了便利。隨著遺傳操作工具的創新與升級, 相信今后極地微生物天然產物的發現與生物合成將取得更多進展。
微生物具有強大的代謝能力和豐富的代謝多樣性, 在降解難以利用污染物的環境修復、合成新的生物材料以及生物能源利用等方面具有潛在的應用價值。隨著人類活動在極地的增加, 人類對極地環境的擾動和破壞發生的概率也會增加, 因此利用極地來源的微生物進行極地環境的修復, 不僅能適應并提高低溫下修復效率, 也能避免外來物種對極地環境與生態帶來的不利影響。前期已經開展了極地微生物污染物降解與生物修復相關的基礎研究, 例如從南極石油降解菌的基因組中測序發現了3個烷烴單加氧酶, 對該菌株及其基因資源應用于石油降解進一步研究, 發現其在寒冷海域的溢油污染生物修復方面有很好的應用前景[16-17]; 來自北極的R6-15基因組測序分析了該專性除烷烴菌的基因組特征與烷烴降解基因, 為將來實現低溫環境烷烴生物修復提供材料[18]。此外, 通過基因組測序分析南極深海稀有放線菌P3-3-X1, 發現該菌株基因組編碼一條完整的苯酚類污染物代謝降解途徑(圖4)[19]。苯酚為有毒有害致癌物質, 能降解并利用苯酚類化合物的菌株并不常見, 可見極地微生物具有很好的代謝能力與代謝多樣性。此外, 通過對分離自北極地衣的木聚糖降解菌株sp. PAMC26640基因組進行測序研究, 發現了22個與木聚糖利用有關的基因, 因而在生物質降解與生物能源利用等方面具有潛在的價值[20]。在生物材料方面, 代表性研究為南極307與北極238菌株基因組分析, 發現具有新的細菌光驅動質子泵xanthorhodopsin合成基因, 能將太陽能轉化為質子的電化學勢能, 可能在光電器件、光探測器等方面成為潛在的信息材料, 以及在人造視網膜等方面有潛在應用[5]。

圖4 南極深海稀有放線菌Janibacter limosus P3-3-X1基因組編碼的苯酚降解基因簇及其降解途徑示意圖. 該圖來自文獻[19]
Fig. 4. The gene cluster and the schematic diagram for phenol degradation of rare actinobacteriumP3-3-X1 isolated from the Antarctic deep sea. The figure is adapted from Su et al[19]
通過上述舉例分析, 可見極地微生物基因資源具有重大的研究與應用價值。前期的研究與探索表明了極地微生物在抗逆基因與產物、污染物的生物修復、惰性生物質的降解、生物新材料、天然產物合成等多方面具有重要的應用潛力。基因組測序與傳統的基于單個基因或者活性開展的基因資源挖掘相比, 具有明顯的優勢。
優勢1: 基因組測序能快速、全面地揭示整個基因組的基因資源。高通量測序技術的發展, 給極地微生物基因組研究帶來了更多可能性。一旦基因組獲得解析, 將全面、快速了解整個基因組的基因編碼情況, 通過注釋后將迅速獲得已知功能基因的信息, 為其基因資源的深入挖掘提供序列信息。通過宏基因組技術, 則大大增加了對未培養微生物基因組的發現。因此極地微生物基因組蘊藏的基因資源將得到前所未有的認識與發現。
優勢2: 尤其能高效發現需要多個基因參與完成的代謝與合成途徑, 例如多種污染物的降解、天然產物合成等途徑。尤其天然產物合成相關的基因資源往往成簇聚集在基因組上, 覆蓋的基因片段長度很大, 一般在20—100 kb的范圍, 只有在獲得基因組的情況下才能對天然產物合成基因簇進行全面的認識與挖掘。
由于極地微生物在適應極端環境的過程中進化出了獨特的基因組特征與基因資源, 而我們對于極地微生物基因組的研究與認識還相當有限, 在技術進步的推動下, 極地微生物基因組的研究與挖掘將為未來的生物技術與生物醫藥帶來新的希望。
目前針對極地微生物基因組的研究大部分停留在測序與初步注釋的層面, 即便開展了部分基因資源的認識, 也僅僅停留在預測階段, 并沒有充分把握基因組研究帶來的機會。從資源挖掘的角度分析, 極地微生物基因組的研究與挖掘還存在不足, 需要重點突破的方向列舉如下。
1. 極地微生物放線菌與真菌等資源價值明顯的菌株測序研究不夠, 需要有針對性地增加相應菌株基因組測序與研究。放線菌與真菌作為天然產物的主要合成者, 具有明顯的資源挖掘價值。從已經發表的極地細菌基因組分析, 僅有少數放線菌基因組得到測序, 涉及的種類也非常有限, 而真菌基因組測序更少。因此增加對極地放線菌與真菌為主的基因組研究, 將有利于極地微生物天然產物及其合成基因的發掘。
2. 缺乏專門的極地微生物基因組數據庫, 建立極地微生物基因組數據庫將為基因資源的挖掘與研究提供便利。目前所有完成測序的基因組數據基本都被提交到以NCBI為主的綜合型數據庫中, 并且提交的數據存在關鍵信息缺乏的現象, 例如沒有注明采集地點、樣品環境、時間等關鍵信息, 導致數據的后續分析利用受阻, 或者被遺漏。建立一個極地微生物基因組數據庫, 將有利于統一管理與分析相關數據, 為極地微生物基因資源的挖掘提供便利。
3. 極地微生物基因組的基因功能認識有待增加。由于極地微生物在親緣關系、物種特異性等方面可能跟其他環境來源的微生物存在較大差異, 例如極地新發現的微生物種屬在基因組完成測序后會得到更多的未知基因, 無法從已有的數據庫中得到注釋, 雖然這是一個較為普遍的問題, 但在極地新物種的注釋時問題更突出。多組學研究以及生化功能驗證將推動極地微生物新基因或者新功能的發現, 從而更好地挖掘極地微生物基因資源。
4. 極地低溫菌株遺傳操作體系缺乏, 研發合適的遺傳操作體系將促進極地微生物基因功能研究。目前應用最多、研究最多的都是常溫下的模式微生物遺傳操作體系, 在研究極地微生物基因資源的過程中, 可能已有的遺傳操作體系不具有普適性, 因此研發針對極地低溫菌株的遺傳操作體系將十分必要。
5. 利用多學科技術深入開展極地微生物基因組挖掘。由于目前大多數基因組研究僅僅報道了基本的基因組特征與序列信息, 并沒有深入認識蘊藏其中的海量基因資源, 因此基因組的研究顯得過于膚淺, 也無法發揮其在基因資源挖掘上的優勢。深入開展極地微生物基因組的研究與挖掘, 需要生物信息學技術、遺傳操作技術、代謝工程技術、酶學、化學與多組學等多學科技術的協同發展與有機結合, 需要構建多學科領域的研究團隊持續開展工作。
1 SAUNDERS N F, THOMAS T, CURMI P M, et al. Mechanisms of thermal adaptation revealed from the genomes of the Antarctic Archaeaand[J]. Genome Research, 2003, 13(7): 1580-1588.
2 MéDIGUE C, KRIN E, PASCAL G, et al. Coping with cold: The genome of the versatile marine Antarctica bacteriumTAC125[J]. Genome Research, 2005, 15(10): 1325-1335.
3 METHé B A, NELSON K E, DEMING J W, et al. The psychrophilic lifestyle as revealed by the genome sequence of34H through genomic and proteomic analyses[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(31): 10913-10918.
4 LIAO L, SU S, ZHAO B, et al. Biosynthetic potential of a novel Antarctic actinobacteriumZS314T revealed by genomic data mining and pigment characterization[J]. Marine Drugs, 2019, 17(7): 388-402.
5 Vollmers J, Voget S, Dietrich S, et al. Poles apart: Arctic and Antarcticstrains share high genome plasticity and a new type of xanthorhodopsin[J]. Plos One, 2013, 8(5): e63422.
6 Yin Y, Yue G, Gao Q, et al. Genome sequence ofsp. nov., a sea ice bacterium isolated from tundra soil[J]. Journal of Bacteriology, 2012, 194(23): 6688-6688.
7 Baker J, Riester C, Skinner B, et al. Genome sequence ofANT.BRT; a psychrophilic purple nonsulfur bacterium from an Antarctic microbial mat[J]. Microorganisms, 2017, 5(1): 1-16.
8 Liao L, Liu C, Zeng Y, et al. Multipartite genomes and the sRNome in response to temperature stress of an ArcticBSW20308[J]. Environmental Microbiology, 2019, 21(1): 272-285.
9 Cid F P, Maruyama F, Murase K, et al. Draft genome sequences of bacteria isolated from thephyllosphere[J]. Extremophiles, 2018, 22(3):537-552.
10 Zhao B, Liao L, Yu Y, et al. Complete genome ofsp. P6-10-X1 isolated from deep-sea sediments of the Southern Ocean[J]. Marine Genomics, 2017, 35: 27-29.
11 Yu Y, Zhao B, Wang L, et al. Complete genome of, strain NOCA502F isolated from sediment of the Arctic Ocean[J]. Marine Genomics, 2017, 34: 27-29.
12 Liao L, Su S, Yu Y, et al. Complete genome and data mining ofsp. A1–2 isolated from the Southern Ocean[J]. Marine Genomics, 2019, 45: 5-7.
13 Maida I, Fondi M, Papaleo M C, et al. Phenotypic and genomic characterization of the Antarctic bacteriumsp. CAL575, a producer of antimicrobial compounds[J]. Extremophiles, 2014, 18(1): 35-49.
14 Fondi M, Orlandini V, Maida I, et al. Draft genome sequence of the volatile organic compound-producing Antarctic bacteriumsp. strain TB23, able to inhibit cystic fibrosis pathogens belonging to thecomplex[J]. Journal of Bacteriology, 2012, 194(22): 6334-6335.
15 Fondi M, Orlandini V, Perrin E, et al. Draft genomes of three Antarcticstrains producing antimicrobial compounds againstcomplex, opportunistic human pathogens[J]. Marine Genomics, 2014, 13: 37-38.
16 Kube M, Chernikova T N, Alramahi Y, et al. Genome sequence and functional genomic analysis of the oil-degrading bacterium[J]. Nature Communications, 2013, 4(2): 2156.
17 Gentile G, Bonsignore M, Santisi S, et al. Biodegradation potentiality of psychrophilic bacterial strainRB-8T[J]. Marine Pollution Bulletin, 2016, 105(1): 125-130.
18 Dong C, Chen X, Xie Y, et al. Complete genome sequence ofR6-15, an obligate hydrocarbonoclastic marine bacterium from the Arctic Ocean[J]. Standards in Genomic Sciences, 2014, 9(3): 893-901.
19 Su S, Liao L, YU Y, et al. Genomic data mining of an Antarctic deep-sea actinobacterium,P3-3-X1[J]. Marine Genomics, 2019, DOI:10.1016/j.margen.2019.04.009
20 OH T J, HAN S R, KANG S, et al. Complete genome sequence of the xylan-degradingsp. strain PAMC26640 isolated from an Arctic lichen[J]. Journal of Biotechnology, 2016, 227: 23-24.
CURRENT STATUS AND PERSPECTIVES ON GENOME MINING OF POLAR MICROORGANISMS
Liao Li, Chen Bo
(Polar Research Institute of China, Shanghai 200136, China)
The rapid development of sequencing technology has greatly advanced research on microbial genomics. Although the initiation of polar microorganism genome sequencing was relatively late, it has become an important research area in the field of polar microbiology. The genetic resources of polar microorganisms hold strategic significance and social benefits. However, in-depth investigations of polar microbial genomes and genetic resources are quite limited, and the real power of genome sequencing has not been fully utilized. In this review, we summarize the current progress and research directions of polar microbial genomics, and analyze the shortcomings of current research and potential of genome mining. Accordingly, we propose key research directions requiring particular attention and breakthroughs. Overall, enhancing the mining of genetic resources from polar microorganisms provides more possibilities for future biotechnology.
polar microorganisms, genome, genetic resources, genomic mining
2019年7月收到來稿, 2019年8月收到修改稿
中國工程院戰略研究項目(2018-ZD-08)資助
廖麗, 女, 1984年生。副研究員, 主要從事極地微生物研究。E-mail: liaoli@pric.org.cn
10. 13679/j.jdyj.20190034