黃若誠
【摘 要】隨著新一代測序技術的快速發展,微生物宏基因組成為研究的熱點問題。當前宏基因組數據呈現出序列短小、通量巨大的特點,既包含豐富的環境微生物信息,也為分析處理帶來前所未有的挑戰。本文介紹高通量宏基因組數據在基礎微生物學、水體、土壤、農業、醫學研究等領域的研究與應用,并分析其帶來的機遇與前景。
【關鍵詞】生物信息學 宏基因組 高通量測序
宏基因組(Metagenome)是1998年由Handelsman等人正式提出,定義為特定生物環境中全部微生物遺傳物質的總和。宏基因組學通過直接從環境樣品中提取全部微生物的遺傳物質DNA,利用第二代測序技術,得到高通量宏基因組數據,并結合微生物基因組學的研究成果,分析環境樣品所包含的全部微生物的群落組成及其結構功能。高通量宏基因組數據在基礎微生物學、水體、土壤、農業、醫學研究等領域都顯示出了重要價值[1]。
1宏基因組學研究方法
宏基因組學的研究方法主要有:環境樣本的采集、宏基因組DNA的提取,高通量測序、所得序列的比對檢索分析,以及進一步進行微生物物種結構和功能分析。其中,提取DNA要盡可能地提取出樣品中所以微生物的基因且保持基因片段的完整,目前的提取方法主要有直接裂解法和細胞提取法。隨著第二代測序技術的發展,宏基因組數據呈現出序列短小、通量巨大的特點,一方面蘊含更為豐富的環境微生物遺傳物質信息,極大拓展了微生物學研究與應用領域,另一方面也為分析處理帶來前所未有的挑戰。
2宏基因組學的應用
在短短幾年內,高通量宏基因組數據研究已滲透到各個領域,包括基礎微生物學、海洋學、土壤學、醫學等,并在醫藥、替代能源、環境修復、生物技術、農業、生物防御及倫理學等各方面顯示了重要的價值[2]。
2.1基礎微生物學研究
宏基因組為基礎微生物學研究打開了新局面,得以快速準確地探測新基因、發現新物種(如未知病原體等)以及準確認識微生物群落的物種構成及其功能結構。由于自然界中大多數微生物物種及其生物量是未知的,其中大量微生物采樣困難、培養效率低下,這極大限制了傳統微生物學的研究與發展,而高通量宏基因組數據的產生則突破了這一束縛。通過分析高通量宏基因組數據,包括序列比對、De Novo組裝、GO分析等等技術,無需經過提純培養,就能探測新基因、新物種,為微生物環境工程、疾病診斷治療奠定基礎。
2.2海洋學和土壤學研究
海洋和土壤中包含大量微生物,它們與生態環境關系密切。目前通過采用土壤、海水等環境樣品,獲取高通量宏基因組數據,探測其中微生物的組成及功能分布,能夠對導致生態環境變化的因素有更深入的認識。如利用來自海洋石油污染區的微生物高通量宏基因組數據,分析其微生物相對豐度,可以有效探測石油降解細菌及其生態關系網,為污染治理提供新思路。利用來自豆類植物附近土壤測取的宏基因組數據,分析其中固氮菌含量及其關聯因素,有助于設計提高豆類產量種植模式。高通量宏基因組數據為認識復雜的微生物群落構成及其功能提供了可能,且必將在研究生物多樣性和微生物環境工程中發揮重要作用[3]。
2.3醫學研究領域
高通量宏基因組數據在現代醫藥學中扮演著極其重要的角色,一方面通過疾病樣本的宏基因組分析,可以確定病原體或致病基因及其與其他因素之間的關聯,為疾病治療提供可能;另一方面利用宏基因組數據篩選在醫藥業中具有重要應用價值的基因及其產物,促進醫藥發展。如利用取自不同牙周炎病況病人口腔高通量宏基因組數據,分析處理得到各樣本微生物相對豐度數據,比較不同牙周炎病況下的微生物整體分布情況,揭示出牙周炎與口腔微生物群落的生物多樣性和關聯網絡之間有顯著聯系。
3結語
隨著高通量測序技術的迅猛發展,宏基因組分析已經成為探索自然環境中微生物物種和功能組成的重要手段之一,是研究微生物群落的利器。宏基因組分析手段無需經過復雜嚴苛的實驗室培養過程,直接利用第二代高通量測序技術,快速產生成千上萬的自然微生物DNA序列的短讀片。但是高通量宏基因組數據也給研究帶來挑戰。它呈現出序列短小、通量巨大的特點。此外,高通量測序技術的準確率低于傳統測序技術,亟需完善的概率統計模型和有效的算法實現[4]。
在應用前景方面,隨著組合生物合成技術和納米技術迅速發展,可以考慮將宏基因組學技術與之結合,利用納米技術人工合成由宏基因組學的方法探測所得新興基因,促進天然活性產物的開發及挖掘,進一步促進微生物工程的發展。
參考文獻:
[1]許忠能著.生物信息學[M].北京: 清華大學出版社,2009.
[2]賀紀正,張麗梅,沈菊培 等.宏基因組學的研究現狀和發展趨勢[J].環境科學學報,2008,28(2): 209-218.
[3]周丹燕,戴世鯤等.宏基因組學技術的研究與挑戰[J].微生物學通報,2011,38(4): 591-600.
[4]楚雍烈,楊娥.宏基因組學及其技術的研究進展[J].Journal of Xian Jiaotong University(Medical Sciences), 2008,29(6): 35-43.