鄭廣勇,楊楨,曹瑞芳,劉婉,李亦學,,張國慶,
1.中國科學院上海生命科學研究院生物醫學大數據中心, 上海 200031;
2.上海生物信息技術研究中心, 上海 201203
近年來,隨著二代測序技術及各種高通量組學技術的快速發展,生物醫學研究進入大數據時代。實驗技術和信息技術的發展,使生物醫學數據開始從萬億字節的TB級躍升到千萬億字節的EB級,引發了后基因組時代的生物醫學研究的深刻變革。生物醫學研究已經從第一范式的實驗科學,或快或慢地進入第二范式理論科學、第三范式計算科學,直到最新的第四范式數據密集型科學。數據質量對大數據分析與挖掘的價值日益凸顯。目前,測序能力的提升極大地推動了包括微生物組學在內的各種組學的快速發展,進而催生了大量以微生物為主要研究對象的國際合作項目,使得微生物組和微生物系統組成為生物醫學大數據的重點研究方向之一。微生物組是指存在于特定環境或生態系統中的微生物以及它們攜帶的遺傳信息和生物學功能的總和[1]。微生物組與人類健康有極為重要的關系,人體微生物組由數百至數千種不同的微生物組成,其細胞總數可達數萬億之多,數量遠超人體自身細胞數量,其中獨特的微生物基因數量多達2 000萬個,數目遠遠超過人的基因數目(大約 2.5 萬個)。通過對人體微生物組進行研究,可以解析人類健康、營養、代謝等方面的科學問題。
目前,宏基因組(metagenome)技術是微生物組研究的重要手段之一,該技術利用基因組學策略研究特定環境樣品中包含的全部微生物的遺傳組成及其功能模式[2]?!?br>