梁曉一
【摘 要】關于微生物時間序列的研究提供了對從海洋到人類微生物群落穩定性和動態的新見解。專用于時間序列的分析工具使這些數據受到充分利用。這些工具可以揭示周期模式,有助于建立預測模型,或者量化異常行為。此外,微生物間隨時間變化的相互作用可以用來構造隨時間變化的關聯網絡。本文通過分析介紹這些技術來說明它們在微生物研究上的潛在價值。
【關鍵詞】微生物群落 宏基因組 時間序列
高通量測序方法的改進使得關于各種環境下微生物群落隨時間變化情況的縱向研究大大增加。這些時間序列研究可以提供對于微生物群落穩定性的獨特生態見解,同時也能了解無法以其他方式獲得的微生物群落應對擾動的響應。
1通過時間序列數據了解微生物
在近期的縱向研究中,大約一半的微生物群落有負斜率時間衰減曲線,也就是說,這些微生物群落間的不同隨時間增加為增加。此外,微生物群落多樣性隨時間變化的情況與環境有關,在相同的環境下,其多樣性差異不大,在不同的環境中,微生物群落多樣性差異很大。例如,土壤和釀酒廠廢水中微生物多樣性最低,然而人類手掌和嬰兒腸道的微生物多樣性最高。對海洋微生物進行的長期研究表明,相對與其他因素,微生物群落中的個別成員會受到季節變化的強烈影響。同時,另一些微生物群落在定殖后會經過一系列的可預測狀態,例如在牙斑的形成過程中,耐氧菌的生存為厭氧菌提供環境。在某些情況下,例如嬰兒腸道菌群的定植,雖然微生物群落在初始階段變化連續變化,但最終會穩定在類似的狀態。
微生物群落往往演變成一個穩定的組合狀態,這一狀態會受到外界因素的變化而變化,例如抗生素或益生菌治療會影響腸道微生物群落的組合狀態。微生物彼此之間及微生物與環境之間的復雜相互作用是影響微生物生態的主要貢獻者,目前探索上述關系的方法主要是網絡推斷技術。
2微生物時間序列網絡
近期的研究提供了許多可以從時間序列數據構建共生網絡的方法,從結合置換檢驗的相關性分析[1]到基于超幾何分布的相似性評估[2],以及分析影響類群豐度多因素的多元回歸分析[3]。這些靜態網絡推斷技術可應用于構造動態模型。例如,微生物群落的動態變化在數學上往往符合廣義的Lotka-Volterra方程,其將微生物豐度的變化作為分類群生長率和微生物間相互作用強度的函數。方程中的參數可以利用對時間序列數據進行多元回歸確定。
然而,上述方法忽略了時間序列提供的時間點排序和依賴性的附加信息。這些特性只能通過動態的方式加以利用。
局部相似性分析(LSA)采用動態規劃算法,在最大限度上確定兩個序列的相似性得分,以判斷兩個序列的相似關系,同時LSA還可以檢測兩個時間序列之間關系的滯后。例如,LSA被用于預測噬菌體和他們的宿主之間的關系。動態貝葉斯網絡在模型中將每個變量的當前值作為其父變量之前時間點的函數。因此,動態貝葉斯網絡可檢測包括循環在內的動態相關性, 相比標準貝葉斯網絡,動態貝葉斯提供了更強大的建??蚣?,盡管它增加了計算成本,可擴展性有限,然而在識別正確模型時其對數據的解釋良好。另一組的動態網絡推斷技術基于交叉預測,它對如何通過同一系統內的其它時間序列預測某一的時間序列的將來這一問題進行量化,這類方法包括Granger因果關系[4]和新型聚合雜交映射。
上面提到的所有方法在推斷物種相互作用時都從整個時間序列出發構造單一網絡。然而,物種之間的相互作用可能隨時間改變, 因此其網絡結構也會隨之變化。時變網絡推斷技術的目的就是研究變化發展的網絡結構,非平穩和隨時間變化的動態貝葉斯網絡,可用于推斷在網絡結構隨時間發生的變化。
3結語
在微生物時間序列分析中,時間間隔的長短會影響微生物關聯關系,縱向分析中的許多方法需要短期和定期采樣間隔長的時間序列,目前可用的宏基因組時間序列往往很短(幾個時間點),跳空(失蹤的時間點),稀疏(零富)和嘈雜,因此需要進行預處理,包括:規范,插值和去趨勢,使時間點等距等方法。因此如何更好的選取取樣間隔是一個需要解決的問題。網絡結構對狀態轉換的影響的研究尚處于起步階段。未來的研究方向是探索隨時間變化的網絡是否有“預警”的屬性,即網絡結構可以預測某種轉變是否發生。
盡管面臨挑戰,微生物時間序列的研究已經提供了一套豐富的分析工具,有助于了解系統動力學和應對擾動,構建預測模型。應用這些強大的技術于微生物學和宏基因組學,在解決遇到的縱向時間序列和相關建模難題上時有很大的幫助。
參考文獻:
[1]吳松鋒,朱云平,賀福初.轉錄組與蛋白質組比較研究進展[J].生物化學與生物物理進展, 2005, 32(2): 99-105.
[2]李朝飛,于航,潘麗晶等.棉鈴蟲泛素基因的克隆及序列分析[J].中山大學學報: 自然科學版,2005,44(1):61-64.
[3]李紹珠.多元回歸分析[J].上海教育科研,1991,3: 014.
[4]李衛娜,鄭小林,侯文生 等.腦功能信號的 Granger 因果性分析方法[J].國際生物醫學工程雜志,2011,34(6):375-379.