章廣能
實現樣本分類需要提取不同狀態的樣本差異性特征,本文深入研究了不同樣本的16S rRNA基因序列,通過分析模擬數據,驗證群落結構的可行性。保障樣本多樣性,可以提升樣本物種豐富的信息,同時可以降低樣本特征維度。多樣性特征還結合了群落獨立進化信息和舞種豐度,是非常理想的樣本特征。
宏基因組學主要是研究環境樣本中國提取的微生物遺傳物質。針對傳統的微生物研究,主要是分離培養和提純微生物,但是利用分離培養方法會破壞微生物的多樣性。而宏基因組分學突破了一直以來對于微生物的研究,宏基因組主要是通過研究物質,為拓展了相關課題研究的思路[1]。
在自然環境各處都存在微生物,此外在人體環境中也存在大量的微生物,利用傳統的分離培養技術,沒有充分地認識人類和微生物的關系。因此,在研究階段開始利用宏基因組學。宏基因組學首先是研究單一微生物的群落聚集,其次,系比較不同微生物群落,最后分析微生物之間的關系。選擇研究方法包括功能篩選和序列分析等,發展利用宏基因組學,可以為各種難題提出針對性方法。例如選擇功能篩選,因為宏基因組測序數據中包含微生物的基因序列,利用費培養研究方法,有利于研究未知微生物。此外,在研究過程中利用宏基因組學,可以獲得新的活性物質,例如在宏基因組樣本中發現阿霉素和四環素等天然產物。
在宏基因組學研究中利用序列分析方式,通過分析微生物基因序列的生物信息學,一方面有利于研究環境微生物多樣性,工作人員在研究階段可以利用相關方法探索各種微生物群落。另一方面可以根據序列對比,明確微生物群落的結構特征。通過分析不同的微生物樣本,明確不同微生物的基因序列,從而明確其中的差異性,對于未知微生物也可以起到預測作用[2]。
近些年,在各個行業發展研究階段都開始利用宏基因組的相關知識和方法,可以拓展整體工作思路。例如在醫學領域當中,可以利用宏基因組分類分析方法研究口腔微生物,根據這一微生物的特征和習性等,確定相關疾病的治療方法。例如,醫學人員通過在倡導菌群研究中利用紅基因組學分析樣本的微生物序列,確定兒童孤獨者患者通常都具有紊亂的長大菌群結構。在生態學中,利用宏基因組分類分析方法分析微生物多樣性和降解基因豐度,利用研究結果,可以在水污染治理中利用活性污泥。
當前,在各個領域的微生物研究中都開始利用宏基因組分類分析方法,同時這一方法還具有良好的應用前景,在實際工作中不斷出現海量微生物基因序列樣本,因此更多的研究者注重分析宏基因組分類分析方法。利用宏基因組分類分析方法,可以對于醫學診斷和人體生理狀態檢定等方面提出新型思路。當前我國主要是在微生物全基因組序列中利用宏基因組分類分析方法,但是很少研究基于微生物保守序列的樣本分類方法[3]。
根據16 rRNA測序數據,明確宏基因組分類的分析流程,并且結合模擬數據評估分析六層的正確率。結合宏基因組的測序計劃,得出以下的流程步驟:
(1)計算樣本{S1,S2,…,Sn}的OTU表{T1,T2,…,Tn};
(2)根據樣本的OTU表{T1,T2,…,Tn},選擇樣本特征為豐度,主要分為α多樣性或者β多樣性;
(3)工作人員可以利用隨機森林分類算法,在計算階段秩序將樣本特殊數據輸入進入,即可實現樣本分類。
在宏基因組分類過程中,首先需要明確不同樣本的特征,隨后再利用隨機森林的分類算法,針對不同宏基因組樣本狀態實施分類,因此,獲取各種時間和各種空間的樣本[4]。
2.2.1 物種相對豐度
微生物菌群的相對豐度對于環境和素質產生的影響具有較大的差異性。例如,通過分析腸道菌群的擬桿菌門,發現肥胖癥患者的相對豐度通常較低,因此宏基因組的樣板特征可以選擇群落的相對豐度,在樣本分類中可以利用群落相對豐度。
通過16 rRNA測序數據,可以計算出菌群的相對豐度值,在實際計算階段:工作人員首先需要分別統計樣本微生物,根據計算結果制定OTU分類學綜合信息表。數據和數據庫經過預處理之后,再經過篩選和過濾之后,將不符合要求的序列去掉。經過聚類獲取序列相似性信息。分別統計樣本中OTU中reads數目,因此確定每個樣本的OTU豐度。其次,完成分類分析,工作人員可以對照silva庫中參考序列鑒定樣本舞種。最后,需要結合物種分類學信息注釋OTUtable,因此建立OTU分類學綜合信息表,同時利用統計學分析方法計算物種相對豐度。樣本特征選取群落物種相對豐度,在樣本類別判斷階段,需要選取群落的微生物數量差異。利用這一特征,可以對于各行業的問題落實樣本分類分析。
2.2.2 α多樣性
利用α多樣性可以準確地描述物種多樣性。例如改變人體微生物群落物種多樣性,人體健康將會受到影響,對比較胖的人群,較瘦人群具有較高的腸道微生物物種多樣性。如果某人胃內油門螺旋桿菌處于陽性,那么油門螺旋桿菌將會破壞胃內微生物群落多樣性,這類人很容易感染潰瘍等疾病。
在實際工作中加入其他的樣本特征信息,加入特征可以是時間、地點以及年齡等,例如研究人體皮膚表面的微生物群的過程中,為了保障研究結果的可靠性和代表性,研究人員需要提取身體各個部位的皮膚樣本,因為人與人之間具有巨大的差異性,因此在分析階段可能會發生樣本分類錯誤問題,因此在α多樣性特中加入特征信息,可以使樣本分類的準確性得到提高[5]。
2.2.3 β多樣性
在針對兩個群落物種開展研究的過程中可以利用β多樣性,同時可以將群落物種的變化顯示出來。在群落間差異分析階段可以利用很多傳統的度量方法,但是根據系統發育關系的β多樣性指數,可以將反應群落差異準確地反映出來。
當前在很多微生物分析過程中都開始利用群落β多樣性,這一理念的基礎是系統發育,通過分析不同群落之間的β多樣性,可以明確不同群落之間的相似性和差異性。例如,在哺乳動物腸道菌群進化階段,通過比較分析微生物群落,可以明確生物圈進化情況。通過研究健康成人的微生物群落,因為隨著時間和空間的變化,人體微生物群落也會發生變化,這些變化可以確定微生物對于人體疾病預防的作用,同時也可以明確人類治病原因。
綜上所述,α多樣性代表微生物群落結構信息,其中包括群落物種個數和物種比例等信息,α多樣性和β多樣性以及群落微生物功能的基礎為物種豐度的基礎都是物種豐度,因此,物種豐度可以各種樣本特征。
微生物和人們生產和生活具有緊密的聯系,通過研究和應用宏基因組分類分析方法,有利于研究整體環境微生物基因,幫助人員更好地揭示微生物世界。但是因為微生物比較復雜,僅此在今后工作中,需要根據實際工作情況進一步改進宏基因組分類分析方法,提高樣本分裂的準確率。