趙宇卓 吳 盡 楊天雄 姚茂林 裴 欣 付藍儀 劉學東
(東北林業大學,哈爾濱,150040)
動物腸道環境中寄生著大量微生物,與宿主間形成共生關系[1]。傳統腸道微生物研究方法主要是在體外從復雜樣本中分離獲得單一菌株,純培養后進行鑒定分析,然而純培養技術能獲得的細菌僅占自然界細菌的一小部分,很大程度上低估了臨床和自然環境樣本中微生物的多樣性[2]。伴隨著高通量測序及數據分析技術的發展,2005年Eckburg等[3]首次對人類糞便以及結腸區域的細菌進行16S rRNA基因擴增子測序分析,揭示了人類糞便樣本中含有大量非培養細菌和未被發現的細菌。Gill等[4]通過全宏基因組測序分析人類腸道菌群,表明腸道微生物參與到多糖、氨基酸和外源生物的代謝等重要途徑中。以上兩項研究為腸道微生物領域研究提供了新的方法論,成為研究腸道微生物的主要方式,研究人員逐步揭示出腸道微生物在動物的代謝[5]和免疫[6]等多種重要的生理過程中所扮演的關鍵角色。因此,充分了解動物腸道微生物的組成及功能在野生動物生理生態等研究中具有重要意義。本篇綜述中,我們將對宏基因組技術發展現狀進行總結,并結合宏基因組技術在野生脊椎動物腸道微生物領域中的具體應用,從而探討宏基因組技術在野生動物領域研究中的應用前景,以及在野生動物保護與管理中所能起到的作用。
目前被廣泛應用于動物腸道微生物研究的高通量宏基因組技術,主要為標志基因擴增子分析和全宏基因組分析,兩種方法各自有其優缺點(表1),應根據研究的目的需求來進行方法的選擇。

表1 兩種宏基因組分析方法優缺點比較
標志基因擴增子測序,基于PCR擴增微生物群基因組特定區域,此類區域通常包含至少一個高度可變區,用于微生物分類學鑒定,高變區的兩側是高度保守的區域,可作為PCR引物的結合位點,隨后通過高通量測序分析來研究樣本中的微生物的組成及功能。目前,應用較為廣泛的擴增子分析有用于鑒定細菌和古菌的16S rRNA基因、真核生物的18S rRNA基因以及真菌的ITS區域。腸道微生物組成以細菌為主,因此選擇16S rRNA擴增子進行研究。
1.1.1 樣本處理與建庫測序
在腸道微生物研究中,首先需要從糞便樣本中提取完整的DNA,Costea等[7]對21種糞便DNA提取方法進行了比較,結果表明提取方法會明顯影響DNA的質量以及數據分析結果,比如不同方法對于革蘭氏陰性或革蘭氏陽性細菌的提取效率會存在明顯差別,因此實際應用中,應根據樣本情況來選取合適的提取方法。
在獲取高質量DNA后,利用通用引物擴增16S rRNA基因區域并完成建庫測序。細菌16S rRNA基因由9個可變區域組成。目前大部分研究使用的是以Illumina為代表的二代測序平臺,由于其短讀長的特點,因此只能對16S rRNA基因的部分可變區域進行擴增測序分析,然而對不同可變區域進行擴增分析,最終產生的物種分類結果會存在較大差異[8],并且在物種注釋時大部分只能分類到屬水平以及會出現分類錯誤的情況,而對16S rRNA進行全長分析則能獲得更高的分類分辨率以及準確度[9]。Karst等[10]將分子合成標簽技術與二代測序平臺結合使用,能實現對全長16S rRNA和18S rRNA基因進行分析,但該方法也僅限于對長度小于2 000 bp的擴增子研究。近年來,Pacbio的SMRT(single-molecule real-time sequencing)測序[11]和Oxford的納米孔測序[12]等三代單分子測序技術具備長讀取的特點,極大地拓展了擴增子技術可測量的范圍。但是三代單分子測序技術普遍存在測序高錯誤率問題,Pacbio平臺采用的SMAT測序會發生的是隨機錯誤,即錯誤不會總發生在同一個位置,在環形一致測序(circular consensus sequencing)模式下,聚合酶的讀長通常大于插入片段的長度,會對插入片段進行多次測序,通過算法進行自我糾錯便可以得到高準確度的序列[13]。與之相比,Oxford的納米孔測序的缺點主要在于同聚物和串聯重復區域形成的錯誤難以消除,并且在高GC區域產生刪除和錯配的幾率也顯著增加[14]。因此Pacbio測序平臺憑借高準確率和長讀取的優勢將成為擴增子研究中的主要工具。
1.1.2 數據處理與分析
測序下機數據通過SMRT Link軟件處理,獲得高質量循環一致序列(CCS read),隨后利用主流的擴增子分析平臺Mothur[15]、Usearch[16]以及QⅡME2[17],對CCS序列進行擴增引物去除、聚類或降噪以及嵌合體去除,最終獲得可操作分類單元(OTUs)或擴增子序列變體(ASVs)。將聚類或降噪獲得的代表性序列與公共數據庫對比,從而實現物種注釋,用于16S rRNA擴增子分析的常用公共參考數據庫有RDP[18]、Greengene[19]、SILVA[20]。
多樣性分析是擴增子測序分析中的重要部分,α多樣性主要衡量單一樣本微生物群落的豐度和多樣性;β多樣性則反應對不同樣品或不同組間樣品的微生物群落構成的相異性。此外,根據擴增子測序結果,還可以實現對于微生物群落的功能預測,常用的軟件有PICRUSt2[21]和Tax4Fun[22]等。
全宏基因組分析是對樣本內微生物群總DNA進行高通量測序分析,包含有細菌、古菌、原生動物、病毒與真菌。與標記基因擴增子分析相比,宏基因組測序不需要進行PCR擴增,因此不存在引物偏好性影響結果,并且可以獲取更為詳細的遺傳學信息和更高的分類學分辨率。
1.2.1 樣本處理與建庫測序
在實際應用中,由于二代測序技術獲得的微生物基因組由于短讀長往往存在片段化問題,在組裝時會遺漏很多生物學信息,而三代長讀測序能夠對短讀產生的缺失部分進行覆蓋,因此使用二、三代結合測序分析,能夠獲得更加完整且準確的宏基因組[23]。相比于擴增子分析,全宏基因組分析獲取的信息更多,但也因此在建庫和測序上成本和難度會更大。
1.2.2 數據處理與分析
獲取下機數據后,對數據進行質量控制并且去除宿主基因,然后通過組裝軟件對序列進行組裝,組裝是宏基因組數據處理的關鍵部分,對后續分析起重要作用,組裝軟件可分為二代測序數據組裝軟件MEGAHIT[24]等,三代測序數據組裝軟件Canu[25]、MECAT[26]等,以及二、三代測序混合組裝軟件metaSPAdes[27]、OPERA-MS[23]等。基于組裝結果,對序列進行基因預測,目前主要有兩種方式,一種是根據已知序列,通過相似性對比,進行同源預測,該方法依賴數據庫信息,不能注釋出新基因,并且十分消耗計算資源及時間;另一種方法為根據序列特征進行預測的從頭預測法,如Metagenemark2[28]、MetaProdigal[29]等軟件。預測完成后,根據基因序列聚類相似度以及基因序列聚類覆蓋度,使用CD-HIT軟件對預測的基因序列進行聚類,構建非冗余基因集[30],再通過Salmon軟件能進一步計算出基因在樣本中的表達豐度[31],將基因預測結果,與數據庫進行對比完成對于基因的功能注釋。
基于全宏基因組數據進行物種組成分析時,主要通過分箱和分類兩種方式,兩種方式在實際應用中經常交替使用。在復雜的宏基因組樣本中包含大量非培養細菌,分箱方法根據核酸組成區分不同物種來源的序列,從而獲得微生物群落中單個菌株的基因組草圖,是獲取樣本中非培養微生物基因組的重要途徑[32],目前常用的分箱軟件有MaxBin2[33]、MetaBat2[34]。而分類是基于參考數據庫與測序序列的對比,對樣本數據進行物種注釋,Ye等[35]比較了20種宏基因組分類軟件,評估其在宏基因組分類中的表現、參考數據庫大小和更新速度以及硬件要求,為分類軟件的選擇提供了重要的參考。
動物腸道微生物組成和其飲食結構息息相關。He等[36]利用全宏基因組測序分析,揭示了圈養東北虎(Pantheratigrisaltaica)腸道微生物組成結構及功能,結果顯示其腸道功能主要以碳水化合物代謝、氨基酸代謝以及膜轉運為主,具有典型肉食動物的腸道微生物結構。大熊貓(Ailuropodamelanoleuca)和小熊貓(Ailurusfulgens)在系統發育中屬于食肉目(Carnivora)動物,但二者均專竹食生活,研究表明相比于食肉動物,二者腸道中用于消化纖維素、半纖維素的細菌豐度較高,以助于消化竹子[37-39]。鯨目(Cetacea)動物從食草的陸生偶蹄目(Artiodactyla)動物進化而來,與牛(Bostaurus)和河馬(Hippopotamusamphibius)有親緣關系[40],長須鯨(Balaenopteraphysalus)腸道菌群表現出在蛋白質消化和生物合成相關基因方面與食肉海洋魚類菌群相似,而在碳代謝和能量代謝相關基因方面與食草動物相似,這說明了飲食和進化史結合在一起形成了鯨目動物腸道中的微生物多樣性[41]。
腸道微生物動態變化是野生動物適應環境的重要手段。通過比較冬季和春季藏酋猴(Macacathibetana)腸道微生物樣本,發現其腸道中碳水化合物和能量代謝途徑相關功能的細菌在春季樣本中顯著增長,使藏酋猴從冬季經歷的嚴重能量損失中快速恢復[42]。腸道菌群組成和功能的變化為能量和營養攝入的季節性波動提供了緩沖,以適應食物供應的變化。孫國雷[43]對羊亞科(Caprinae)的喜馬拉雅塔爾羊(Hemitragusjemlahicus)、巖羊(Pseudoisnayaur)和歐洲盤羊(Ovisariesmusimon)的腸道微生物進行16S rRNA擴增子測序分析,結果顯示厚壁菌門(Firmicutes)和擬桿菌門(Bacteroidetes)在3個物種的腸道中均占主導地位,這兩個門類中分別以消化纖維素與半纖維素等粗纖維的梭菌目(Clostridiales)和擬桿菌目(Bacteroidales)細菌為主;另一方面喜馬拉雅塔爾羊的厚壁菌門與擬桿菌門的比值及梭菌目的豐度占比顯著高于其他兩種動物,說明塔爾羊腸道能更加高效地將食物中的粗纖維轉變為短鏈脂肪酸從而供給能量,以適應高海拔生活和惡劣環境。
多數鳥類營飛行生活,候鳥進行長距離遷徙以適應季節變化,隨著越冬時期不斷推進,白頭鶴(Grusmonacha)腸道中的厚壁菌門豐度呈現增長趨勢,變形菌門(Proteobacteria)豐度則顯著下降[44]。新西蘭鸮鸚鵡(Strigopshabroptila)處于極度瀕危狀態,其腸道微生物多樣性較低,幾乎只包含厚壁菌門和γ-變形菌綱(Gammaproteobacteria),該研究為鸮鸚鵡極危物種的保護提供了重要的微生物基礎[45]。通過與陸生動物進行比較,鳥類的腸道微生物表現出與宿主系統發育或飲食的相關性非常微弱[46],這可能與鳥類為適應飛行減輕體重,而發育的特殊排泄系統結構有關。
兩棲動物在脊椎動物進化中具有重要地位,是由水生轉變為陸生的一類過渡物種,爬行動物由兩棲動物進化而來且完全適應陸生生活。兩棲動物幼體水生,成體陸生,中國林蛙(Ranachensinensis)在由水生蝌蚪變態發育至陸生成體過程中,腸道微生物組成發生極大轉變,表現為擬桿菌屬(Bacteroides)、鯨桿菌屬(Cetobacterium)和梭菌屬(Clostridium)等減少,并且在不同變態時期的腸道微生物的多樣性也表現出明顯地變化[47]。兩棲爬行類動物是典型的變溫動物,冬眠是其適應低溫氣候的重要生活方式,研究表明揚子鱷(Alligatorsinensis)在冬眠期其腸道特異性微生物通過利用宿主來源的粘蛋白糖苷從而維持生命,以適應宿主冬眠禁食期間腸道內食物匱乏的情況,這與多數非冬眠恒溫動物選擇通過大量進食來增加代謝并抵御低溫所采取的策略相反。而在活躍期,揚子鱷腸道呈現典型食肉動物特征,即高豐度的梭桿菌門(Fusobacteria),并且具有水解蛋白質、多肽及發酵氨基酸功能的細菌顯著富集以適應高蛋白飲食[48]。
水體理化性質(如溫度、鹽度等)的變化會影響著魚類腸道微生物,研究表明大西洋鮭魚(SalmosalarL.)腸道細菌數量會隨著水溫升高而增加[49]。Zhang等[50]在實驗環境下模擬淡水和海水環境探究不同鹽度對于尼羅羅非魚(Oreochromisniloticus)腸道微生物的影響,結果顯示處于高鹽度環境下假單胞菌(Pseudomonas)、鯨桿菌屬以及德沃斯氏菌屬(Devosia)豐度更高。
食性同樣也是影響魚類腸道微生物組成的重要因素。在草食性魚類腸道中,以纖維素溶解菌,如檸檬酸桿菌屬(Citrobacter)、纖毛菌屬(Leptotrichia)和梭菌屬為主;在肉食性魚類腸道中則以鯨桿菌屬和生產蛋白酶的鹽單胞菌屬(Halomonas)為主,證明食性在魚類腸道微生物中同樣有重要的影響,并且魚類腸道微生物多樣性也伴隨肉食、雜食、草食食性呈現遞減狀態[51]。
綜上所述,伴隨著測序技術和生物信息學的發展,對于野生動物腸道微生物的研究重點逐漸由簡單的結構組成分析深入到微生物功能分析,涉及食性、健康以及環境適應等諸多方面,為野生動物保護與管理提供了重要的參考和應用價值。首先,腸道微生物多樣性可以作為評估野生動物所在棲息地是否適宜生存的重要指標。研究表明由于人類活動導致的動物棲息地污染[52]、破碎化以及縮減[53]都會導致動物腸道微生物的多樣性下降,多樣性的損失對宿主的健康產生影響。其次,應用于實施遷地保護物種的野化放歸過程中。由于人工圈養條件下的生活環境相比野外要更加干凈,動物因此喪失了大量環境來源的微生物,直接導致了腸道微生物多樣性下降,即使人工模擬野外飲食條件也很難使其腸道微生物結構與野生種群一致[54],腸道微生物多樣性決定著圈養動物在放歸后對于野外環境是否有足夠的抵抗力和適應力,因此腸道微生物多樣性應作為是否適于放生的重要考量指標。
不僅限于腸道樣本研究,宏基因組技術目前也已廣泛應用于各種臨床樣本(如口腔,皮膚和腦脊液等)的病原體診斷中[55],近年來由野生蝙蝠(Chiroptera)攜帶的病原體導致的疾病在人類中大規模爆發,如馬爾堡病毒和亨德拉病毒等,蝙蝠口腔和排泄物中的病原體伴隨季節性繁殖的進行而發生動態變化,并且排泄行為可能是其病原體脫落并傳播的重要途徑[56]。研究人員通過對已死亡的馬來穿山甲(Manisjavanica)的多個器官進行宏基因組病毒分析,檢測到多種可以傳染人類的病毒,如仙臺病毒及冠狀病毒,表明穿山甲可以作為冠狀病毒傳播的中間宿主[57],由此可以看出宏基因組技術將被廣泛地應用于野生動物檢疫中,從而促進野生動物醫學和公共衛生學的發展。
宏基因組技術雖然已成為目前微生物研究中的重要工具,但該技術的局限性在于其只能獲得微生物群的組成結構和整體功能圖譜,不能了解微生物群的功能基因的瞬時表達情況,需要同宏轉錄組、代謝組學[58]以及宏蛋白組[59]等組學技術進行結合使用,然而成本較高以及對分析流程進行整合優化仍是多組學聯合分析面臨的問題。相信在以上問題得以解決后,研究人員將會更全面地了解微生物在野生動物生活史中所扮演的角色。