祁釗,趙相龍,桑金慧,何振杰,傅丹丹,岳振宇,宋祥軍*
(1.安徽農業大學信息與計算機學院,合肥 230036;2.安徽省動物性食品質量與生物安全工程實驗室,合肥 230036)
環境中的糞便污染是全球范圍內日益嚴重的問題,尤其是在河流和溪流中[1]。流域的糞便污染可能存在多種來源,包括污水基礎設施等點源排污,受上游牲畜、寵物和野生動物排泄物污染的徑流[2]等。糞便污染帶來的高營養和微生物負荷不僅會影響生態健康,而且糞便病原體通過水媒的傳播還會進一步影響人類健康。對主要水媒傳播病原體的檢測是表征人類健康風險的最直接方法,但由于環境中病原種類繁多(包括病毒、細菌和原生動物),對其進行檢測不僅會浪費大量時間,還會消耗大量經濟成本。為解決這一難題,監管機構使用糞便指示菌(Fecal indicator bacteria,FIB),如大腸桿菌(Escherichia coli)和糞大腸菌群(Fecal coliforms)等來評估糞便污染水平[3],并以此作為水體微生物風險的替代指標[4]。然而,傳統糞便指示菌的水質指標檢測雖節約了時間和成本,卻也存在諸多不足,如無法提供污染源信息、且無法反映水體近期的污染情況[5-6]等,近年來許多污染溯源研究表明,FIB 與環境病原相關性不佳[7-8],故而人們開始探索更加快速、經濟的微生物溯源技術。
微生物來源追蹤(Microbial source tracking,MST)技術利用人和動物胃腸道中的微生物設計出具有特異性的標記物,并通過定量聚合酶鏈反應(qPCR)等分子技術檢測與宿主相關的微生物標記基因,從而識別潛在的糞便污染源[9-10],但地理差異會顯著影響基于宿主特異性分子標記檢測方法的靈敏度和特異性,這給MST 技術的實際應用帶來了困難。在過去的20 a 中,伴隨著下一代測序(Next generation sequencing,NGS)技術的快速發展,研究者對人類、家畜和野生動物腸道微生物組的理解不斷加深[11]。使用NGS 數據獲取環境及糞便來源的獨特的微生物群落圖譜的方法被稱為基于細菌群落的MST(Community-based MST)[12],主要方法包括基于貝葉斯分類器的Source?Tracker[13]與基于快速期望最大化算法的微生物源追蹤(FEAST)[14]。兩個MST 軟件的運行均需要使用者提供糞便來源文庫(Fecal taxon library,FTL),并基于該文庫中不同的宿主菌群組成對待測樣本中微生物的來源進行預測[15],進而評估不同污染源對樣品微生物群落的貢獻度[16]。SourceTracker 源解析程序通過對不同宿主糞便以及環境水樣16S rRNA 基因將不同糞便來源的微生物群落和待分析的水體微生物群落當作一個整體,基于貝葉斯算法,識別水樣中不同宿主來源微生物所占比例,解析水樣中糞便污染來源[13]。目前,研究人員已將此方法應用在不同區域以識別水環境中不同糞便污染來源及其貢獻率,例如,Brown 等[15,17]使用SourceTracker 成功識別出蘇必利爾湖河口糞便污染主要來自污水處理廠排放的廢水(70%)和海鷗糞便(30%),與qPCR 方法所得結果一致。FEAST是一種新興的計算工具,可用于同時估計多個潛在來源和各種糞便輸入的相對貢獻。相同條件下,FEAST比SourceTracker表現出更強的穩定性和更高的運行速度[14]。但目前應用FEAST 軟件進行河流水域糞便污染追溯的研究較少,因此其在糞便污染追溯方面的準確性尚需進一步驗證。
在本研究中,研究者提取了所采集樣本的DNA用于16S rDNA 測序,旨在通過對比測序結果,探索不同采樣地點[家禽與廢水處理廠(WWTP)、河流水體]及不同樣本中(皖江流域地區野生候鳥、人工養殖的家豬)細菌群落結構的多樣性,以及不同物種糞便微生物組/環境微生物組的差異。此外,將測得的NGS數據比對到本地潛在病原數據庫,用以表征不同生境樣本中的潛在病原組成,為后續污染溯源工作奠定基礎。而后,通過利用不同來源潛在污染物的NGS 數據集構建FTL 文庫,應用基于SourceTracker 與FEAST兩種程序的MST 方法對自然水體樣本進行污染溯源研究,進一步表征水體公共安全風險,為巢湖流域水環境治理提供理論及數據支持。
巢湖位于安徽省中部,是中國五大淡水湖之一,同時也是中國富營養化水平最高的湖泊之一[18]。巢湖流域水路網絡密集,總流入量的80%以上來自雙橋河、派河和南淝河等12 條河流。近年來,伴隨巢湖流域人類活動的增加,巢湖受到了嚴重污染(包括工業、農業和居民生活污水來源),同時逐漸發展出富營養化現象[19]。
1.2.1 水體樣本采集
本研究于2021 年10 月采集水體、沉積物樣本共63 個,包括從巢湖流域的杭埠河(HR)、豐樂河(FR)、派河(XR)各采集的水樣(S)3 份,沉積物3 份,在杭埠河采樣點上游有水禽養殖地點(HRD)額外采集的水樣3 份。在巢湖北側農業面源污染監測站(巢湖烔煬鎮西宋村污水處理站)采集的處理站入水口(D)及出水口(E)水樣各6 份,另外還在監測站周邊村莊的排污口(C)采集了6 份水樣。另在采集糞便樣本時,在淮北昌農收集豬糞便樣本(HB)的采樣點采集了該養殖廠的廢水處理系統進水(ND)以及出水(NC)樣本各3份。水樣用500 mL無菌塑料瓶收集,沉積物樣品使用抓斗取樣器在距水面約100 cm 深度處采集。樣本于冰上儲存,并在6 h 內運送至實驗室進行處理。水體樣本使用0.22 μm 聚碳酸酯膜進行過濾,所得濾膜儲存于-80 ℃以供后續分析。
1.2.2 糞便樣本采集
本研究共收集糞便樣品229 份,畜禽糞便(豬和雞)樣品取自皖江流域內規模化養殖場。本研究一共采集了6 個不同地點的豬糞便樣本,其中包括從太湖縣收集的豬糞便樣本(PA)、金寨縣收集的豬糞便樣本(PI)和岳西縣收集的豬糞便樣本(PL)各5 份,從蚌埠固鎮收集的豬糞便樣本(BG)、淮北昌農收集的豬糞便樣本(HB)、宿州褚蘭收集的豬糞便樣本(SC)、徐州昌農收集的豬糞便樣本(XZ)各4份,在養殖場采集的豬糞便樣本共31 份。雞糞便樣本采集自皖江流域內規模化養殖場,共分為5 組,編號為C、mC、L、LS 和S,樣本數量分別為9、6、15、15 份及15 份,共60 份。另有鵝糞(F)5 份。所有糞便采集均使用消毒的50 mL收集管,并儲存于冰盒,8 h內送至實驗室處理。
1.2.3 DNA提取及宏基因組測序
水體、糞便和土壤樣本用DNeasy PowerSoil?Pro Kit試劑盒提取DNA,使用通用引物341F(5'-CCTAC?GGGNGGCWGCAG-3' ) 和 805R (5'-GACTACH?VGGGTATCTAATCC-3')PCR 擴增水中細菌的16S rDNA 基因高變區(V3~V4),PCR 產物經2%瓊脂糖凝膠電泳驗證。在整個DNA 提取過程中,使用超純水,以排除假陽性PCR 結果作為陰性對照的可能性。得到的擴增子(PCR產物)經純化后進行濃度檢測,合格后用于測序,擴增子文庫的大小和數量分別在Agi?lent2100 生物分析儀和Illumina 的文庫定量試劑盒上進行評估。
1.2.4 樣本構成
為增加數據豐富度及可靠性,除了本研究所采樣本外,還使用其他已公布的巢湖水體數據,如Zhang等[20]采集的18份巢湖流域水體樣本:具有農業和生活污染背景(Agricultural and domestic pollution,ADPR)的河流包括雙橋河(CR1)、拓皋河(CR2、CR12)、雞裕河(CR3)、兆河(CR10)和玉溪河(CR11);工業和生活污染背景(Industrial and domestic pollution,IDPR)的河流包括南淝河(CR5)、塘西河(CR7)和杭埠河(CR9);農業污染背景(Agricultural pollution,APR)的河流包括烔煬河(CR4)、十五里河(CR6)和派河(CR8);還包括湖中的6個采樣點,南淝河口(CL1)、裕溪河(CL6)、兆河(CL3)以及東湖(CL4、CL5)和西湖(CL2)中心的樣本。該系列樣本采用有機玻璃儀器于水下50 cm深度人工采集,每個地點采集3個平行水樣,混合成1個水樣,下游處理與本研究相同。此外,本研究還選取了來自菜子湖與升金湖的白額雁(Anser albifrons)糞便樣本30 份[21]、升金湖的白頭鶴(Grus monacha)糞便樣本16份[22]。以及Pan等[23]采集的來自合肥市的87份人類糞便樣品。這些樣本的下游處理與本研究相同,且測序均為靶向細菌16S rDNA基因V3~V4區。本研究采集水體、糞便樣本的測序原始數據已上傳至NCBI,并可通過PRJNA783993進行獲取。
1.3.1 FTL文庫構建
已有研究表明,FTL 文庫中是否包含具有明確本地來源的樣本對溯源準確度有較大影響,因此本研究選取巢湖流域北側農業面源污染監測站(巢湖烔陽鎮西宋村污水處理站)及周邊村莊的排污口樣本作為FTL 文庫中本地污染來源的代表樣品。此外,有研究報道,糞便文庫的高組內變異度會對SourceTracker的溯源結果產生顯著影響[24]。基于這項原則,本研究將野生水鳥糞便與污水樣本按原始樣本類型進行了拆分,野生水鳥糞便拆分為白頭鶴(Grus monacha)與小白額雁(Anser albifrons)糞便,而所有污水樣本按處理前后及污水來源進行了區分,以期最大程度消除糞便文庫的組內變異對預測結果產生的影響。
1.3.2 基于16S rDNA測序的潛在病原菌豐度評估
通過VFDB 網站(http://www.mgc.ac.cn/VFs/)以及病理系統資源整合中心(PATRIC)的病原生物數據,以及其他研究中的潛在病原數據[25-29],收集了包括159 個屬的潛在病原清單,之后根據屬名在美國生物安全協會網站(https://my.absa.org/tiki-index.php?page=Riskgroups)進行檢索,記錄該屬內生物安全等級為二級或三級的物種,于LPSN(The List of Prokary?otic names with Standing in Nomenclature)(https://www.bacterio.net/)網站下載該物種的參考16Sr RNA序列,如在LPSN 網站無法檢索到該物種,則從NCBI(http://www.ncbi.nlm.nih.gov/)的GenBank中檢索并下載對應的16S rDNA 序列。最終構建了包括51 個屬,444 個物種16S rDNA 序列的潛在病原數據庫。將聚類所得ASV序列通過BLASTN比對到建立的潛在病原數據庫,閾值設置為相似度≥98%、覆蓋度>99%,潛在病原的相對豐度是通過將鑒定為潛在病原的序列對應的ASV豐度值與樣本總ASV豐度的比值來確定。
1.3.3 基于機器學習的微生物污染溯源解析
將不同類型水體或沉積物(即目標樣本)設為Sink,微生物污染源或來源的樣品(即構建的FTL 文庫樣本)為Source。分別使用SourceTracker2 以及FEAST 計算來自不同(Source)來源(人類及動物糞便、豬場廢水處理系統進水與出水、污水處理廠的進水和出水、村莊污水口)的微生物群落對匯(Sink)環境(即巢湖流域的水體、河流沉積物)的潛在貢獻。SourceTracker2與FEAST兩種方法的區別在于他們是基于不同的算法來探究目標樣本(Sink)中微生物污染源或進行污染來源(Source)的分析。根據Source樣本和Sink 樣本的群落結構分布,預測Sink 樣本中來源于各Source 樣本的組成比例。SourceTracker2 與FEAST 的分析使用默認參數進行。每個溯源軟件進行5 次獨立運行以計算每個潛在源的平均貢獻度及其標準偏差。然后通過相對標準偏差(Relative stan?dard deviation,RSD,D)計算平均貢獻度與標準偏差之間的比率,見公式(1)。
RSD 可以評估多個模型運行的精密程度[30]。式中:S為標準偏差(也可以表示為SD);n為重復次數,xˉ表示平均值。RSD 較高(≥100%)表明預測結果的可靠性低。
Wilcoxon 秩和檢驗(Wilcoxon rank sum test)用于推斷兩個獨立樣本所來自的兩個總體分布位置是否有差別,通常在數據不是正態分布時使用。通過Wil?coxon 秩和檢驗可以得到一個正態隨機變量Z,再用軟件或查正態分布表得到對應的P值。如果P值較小(比如小于或等于給定的顯著性水平)則可以拒絕零假設。如果P值較大則沒有充分的證據來拒絕零假設,但不意味著接受零假設。即在數據不是正態分布時,可以使用Wilcoxon秩和檢驗驗證樣本之間的差異是否顯著。
1.3.4 測序數據處理
數據分析參考擴增子分析流程EasyAmplicon(https://github. com/YongxinLiu/Easy Amplicon) 完成[21]。使用USEARCH[22]合并雙端序列,去除barcode和引物序列。通過unoise3 去噪獲得單堿基精度ASV,基于SILVA 數據庫去除嵌合體序列。根據SIL?VA 分類器(version2.2,http://sourceforge.net/projects/rdp-classifier/)(置信閾值0.7)獲取每個ASV 對應的物種分類信息以及代表序列。設置測序深度閾值為30 000,使用vegan 包進行等量重抽樣,通過R(4.0.3)包amplicon(1.11.1)計算Shannon、Simpson 及Chao1指數。通過R 包vegan(2.5.4)計算樣本Bray-Curtis 距離以進行PCoA 分析。其余圖例均通過OmicStudio tools(https://www.omicstudio.cn/tool)以及R語言進行繪制。
291 個樣本(包括228 個糞便樣本,63 個水體、沉積物樣本)中,共發現10 247 548 條原始序列,經過序列去冗余,獲得了73 844 條獨特序列,經過unoise3 去噪及基于silva 的去嵌合,聚類生成了包括21 062 條序列的ASV 集合,平均每個樣本為412 個ASVs,最低244個ASVs,最高444個ASVs。
為了研究數據集樣本的微生物多樣性,計算了Shannon、Simpson 以及Chao1 指數,總體而言,糞便樣本多樣性指數水平均低于水體樣本。由圖1 可見,所有樣本中水體沉積物樣本具有最高的ASV 數量與物種多樣性水平,其次是巢湖水體樣本(Wilcoxon 秩和檢驗,P<0.001),而禽類糞便(包括野生水鳥、鵝與雞)具有最低的ASV數量與物種多樣性水平(Wilcoxon 秩和檢驗,P<0.01)。

圖1 樣本alpha多樣性指數(log10轉換)Figure 1 Differences in alpha diversity indices in all samples(log10 transformed)
經過物種注釋,所有樣本共注釋到31 個門(圖2),分布最廣泛的門包括變形菌門(Proteobacteria)、放線菌門(Actinobacteria)、擬桿菌門(Bacteroidetes)、厚壁菌門(Firmicutes)、疣微菌門(Verrucomicrobia),其中糞便樣本以厚壁菌門為主導(平均相對豐度為55.89%),水體樣本則以變形菌門為主導(平均相對豐度為44.13%)。除野生水鳥外,糞便樣本門水平細菌集中分布于厚壁菌門、變形菌門與擬桿菌門中,這3 個門平均相對豐度之和占總數的97%以上,而野生水鳥中除這3 種門外,還含有較高相對豐度的放線菌門(平均13.83%)。水體樣本門水平細菌更為多樣,平均相對豐度在1%以上的有13個門。

圖2 細菌群落(組平均)組成Figure 2 Composition of microbial community
在屬水平上,假單胞菌屬(Pseudomonas,19.81%)、八疊球菌屬(Sporosarcina,11.27%)與節桿菌屬(Arthrobacter,9.45%)是野生水鳥中最主要的屬,大腸埃氏菌-志賀氏菌屬(Escherichia-Shigella,29.46%)是雞糞中最主要的屬,乳桿菌屬(Lactobacil?lus,18.9%)與大腸埃氏菌-志賀氏菌屬(13.64%)在鵝糞中廣泛分布,而人糞中表現出擬桿菌屬(Bacteroi?des,18.09%)與 普 雷 沃 氏 菌 屬_9(Prevotella_9,10.74%)的顯著富集,豬糞中則以不動桿菌屬(Aci?netobacter,23.51%)為 主。hgcI_clade在 河 流 水 樣(10.23%)與廢水樣本(14.24%)中表現出明顯富集,不動桿菌屬表現出在河水中的顯著富集(10.78%),此外,河流水樣中還發現了較高豐度的CL500-29_marine_group(5.8%)與 藍 細 菌聚 球藻 屬(Syn?echococcus,6.96%)。遺憾的是,基于silva 數據庫(v123 版本)的注釋結果,本研究的河流沉積物與巢湖水樣兩組樣本中分別有71.51%與79.47%的拼接后的測試樣本未分類到屬。
基于Bray-Curtis 距離對整體數據進行了主坐標分析(圖3),將所有數據分為糞便與水體兩個組進行聚類分析。水體樣本的beta多樣性分析(圖3a)表明,豬場廢水與污水處理廠廢水樣本表現出較大的組內變異,相比之下巢湖水體樣本和沉積物樣本則呈現明顯的聚集趨勢。糞便樣本中,除去各組中少量離群樣本,被分類為同一組的樣本(野生水鳥、雞糞、鵝糞、豬糞與人糞)各自均表現出顯著聚集(圖3b),此外,野生水鳥與豬糞、鵝糞樣本表現出明顯的聚集,說明其群落組成存在一定相似性。

圖3 樣本beta多樣性差異——主坐標分析Figure 3 Principal coordinates analysis(PCoA)of the microbial community in different groups
通過將聚類得到的ASV 序列比對到自建病原數據庫,對所有樣本中潛在病原進行評估,將與數據庫的BLAST(相似度≥97%,覆蓋度>99%)比對匹配上的病原菌按屬水平聚類(圖4)。結果顯示,所有樣本中共注釋到57 個潛在病原屬,包括145 個潛在病原物種,其中13 個潛在病原屬廣泛分布于所有樣本中,以Pseudescherichia、腸球菌屬(Enterococcus)、鏈球菌屬(Streptococcus)與腸桿菌屬(Enterobacter)為代表(表1)。在所有樣本中,鵝糞、豬場廢水與巢湖水樣本潛在病原總平均相對豐度最高,分別為0.051%、0.016%與0.011%。從潛在病原數量上來看,含潛在病原屬數量最多的為野生水鳥、廢水與人糞(分別為48、47、46個屬),值得注意的是,豬場廢水獨有3種潛在病原屬,分別為Alloprevotella、福賽坦氏菌(Tannerella)與密螺旋體屬(Treponema),而人糞獨有一個潛在病原屬,即薩特菌屬(Sutterella)。

表1 所有樣本共有的潛在病原的平均相對豐度(按屬聚類)Table 1 Average relative abundance of potential pathogens common to all samples(clustered at the genus level)

圖4 潛在病原在樣本間的分布(平均相對豐度)Figure 4 Distribution of potential pathogens among all samples(mean relative abundance)
將不同類型水體或沉積物設為Sink,構建的FTL文庫樣本作為Source,來判別水體/沉積物樣本潛在的污染來源。對于FEAST 以及SourceTracker 兩個溯源軟件,分別進行5 次獨立運行以計算溯源結果的RSD。兩個溯源軟件對于河流水體污染來源的判定結果較為一致(圖5)。

圖5 基于NGS數據集的微生物溯源分析Figure 5 Microbial source tracking analysis based on NGS dataset
就兩個軟件預測結果的穩定性(RSD)來看(圖6),FEAST的運算結果表現出比SourceTracker更低的RSD 值,其樣本平均RDS 值多分布于0.25 及0.50 左右,而SourceTracker 預測值的RSD 計算結果分布在1.0及以上的偏多。

圖6 溯源軟件5個獨立運行結果的相對標準偏差Figure 6 Relative standard deviation generated in 5 independent runs of the traceability software
FEAST的預測結果表明,沉積物樣本的污染來源主要可被劃分為豬場廢水出水、豬場原始廢水以及白頭鶴糞便,而相較FEAST 而言,SourceTracker 對于樣本污染貢獻程度的判定更趨于保守。但綜合二者的結果來看,FEAST與SourceTracker溯源軟件對于河流水體污染來源的判定結果一致性較高,均將主要的潛在污染來源歸類為村莊排污口以及污水處理廠排污口樣本,FTL 文庫中小白額雁、人類以及雞糞幾乎在所有樣本中都不能預測出。對巢湖水污染的預測結果中,兩個溯源軟件都判定豬場廢水出水是主要的污染來源。
研究表明,畜禽腸道定殖的微生物主要有厚壁菌
門(Firmicutes)、擬桿菌門(Bacteroidetes)、變形菌門(Proteobacteria)和放線菌門(Actinobacteria)等,厚壁菌及其家族成員在畜禽糞便樣品中具有較高的相對豐度。在所有樣本中,水體沉積物樣本具有最高的ASV數量與物種多樣性水平,而禽類糞便樣本具有最低的ASV 數量與物種多樣性水平。沉積物作為一個營養豐富的棲息地,為微生物的生長提供了良好條件[31],例如微藻、浮游植物、硅藻、細菌、浮游動物以促進、競爭或共生的方式生活在沉積物上,使水體沉積物發展出豐富的生物多樣性[32]。而糞便微生物憑借共生關系存活于宿主腸道,其群落組成受到微生物間互作及宿主的免疫反應等因素影響,并且動物腸道是一個高度厭氧的環境,對糞便微生物群落施加了特定的選擇壓力,導致糞便微生物群落多樣性低于自然水生環境。
在不同類型的水樣本中,細菌群落的多樣性存在顯著差異,巢湖水樣的菌群豐度明顯高于其他水樣,這表明與人類活動相關的較高濃度的有機和無機物可能會降低河流水生細菌群落的物種豐富度,這一結果與之前的研究結果一致[33]。對于研究采集的具有農業和生活污染背景的河流水樣而言,物種豐富度和均勻度的降低可能是由于某些物種的高度富集,這些物種很好地適應了有機或無機廢水中的特定條件,并且能夠通過使用各種營養物質來抵抗或承受環境波動[34]。值得注意的是,有相關研究表明,水體中的糞便污染情況可能會受到季節的影響,不同季節水體中主要的污染源可能會有所差異[35-36]。此外,在對水體樣本進行beta多樣性差異(主坐標分析)分析時發現,豬場廢水與污水處理廠廢水樣本表現出較大的組內變異,這可能是由于“豬場廢水”與“污水”組同時包含了原始廢水與處理后廢水,而處理過程對細菌群落產生了較大影響,因此導致上述差異。對巢湖水的污染預測結果中,兩個溯源軟件都判定豬場廢水出水是主要的污染來源,但FEAST 預測豬場原始廢水貢獻了平均2.19%的污染,而在SourceTracker 中僅為0.4%。值得注意的是,CL3樣本呈現出與其他巢湖水樣不一致的污染預測結果,兩個溯源軟件均預測其有(23.0±0.5)%的污染來自白頭鶴,Zhang等[19]對該采樣點的分析指出,該點與其他湖水樣本存在明顯差異,其含有較高豐度的厚壁菌門(24.13%),而該菌門在其他湖水樣本中幾乎沒有檢出。兩個溯源軟件一致預測存在高水平白頭鶴糞便污染的樣本還有CR4(SourceTrack?er-5.61%與FEAST-9.59%),該樣本同樣含有較高的厚壁菌門細菌(47.77%),高豐度厚壁菌門細菌的存在或許是該預測結果的主要驅動因素。另外,FEAST的預測結果表明,APR與ADPR背景的河流普遍存在潛在的豬糞污染,污染水平從0.205%(CR3)到4.220%(CR8)。值得注意的是,由于本研究所選污水樣本的群落組成在一定程度上可能與糞便樣本產生交叉,因此溯源軟件對村莊污水處理站以及豬場污水樣本較高污染貢獻度的預測可能存在一定的誤差,存在一定的假陽性率。
對于FEAST 以及SourceTracker 兩個溯源軟件來說,總體上看,兩個基于細菌群落MST 的溯源軟件對于巢湖水體以及河流沉積物的預測結果存在較大差異,相較FEAST 而言,SourceTracker 對于FTL 樣本污染貢獻程度的判定更趨于保守。在FEAST 的預測結果中,沉積物樣本的污染來源主要被劃分為豬場廢水出水、白頭鶴糞便以及豬場原始廢水,以FR組樣本為例,FEAST 預測其污染源平均有18.50%來自豬場廢水、8.98%來自白頭鶴、4.65%來自豬場原始廢水,而SourceTracker 對于FR 組的預測則僅有5.27%來自豬場廢水出水、0.49%來自白頭鶴、0.81%來自豬場原始廢水。在HR 以及XR 組中,FEAST 預測存在3.98%~10.30%的豬場廢水出水、3.67%~5.39%的白頭鶴以及1.69%~5.40%的豬場原始廢水污染,而在Source?Tracker 的預測結果中,該比例分別降至0.04%~1.54%、0.08%~0.24%與0.18%~0.70%。
綜上所述,盡管基于NGS 的MST 具有眾多優勢,但其在研究設計方面仍然存在較高要求,后續研究中,存在更少ASV 交叉、地理聯系更加緊密的FTL 文庫或許能使溯源預測結果更加精準。
(1)不同生境樣本中,微生物多樣性存在明顯差異。水樣本的微生物群落多樣性普遍高于人類及動物糞便樣本,其中水體沉積物與湖泊水體樣本微生物多樣性最豐富。樣本/宿主類型是主導細菌群落差異的主要因素,水生環境樣本中河流沉積物與污水處理廠細菌群落存在一定相似性,糞便樣本中豬糞、野生水鳥與鵝糞存在一定相似性。
(2)變形菌門、放線菌門、擬桿菌門與厚壁菌門在糞便與水體樣本中廣泛存在,但其相對豐度存在差異。糞便樣本以厚壁菌門(平均相對豐度為55.89%)為主,水體樣本則以變形菌門(平均相對豐度為44.13%)為主。與本地病原數據庫的比對結果顯示,以Pseudescherichia、腸球菌屬、鏈球菌屬與腸桿菌屬為代表的13 種潛在病原在水生環境與糞便樣本中廣泛分布,這些跨生境樣本出現的潛在病原建議在后續研究與監測中給予重點關注。
(3)溯源分析結果表明,河水樣本最主要的污染來源是村莊排污口與污水處理廠排污口樣本;沉積物與湖水樣本則預測出存在豬場排污水與野生水鳥糞便的污染;所有樣本未檢測到來自人糞與雞糞的污染。
(4)以自然水體及河流沉積物作為目標樣本,溯源軟件SourceTracker與FEAST對廣泛污染源(包括野生水鳥、家畜、家禽糞便以及生活與養殖業污水)的潛在污染貢獻度的預測結果總體相似,但相對同一污染源而言,SourceTracker 對污染貢獻比例的判定偏低。總體來看,FEAST的預測結果比SourceTracker擁有更低的RSD值,因此,FEAST模型對潛在污染源的預測結果更具可信度。在實際調研中,推薦結合NGS與傳統污染評估方法,以準確探明污染來源,指導水質管理。