吳泳江,蔡明成,孫翰昌*,胡慧蝶,3,鄧雅心,3,龍應根,3
(1.重慶文理學院園林與生命科學學院,重慶402160;2.重慶文理學院生態漁業產業化技術創新中心,重慶 402160;3.重慶三峽學院生物與食品工程學院,重慶 404100)
浮游植物是水生生態系統的初級生產者,其生產力占地球總生產力的一半以上[1]。浮游動物是浮游植物的主要消費者,是連通初級生產者與高營養級動物的關鍵營養紐帶[2]。浮游動植物種類豐富、數量龐大、個體微小、分布廣泛,導致基于傳統形態學鑒定方法難以準確區分其種類,主要有以下原因:1)對鑒定人員形態學分類知識要求較高,基于主觀形態判斷難以標準化,且費時、費力;2)浮游動植物的生命周期短,生命周期內形態變化大;3)浮游動植物種間形態特征的趨同進化,導致形態學差異不明顯;4)浮游動植物的形態表型存在可塑性,形態區分不精確。而最新的環境DNA(Environmental DNA,eDNA)宏條形碼技術針對上述難題提供了一套嶄新的解決方案,其無需分離生物個體,僅需提取浮游動植物遺留在水體環境中的DNA,基于特定的條形碼基因設計通用引物完成PCR擴增,然后通過高通量測序和數據庫序列比對,進行物種注釋,最終實現物種多樣性評估[3]。因此,本文重點圍繞eDNA宏條形碼技術在浮游動植物多樣性研究中的應用進行綜述,旨在為eDNA宏條形碼技術的發展提供理論基礎資料。
eDNA是指生物體遺留在環境中的DNA的總和,可直接從環境樣品(水體、空氣、土壤等)中提取獲得,不具備任何明顯的生物源[4]。水環境中的DNA,包括生物體經由糞便、皮膚、黏液等路徑釋放到水體中的DNA,主要為線粒體DNA和核DNA[5],其中利用線粒體DNA分析水生生物多樣性的研究[6-7]較多。eDNA在所處環境中會經歷衰變、濃度下降、直至無法再被檢測的過程[8]。DNA條形碼技術由Hebert P D N等[9]于2003年首次提出,是利用不同物種在特定基因序列(條形碼)上存在的差異來開展物種鑒別的技術。隨著高通量測序技術的快速發展,為能夠一次性檢測宏量的基因序列并且可高效檢測生物多樣性,eDNA宏條形碼技術應運而生,相較于DNA條形碼技術,其優勢體現在“宏”字上、以eDNA為基本檢測單位[10]。
eDNA宏條形碼技術首先要采集和提取eDNA,根據檢測目的選擇合適的條形碼基因來設計通用引物,再利用引物對eDNA進行PCR擴增和高通量測序;其次拼接和合并測序獲得的雙端測序序列,并過濾掉低質量、嵌合體以及小于150 bp的噪音序列,之后通常根據97%的相似度閾值將序列聚類成可操作分類單元(Operational taxonomic units,OTUs),再進行比對;最后通過生物信息學分析完成物種注釋,達到物種鑒定的目的[11]。eDNA宏條形碼技術研究浮游動植物具備以下優勢:1)無需采集生物樣本,對環境破壞少;2)不受物種性別和生理發育階段的影響;3)能準確區分形態相似和表型可塑性高的物種;4)有統一的條形碼數據庫,鑒定標準統一,避免受鑒定人員主觀經驗的影響[2,12]。
eDNA宏條形碼技術研究浮游生物多樣性,其采樣的關鍵是盡可能多的采集浮游生物的eDNA。水體中eDNA的分布易受季節、自然環境、人類活動等因素的影響,因此需要依據水體環境特征,使用具有針對性的采樣方案。1)溪流、湍急的河水和江水屬于流動水體,eDNA混合較為均勻,其采樣只需采集表層水[13],通常以主觀確定的距離間隔從河岸和沿著水道取樣,并在一個采樣點采集多個樣品。隨著水體自上游向下游流動,河口處造就了豐富的物種,因此在河口處采樣可以較為全面地整合河流網絡的生物多樣性信息[14]。2)湖泊、水庫、池塘等靜止水體,通常采集沿岸表層水即可[15]。但對于大型湖泊,還需進行精細尺度的eDNA采樣或深水區采樣。3)浮游動植物是海洋食物網的基礎[16],但海水中的eDNA較為破碎,且降解比例較高,因而有必要綜合采用基于濾網富集樣品和水樣的eDNA宏條形碼技術[2]。僅僅在海岸線或近海海域采樣,導致采樣空間覆蓋高度較低,生成的物種列表不全,因此需要采用覆蓋所調查區域的網格抽樣設計方法[17]。而且海洋的垂直空間很大,海水深度對浮游動植物的eDNA組成也有很大的影響,采樣時最好覆蓋全深度范圍的eDNA樣本。通常情況下每個采樣點采集水樣1~2 L,如果浮游生物分布范圍廣或豐度低,則需要加大取樣范圍和取水量[18-19]。為降低實驗誤差和提高目標物種檢出率,通常要設置至少3個重復。
水樣采集后還需要從中收集eDNA,主要采用過濾法、離心法、沉淀法。過濾法指使用抽濾裝置和濾膜對水樣進行抽濾,使eDNA富集在濾膜上;離心法指使用離心機對水樣做離心處理,使eDNA沉降在離心管底部;沉淀法指使用無水乙醇和乙酸鈉對水樣中的eDNA進行聚集沉淀。使用過濾法可獲得最高濃度的eDNA,其次是離心法,最低的是沉淀法[20-21]。此外,可將過濾法、離心法和沉淀法相結合,獲得更為豐富的eDNA。為減少污染和降解,可將收集到的eDNA置于95%乙醇中,放入-20 ℃冰箱中保存,并及時完成擴增和宏條形碼測序。在eDNA樣品采集過程中,要盡量避免采樣環境污染而造成的假陽性結果的出現,因而建議使用10%漂白劑清洗采樣器械并消毒,采樣過程中操作人員要戴好手套和口罩,并設置陰性對照(空白對照),實時監控污染狀況;盡量使用無人機械技術進行采樣操作,避免人為采樣造成的交叉污染。
浮游植物處于水體食物鏈的最底端,作為浮游動物和部分水體動物的食物[22-23],是水生生態系統能量傳遞以及物質流動的基礎[24-26],具有細胞結構簡單、生長周期短、個體微小等典型特點[27-28],因而其種群結構和豐度能敏銳地反映水域生態環境變化情況[29-31]。eDNA宏條形碼技術在浮游植物多樣性研究中的應用關鍵在于選擇合適的條形碼基因,再針對選定的條形碼設計通用引物,完成擴增和測序。目前使用較為廣泛的是單基因條形碼,其來源于核糖體基因、線粒體基因或葉綠體基因。核糖體基因組主要為內轉錄間隔區(Internal transcribed space,ITS)、18S rRNA、16S rRNA;線粒體基因組主要為細胞色素C氧化酶Ⅰ(Cytochrome oxidase Ⅰ,COⅠ)、細胞色素C氧化酶Ⅲ(Cytochrome oxidase Ⅲ,CO Ⅲ);葉綠體基因組主要為matK、rbcL、atpB;其他條形碼基因包括rpoB、trnL、tufA、rpoC1等。張麗娟等[32]、張莉等[33]、劉衛東等[34]、王晨等[35]在使用eDNA宏條形碼技術研究我國海洋、江河、湖泊中的浮游植物多樣性時均使用的是18S rRNA基因。這是因為該基因的物種覆蓋率較高且條形碼數據庫較為完善,從而被優先用于浮游植物多樣性研究。18S rRNA基因又分為V4可變區和V9可變區,它們均被廣泛用作目標基因而完成引物設計[32-35]。基于18S rRNA條形碼基因設計的通用引物在利用eDNA宏條形碼研究浮游植物多樣性中的應用示例見表1。為了提高單基因條形碼的分辨率,也可將幾種條形碼基因聯合使用,例如多基因條形碼rpoC1+rpoB+matK,但與單基因條形碼相比,其分析更為復雜。此外,還有超級條形碼和特定條形碼,這些在浮游植物多樣性研究中均具有巨大的潛力[1]。利用eDNA宏條形碼技術研究浮游植物多樣性的報道較多,張麗娟等[32]評估了eDNA宏條形碼監測真核浮游藻類結果的精確性,發現eDNA宏條形碼技術能準確監測到滇池和撫仙湖的真核藻類多樣性;Malviya S等[40]和王靖淇等[37]采用eDNA宏條形碼技術獲得的浮游藻類類群數量要遠遠高于顯微鏡觀測,且發現了很多新物種;郭婷等[41]基于eDNA宏條形碼技術快速監測出鄱陽湖中的浮游植物豐富度、均勻度及其空間分布,有效評估了鄱陽湖的生態系統健康狀況。eDNA技術具有簡便、高效、準確等優勢,在浮游植物研究和多樣性監測中被廣泛應用。

表1 基于18S rRNA條形碼基因設計的通用引物在利用eDNA宏條形碼研究浮游植物多樣性中的應用示例Tab.1 Application examples of universal primer based on 18S rRNA barcode gene in eDNA metabarcoding for monitoring phytoplankton diversity
浮游動物以浮游植物為食,是連通水體中的初級生產者(浮游植物)和高營養級動物(魚、蝦、鳥等)的關鍵營養樞紐[2,42-43],具有個體微小、生活史短、代謝旺盛、種類繁多、數量龐大、分布范圍廣等特點,因而對水體環境變化的響應同樣十分敏感[44-47],其種群結構和數量是衡量水體生態健康狀況重要的依據[48-51]。利用eDNA宏條形碼研究浮游動物與研究浮游植物相似,關鍵之處都在于選擇合適的條形碼基因,據此設計最佳的PCR擴增通用引物。與研究浮游植物相同,利用eDNA宏條形碼研究浮游動物也使用核糖體基因中的ITS、18S rRNA、16S rRNA[2,52-53],以及線粒體基因中的COⅠ[54-55]。18S rRNA中的V9可變區比較適用于高通量測序平臺,可覆蓋更多的浮游動物類群,但對物種的分辨率較低,在種水平上較難區分物種[2]。COⅠ的進化率要高于18S rRNA,在物種水平上的分辨率較高,但對更高分類層級的分辨率較低[56]。高旭等[53]比較了18S rRNA-V9、COⅠ、16S rRNA條形碼基因的通用引物在利用DNA研究浮游動物多樣性中的差異,發現COⅠ條形碼的引物更適用,這是因為其檢測的物種特異性、物種覆蓋度和物種識別敏感性均適中,且檢出的浮游動物種群數量高于18S rRNA-V9引物和16S rRNA引物?;?8S rRNA和COⅠ條形碼基因設計的通用引物在利用eDNA宏條形碼研究浮游動物多樣性中的應用示例見表2。孫晶瑩等[57]研究表明,基于eDNA宏條形碼技術可有效實現對浮游動物的半定量檢測,在浮游生物多樣性的研究和監測以及生物完整性評估中具有較大的實際應用價值。唐晟凱等[61]利用eDNA技術研究邵伯湖浮游動物物種,發現該技術適用于淺水湖泊浮游動物群落的監測,且其結合傳統形態學觀察的檢出效果最佳。馮蕓芝等[2]對eDNA宏條形碼技術在海洋浮游動物多樣性和生態學研究中的應用作了總結,發現該技術能夠快速、準確、經濟地分析大規模環境樣本,并在海洋浮游動物生態學研究中得到了越來越廣泛的應用。總之,利用eDNA宏條形碼技術可快速而準確地反映浮游動物類群的多樣性、分布特征、數量變化等。
目前利用eDNA宏條形碼技術研究浮游動植物多樣性主要用到的數據庫為生命條形碼數據庫(Barcode of life data systems,BOLD,http://www.boldsystems.org/index.php)和NCBI中的GeneBank數據庫(https://www.ncbi.nlm.nih.gov/genbank/),二者均為開放數據庫。截止2023年3月31日,BOLD數據庫已收集到640 578種物種的條形碼序列;錄入至BOLD數據庫的條形碼需經過嚴格質量篩查和公示,也必須具備物種名稱、憑證數據(存儲機構和目錄信息)、采集記錄、標本標識符、序列大于500 bp、引物信息以及原始序列數據文件。GeneBank數據庫已更新至2023年2月,其種的數據量比BOLD大,包括241 830 635條序列;錄入至GeneBank中的序列也要進行基本的質量檢查,但與BOLD相比,不存儲序列色譜圖、采集元數據或物種照片[62]。BOLD是一種具備存儲功能的條形碼管理工具,而GeneBank主要完成數據存儲,這兩個庫中的很多數據是重合的,BOLD中的序列會自動傳遞到GeneBank,BOLD又從GeneBank中周期性挖掘條形碼數據[63]。對測序獲得的eDNA序列,需要使用比對工具檢索比對到相應的數據庫,使用BOLD-ID工具將測序獲得的eDNA序列比對到BOLD數據庫,可查詢出與序列最匹配的物種名稱、分類單元以及相近物種等;使用NCBI-BLAST工具將測序獲得的eDNA序列比對到GeneBank數據庫,可查詢到與參考序列的相似度并打分,實現物種鑒定。除以上2個主要的數據庫外,很多國家都建有本國的DNA條形碼數據庫,例如中國科學院建立的中國生命條形碼信息管理系統和近海海洋DNA條形碼資源庫[64]、韓國生命條形碼數據庫[65]、澳大利亞淡水大型無脊椎動物的DNA條形碼數據庫[66]、中國淡水大型底棲無脊椎動物條形碼數據庫[67]等。研究者將eDNA測序后得到的序列比對到這些開放或者自有數據庫,查詢比對率,進而確定物種類型。構建高質量、高準確度的參考數據庫是eDNA 宏條形碼技術的關鍵,將測序獲得的數據比對到目標序列,如果數據庫出現錯誤或缺失,就會嚴重影響研究結果的準確性。因此,構建一個具備世界共識的高質量、高準確度數據庫是一項規模龐大且艱巨的任務,需要在研究過程中不斷更新完善DNA條形碼數據庫,以提高其精確度和可信程度。

表2 基于18S rRNA和COⅠ條形碼基因設計的通用引物在利用eDNA宏條形碼研究浮游動物多樣性中的應用示例Tab.2 Application examples of universal primer based on 18S rRNA and COⅠbarcode genes in eDNA metabarcoding for monitoring zooplankton diversity
傳統浮游動植物的形態鑒定容易受鑒定人員的專業水平的影響,而eDNA宏條形碼作為一種經濟實惠的基因鑒別技術,具備便捷可靠、靈活實用、信息量大等優點,能快捷有序地應用于浮游動植物的鑒定與分類管理。目前eDNA宏條形碼技術的應用主要通過研究浮游動植物多樣性,以進一步評估水生生態系統物種多樣性和健康狀況。eDNA宏條形碼技術主要包括eDNA樣品采集、DNA提取、PCR擴增、高通量測序、序列對比與物種注釋等,其準確性從樣品采集開始便受影響,要根據不同的水體環境選擇合適的采樣方法,并在采樣的過程中注意樣品的代表性、避免樣品被污染的情況發生。利用eDNA宏條形碼技術研究浮游植物多樣性通常使用18S rRNA條形碼基因,而研究浮游動物多樣性通常使用COⅠ條形碼基因,但二者均根據目標基因設計通用引物完成PCR擴增。高質量、高準確度的參考數據庫是eDNA 宏條形碼技術研究應用的關鍵,需要在研究過程中不斷完善數據庫,使其具有更高的準確度且覆蓋更為廣泛的多基因片段,實現浮游動植物種群結構和數量的精準量化。