邢迎春 高婉茹 白 潔 趙亞輝
(1. 上海海洋大學水產與生命學院, 上海 201306; 2. 中國水產科學研究院資源與環境研究中心, 北京 100141; 3. 中國科學院動物研究所動物進化與系統學重點實驗室, 北京 100101)
中國湖泊數量眾多, 是陸地水生態系統的重要組成部分, 具有重要的文化、經濟和生態價值[1]。中國擁有1 km2以上的自然湖泊2693個, 總面積超過81414.6 km2, 占我國陸地總面積的0.9%[2]。最近30年, 隨著我國工農業發展和人類活動的頻繁影響,湖泊退化現象嚴重, 我國東部湖區面積下降了8.2%[3]。湖泊生物多樣性水平也隨之下降, 物種組成變動較大[4—7]。通常對于湖泊生物多樣性的研究多采用傳統分類學調查方法, 對采集獲得的生物樣品進行形態學鑒定, 確定物種分類地位。這樣的調查方法雖然已很成熟, 但還是會出現由于采樣工具和地理環境限制, 一些珍稀瀕?;螂[秘物種很難被采集到的問題; 而且利用形態學進行物種鑒定更依賴于科研人員的分類學經驗和水平。
環境DNA(Environmental DNA, eDNA)是指從土壤、水、冰川或沉積物等環境樣品中提取的DNA, 可揭示過去和現今生物多樣性信息[8]。這一方法被用于生物多樣性監測, 與傳統調查方法相比,具有更高的檢出率, 特別是對傳統調查中很難發現的隱秘物種; 在調查區域范圍較大的情況下, 獲得eDNA更加簡便和經濟; 利用eDNA監測湖泊生物多樣性, 可避免對珍稀瀕危物種的傷害和對自然環境的干擾; 隨著第二代測序技術的發展, 開展eDNA研究的成本也大大降低[9—14]。湖泊環境相對于河流,流速更緩, DNA富集量更高, 因此eDNA在湖泊生物多樣性研究方面具有更廣闊的應用前景。
與其他類型水體相比, eDNA技術在湖泊上的應用較早, 于20世紀90年代末就被應用到湖泊生物多樣性的研究, 是近20多年來該領域發展起來的新方法、新技術, 科研人員也在應用過程中對實驗方案進行不斷改進, 對研究結果的準確性和方法的有效性進行不斷探討, 逐步摸索和形成更加成熟的技術方案。
eDNA技術的研究對象廣泛, 從細菌、真核微生物、低等動植物到高等動植物, 最初在湖泊中應用是開展細菌類群的研究, 如Brinkhoff等[15]通過設計Thiomicrospira屬細菌的16S rRNA特異性引物,采集希臘西奈半島太陽湖的沉積物和水樣品及德國達克斯坦淡水池塘、德國阿爾滕鹽泉和智利康塞普西奧陸架環境的沉積物, 提取eDNA分析了該屬物種間的系統發生關系。通過開發適用于高等生物類群檢測的特異性和通用引物, eDNA逐步應用到研究植物和動物等高等生物方面。Thomsen等[16]從歐洲湖泊、池塘和溪流中檢測到兩棲動物和魚類的DNA, 表明eDNA可作為珍稀和瀕危物種的監測手段; Parducci等[17]比較了花粉方法和eDNA元條形碼技術, 分析了采自位于斯堪的納維亞地區中部挪威和瑞典邊界的斯坎德山脈兩側, 倫特約納湖和克洛克湖中全新世植物組成, eDNA結果為傳統的利用花粉開展分析提供了補充; Bista等[18]通過eDNA分析獲得170個屬于動物界的分類單元, 其中91個為節肢動物(42個屬于昆蟲綱); Zhang等[19]利用eDNA分析獲得北京未名湖、昆明湖和官廳水庫中30、35和41種魚類。
從樣品類型角度分析, 研究湖泊生物多樣性的eDNA樣品多為沉積物和水。早期研究多集中在對湖泊沉積物中提取的古DNA, 利用其研究湖泊歷史和生物多樣性的演化。Matisoo-Smith等[20]從新西蘭霍克灣圓湖(Round Lake, Hawke’s Bay)未被擾動的沉積物內核中, 在陶波火山層(AD 217—247)上的沉積物中檢測到了細菌DNA, 其與人類腸道和糞便細菌高度相似; 同時也檢測到了只在新西蘭分布的大鮈塘鱧(Gobiomorphus cotidianus)的DNA, 這些研究結果充分展示了eDNA作為一項革命性技術對于第四紀研究的重要性; Anderson-Carpenter等[21]從采自全新世北美五大湖西部地區的7個小型湖泊沉積物中提取的126個古DNA樣品中成功獲得64個樣品的測序數據, 建立了相關實驗方法和DNA文庫的構建方法; Parducci等[17]從格陵蘭南部湖泊沉積物中提取eDNA, 結合基于12個放射碳建立的年代模式分析, 該湖泊生物記錄可追溯到距今10650年;Giguet-Covex等[22]從法國阿爾卑斯山區安特恩湖沉積物中提取eDNA, 提供了新石器時代以來該地區植被和畜牧業歷史, 提出了人為因素對景觀尺度變化影響的新前景。
通過湖泊水體提取的eDNA對于了解湖泊現今水生生物多樣性則更為重要。隨著高通量測序技術(High-throughput sequencing, HTS)的廣泛應用,利用eDNA作為傳統調查的補充或替代方法開展生物多樣性研究成為更經濟和有效的方式, 且這一趨勢在2015年后變得更加明顯。比較具代表性的研究包括: Thomsen等[16]在歐洲范圍內的池塘、湖泊和溪流采集了98個樣點的水樣品, 開展了一系列eDNA實驗, 結果表明eDNA獲得結果與實際的物種記錄情況基本一致, 所有兩棲動物和魚類的DNA都可被檢測到, 該方法可作為珍稀和瀕危物種的監測手段。Bista等[18]從英國Llyn Padarn湖采集葡萄球菌和水樣品, 選擇COI基因中的2個長度不同的片段開展eDNA研究, 分析獲得170個屬于動物界的分類單元, 其中91個為節肢動物(42個屬于昆蟲綱); 結果還揭示了eDNA的時間動態變化, 驗證了eDNA宏條形碼在追蹤生態系統季節性多樣性方面的實用性。Goutte等[23]利用eDNA對法國巴黎馬恩河和塞恩河魚類多樣性和豐富度進行了分析, 結果表明與每年度電魚監測相比, eDNA宏條形碼技術是更好的監測手段; eDNA對于物種的監測比3—6年內開展的電魚監測更有效, 但與14年長期電魚監測結果相似或略有差距。近年來中國學者開始應用eDNA技術, 對湖泊魚類多樣性開展研究。Qu等[24]采集江西鄱陽湖和湖北天鵝洲自然保護區的水樣品, 使用16S rRNA魚類通用引物進行PCR擴增, 通過高通量測序和數據分析, 共鑒定出75種魚類, 創建了一種調查長江流域魚類多樣性的新方法。舒璐等[25]首次應用eDNA宏條形碼技術評估洱海魚類多樣性及空間分布, 通過使用魚類通用引物MiFish-U進行擴增, 共檢測出17種魚類, 其中包括5個土著種和12個外來物種。Zhang等[19]選擇北京未名湖、昆明湖和官廳水庫作為小型、中型和大型湖泊的代表, 采集了水樣品提取eDNA, 利用12S rRNA片段確定魚類物種組成分別為30、35和41種, 并分析了魚類空間分布與其生活的典型棲息地具有相關性。
eDNA技術可應用于對湖泊中特定物種或多個生物類群的檢測。對特定物種進行檢測的典型案例就是在北美五大湖流域和小型湖泊關于入侵物種亞洲鯉的研究, Mahon等[26]利用eDNA檢測五大湖地區入侵物種鰱(Hypophthalmichthys molitrix)和鳙(Hypophthalmichthys nobilis), 分別于2000年在伊利湖桑達斯基灣和2010年在距離卡盧梅特湖4和6 km的位置檢測到鳙。Eichmiller等[27]監測位于密西西比河上游流域小型湖泊Lake Staring中的入侵鯉(Cyprinus carpio), 檢測概率為75%, 且在物種活動區域幾十米以外也能通過eDNA的方法進行監測。近年來eDNA更多地被應用在對湖泊中多個生物類群的研究, 對生物多樣性進行分析。
eDNA研究湖泊生物多樣性的主要步驟包括樣品的采集和保存、eDNA提取、PCR擴增、測序、數據處理及分析等, 關鍵實驗步驟如圖 1所示。

圖 1 利用eDNA研究湖泊生物多樣性的關鍵實驗步驟Fig. 1 Key experimental steps for detecting lake biodiversity based on eDNA
在利用eDNA研究湖泊生物多樣性時, 如何選擇合適的樣品采集量、采集方法和保存方式, 是保證樣品質量的3個重要方面。采集湖泊水樣品提取eDNA時, 每個樣品采集量不等, 且通常需要至少采集3個重復。Thomsen等[16]通過在丹麥的湖泊、池塘和溪流中采集水樣品, 檢測到兩棲類、魚類、哺乳類、昆蟲和甲殼類中的瀕危物種DNA, 研究采用的采樣方法是每個水樣品采集15 mL, 并進行3次重復采樣。Agersnap等[28]利用eDNA對丹麥、挪威和芬蘭3個湖泊中的螯蝦屬(Astacus)四個分類單元(Astacus astacus,Pacifastacus leniusculu,Astacus leptodactylusclade I and III)進行了監測, 實驗過程中采集的每個水樣品量在500—1000 mL。Fujii等[29]從日本北海道31個回水湖泊記錄有魚類分布的水面各采集1000 mL水樣品, 進行eDNA實驗, 并將測序結果與傳統采樣方法獲得的結果進行了比較,eDNA檢出率超過50%。Muha等[30]比較了過濾15、100、250、1000和2000 mL水樣品獲得的eDNA產量, 利用12S rRNA短片段進行聚合酶鏈式反應(Polymerase Chain Reaction, PCR)和實時熒光定量PCR(Quantitative Real-time PCR, qPCR)擴增,結果顯示2000 mL水樣品獲得的eDNA產量最多, 且相較于100和250 mL樣品的qPCR擴增效率最高, 因此研究建議根據環境中顆粒物的尺寸來確定過濾膜孔徑大小和可行的過濾水量, 盡可能多的采集水樣品進行eDNA實驗。為減少采樣時的污染, 采樣一定要佩戴口罩和手套, 并在采樣前用10%漂白劑清潔所有用品和實驗場地, 采樣時用純凈水做陰性對照, 以監測是否存在污染[16,29]。
目前采集eDNA主要有3種方法: 過濾法、沉淀法和離心法。過濾法通過將樣品進行抽濾, 使eDNA截留在濾膜上, 從而對樣品中的eDNA進行濃縮和收集[31—34]; 沉淀法通過在樣品中加入一定比例乙酸鈉(CH3COONa)和無水乙醇(C2H5OH), 使eDNA發生聚集沉淀[16,35]; 離心法通過使用離心機將一定體積的樣品進行離心處理, 使eDNA發生沉降, 從而達到濃縮和收集eDNA的目的[36]。Deiner等[37]利用過濾法和沉淀法從河流和湖泊中采集水樣品, 比較后表明利用過濾法可獲得更多的eDNA。Eichmiller等[27]比較了3種采樣方法獲得的魚類DNA產量, 結果表明利用過濾法可獲得更高的魚類DNA產量, 其次是離心法, 沉淀法獲得的魚類DNA產量最低。雖然相關研究表明, 過濾的水量越多, 能獲得的eDNA產量越高, 可檢測出的物種多樣性越高[30]。但如果水中的懸浮物或雜質過多, 很容易阻塞小孔徑的濾膜, 科研人員嘗試通過預過濾或增加濾膜數量的方法來解決這一問題。Ma等[38]在利用eDNA開展長江江豚種群監測實驗過程中, 為防止水中懸浮物堵塞過濾孔, 先用滅菌過的醫用紗布對水樣品進行預過濾, 以保證足夠的過濾水量。Hunter等[39]比較了用一張濾膜過濾200 mL水量獲得的目標片段拷貝數, 和用4張濾膜過濾800 mL水量后合并提取DNA獲得的目標片段拷貝數, 過濾過程中最大限度的避免了沉積物阻塞過濾孔, 結果表明用4張濾膜所得目標片段的拷貝數是用單一濾膜所得拷貝數的4.4倍, 表明在避免了過濾孔阻塞的情況下, 可獲得更多的目標片段, 且分多張濾膜對同一體量的水樣品進行過濾, 獲得的過濾效果更好。
最近的eDNA研究更傾向于通過采集水樣品,對湖泊中的生物多樣性進行監測, 往往采集大量水樣品進行過濾, 分析得到的物種種類更為精確, 采集量最多的已達到45 L水量, 以獲得更多eDNA[40]。濾膜的孔徑和材質會對過濾時間和eDNA濃度有一定影響, 目前的研究多采用玻璃纖維素濾膜(GF)、混合纖維素濾膜(MCE)、硝酸纖維素濾膜(NC)、尼龍濾膜(NL)、聚碳酸酯濾膜(CF)或聚醚砜濾膜(PES), 孔徑在0.2—8.0 μm。Eichmiller等[27]比較了用1.5 μm GF和0.2、0.6、1.0及5.0 μm CF在過濾水樣品后獲得的魚類DNA產量, 結果表明使用1.5 μm CF能獲得最多的DNA產量。Li等[41]比較了利用不同孔徑的固體封閉式GF研究池塘中魚類種群結構的有效性和準確性, 結果表明0.45 μm GF表現最佳,可獲得更多的eDNA產量; 但與0.8 μm GF相比, 需要更長的過濾時間; 而0.8 μm GF更適用于過濾渾濁、富營養化和魚類密度高的水體。
選擇適當的環境樣品保存方式有助于減慢eDNA的降解速度, 提高eDNA提取效率, 獲得更理想的實驗結果。Renshaw等[42]研究了在eDNA采樣和運輸過程中不具備冷藏或冷凍條件, 可以使用哪些試劑進行樣品保存, 結果表明用十六烷基三甲基溴化銨(CTAB)和Longmire’s兩種裂解緩沖液在室溫(20℃)可以保存eDNA兩周以上。Hinlo等[43]比較研究了過濾后將濾膜放入100%酒精保存在室溫環境和未加酒精保存在-20℃的eDNA保存效果, 提出與其他保存方式相比, 優先使用95%酒精保存的結論,這可以解決在野外用冰塊很難將樣品進行快速冷凍, 及使用CTAB或Longmire’s試劑不能成功保存DNA的問題, 且酒精的成本較低。Majaneva等[44]從湖泊和河流生態系統采集eDNA樣品, 比較了低溫冷凍保存(-20℃)、使用酒精或裂解緩沖液(Lysis buffer)和硅膠干燥等不同樣品保存技術所獲得的生物多樣性, 結果顯示干燥或使用lysis緩沖液獲得一致的類群組成結果; 此外與PES相比, 利用MCE采樣能獲得更一致的結果。
eDNA提取的過程是為了將環境樣品中的DNA從完整的細胞和細胞器中釋放出來, 并且能夠有效去除PCR反應抑制物(如: 腐殖酸和腐殖質)[27]。由于環境樣品中的生物復雜性高, 如何有效地提取DNA是科研人員面臨的最大挑戰[8]。eDNA提取過程中最需要關注2個方面, 一是獲得最高的eDNA產物; 二是控制抑制成分, 這些成分可能是細胞復合物(如: 蛋白酶)或環境樣品中的其他物質(如: 腐殖質)[45]。eDNA提取可以采取配制方法或商業試劑盒, 需針對不同研究對象采取合適的提取方法。早期從環境中提取古DNA, 多針對研究對象的不同,采用酚氯仿法(Phenol-chloroform method, PCI法)提取eDNA, 如Ochsenreiter等[46]利用eDNA研究高鹽湖泊中古細菌多樣性時, 在對樣品進行過濾、經裂解液重懸和加入蛋白酶K后, 利用PCI法提取DNA。一直以來, 還是有很多eDNA的研究是采用PCI法提取DNA, 且也有研究表明利用PCI法從GF或NC提取的eDNA量比利用Qiagen DNeasy Blood and Tissue DNA extraction kit(簡稱DNeasy試劑盒)獲得的更多, 且成本更低[27,42]。但因為PCI法會應用到苯酚和氯仿這一類有害物質, 因此在實驗操作時要特別注意對試劑進行處理和實驗廢物的處置, 相比之下, 還是更推薦使用商業試劑盒進行eDNA提取[47]。
我們對湖泊eDNA多種提取方法進行了整理和比較(表 1)。盡管由于研究對象的不同, 不同試劑盒提取DNA的效率不盡相同, 但在湖泊eDNA研究方面還是有很多成功案例[16,48]。目前eDNA提取多采用DNeasy試劑盒、MoBio PowerWater DNA Extraction Kit(簡稱PowerWater試劑盒)、MoBio PowerSoil DNA Extraction Kit(簡稱PowerSoil試劑盒)、MP Biomedicals FastDNA SPIN Kit(簡稱Biomedicals試劑盒)、MP Biomedicals FastDNA SPIN Kit for soil(簡稱Biomedicals for soil試劑盒)、PowerMax Soil(簡稱PowerMax試劑盒)、Qiagen QIAamp DNA Stool Mini Kit(簡稱QIAamp試劑盒)和DNeasy mericon Food Kit(簡稱DNeasy mericon試劑盒)等。針對不同目標物種, 可選擇不同的試劑盒, 達到更好的DNA提取效率。近些年, 多項研究都是針對哪種試劑盒提取什么樣的eDNA樣品可獲得更高提取效率進行的。Deiner等[37]利用從河流和湖泊采集的水樣品, 選擇6套用于檢測兩棲動物和大型哺乳動物的eDNA采樣和提取方案檢測生物多樣性, 結果表明對于靜水環境, 利用過濾法獲得eDNA樣品并配合PCI法提取DNA, 可獲得更高的eDNA產量; 沉淀法獲得eDNA配合PowerWater試劑盒提取的eDNA產量最低; 從物種檢出率看, 利用過濾法獲得eDNA配合DNeasy試劑盒可以檢測到更多的目標物種。Eichmiller等[27]在利用eDNA對鯉(Cyprinus carpio)進行監測和定量分析時, 比較了6種DNA提取試劑盒的效果, 對于井水和湖泊環境,利用Biomedicals試劑盒可以獲得最多的鯉DNA, 但產量沒有明顯高于Biomedicals for Soil和DNeasy兩個試劑盒; PowerSoil試劑盒對于井水和湖泊采集樣品的提取效率是一致的, 適用于更廣泛的生境類型;在綜合分析了不同eDNA采集和提取方法后, 推薦使用1.5 μm GF并用Biomedicals試劑盒提取DNA;應用eDNA對鯉或其他鯉科魚類進行定量分析時,建議使用0.2—0.6 μm CF, 使用PowerSoil試劑盒是最適宜的。Hinlo等[43]比較了通過不同材質濾膜過濾水樣品, 經-20℃或酒精室溫保存, 利用DNeasy和PowerWater兩種試劑盒提取eDNA并進行qPCR分析, 結果表明無論哪種保存方式, 均是用DNeasy試劑盒提取DNA得到的結果更好。
環境樣品中的抑制成分通常包括酚類化合物、腐殖酸和重金屬, 更廣泛的抑制成分還包括細菌細胞、非目標DNA和污染物等[45]。這些抑制成分會干擾DNA提取過程中的細胞裂解, 或與DNA一起被提取出來, 影響其提取純度[8,45]。因此,是否產生抑制作用也是評價eDNA提取方法優劣的指標。Eichmiller等[27]對研究所用的6種試劑盒提取eDNA產生的抑制作用進行了分析, 結果表明PowerWater和Biomedicals試劑盒可觀察到輕微的抑制作用, 并可通過將eDNA提取產物稀釋兩倍來緩解; DNeasy試劑盒產生最多的抑制作用, 只有將eDNA提取產物稀釋五倍才能得到緩解。

表 1 湖泊樣品中eDNA提取的常用方法Tab. 1 Common methods for extracting eDNA from lake samples
回顧基于eDNA開展的湖泊生物多樣性研究,可以將eDNA檢測分為兩大類: 一類是利用eDNA對特定物種或類群進行檢測; 另一類是利用eDNA宏條形碼技術(eDNA metabarcoding)對多種生物類群進行檢測。
特定物種或類群研究eDNA技術一般被應用于湖泊中珍稀、瀕危和外來物種的檢測, 對于珍稀和瀕危物種的研究包括對中國長江中下游的江豚(Neophocaena asiaeorientalis asiaeorientalis)[38],及歐洲丹麥、瑞典、德國、愛沙尼亞和波蘭等地的池塘、水庫和溪流中分布的棕色鋤足蟾(Pelobates fuscus)、北冠毛蠑螈(Triturus cristatus)、水獺(Lutra lutra)、歐洲縱帶泥鰍(Misgurnus fossilis)、胸大隱骨蟲(Leucorrhinia pectoralis)和藍帶魚(Lepidurus apus)等物種及其分布范圍進行監測[16];外來物種的檢測涉及法國西南部佩里戈爾-利穆贊自然公園池塘中的北美牛蛙(Lithobates catesbeianus)[57]、日本池塘中的藍鰓翻車魚(Lepomis macrochirus)[58,59]和美國五大湖地區的梅花鱸(Gymnocephalus cernua)[53]等。
對于特定物種或類群的eDNA檢測主要通過設計特異性引物進行PCR, 利用目標片段進行物種鑒定[11]。一般用線粒體DNA片段開展湖泊生物檢測,因為其含有較高的拷貝數且區分物種的保守序列較多; 由于核基因的敏感性不高, 因此很少使用核基因進行eDNA檢測[60,61]。經常用到的線粒體基因包括Cytb、COⅠ、12S rDNA、16S rDNA、Dloop等, 片段大小在80—200 bp[16,37,62,63]。特異性引物可根據目標物種或類群的特定線粒體DNA序列來設計, 目的片段長度要適合高通量測序平臺的要求, 需具有一定特異性, 能有效區分近緣種。常用的引物設計軟件包括Primer Express 3.0.1、Primer premier 6.0和PrimerHunter等[13,28]。對湖泊中特定物種或類群開展檢測時, 目標片段的擴增多采用PCR、qPCR和微滴式數字PCR(Droplet digital PCR,ddPCR)方法[51,64—66]。PCR比較傳統和普遍地應用于eDNA研究, 可以對目標物種進行定性分析, 雖然可通過電泳條帶的亮度推測eDNA濃度, 但并不精確且存在污染的可能性[47]。qPCR是具有更高特異性和敏感性的定量方法, 近些年已作為eDNA研究的主流方法, 應用于定量要求高的研究, 如評估生物多樣性和分析種群密度等[16,58,67,68]。ddPCR是一種核酸分子絕對定量技術, 可直接推算eDNA目的片段的拷貝數; ddPCR的優點是DNA濃度和PCR抑制物不會影響DNA定量分析, 因此該方法可被用作qPCR的替代方法, 可用于eDNA定量分析[51]。
eDNA宏條形碼隨著HTS技術的發展, 宏條形碼應運而生, 在生物多樣性較為豐富的環境中,更適合開展eDNA宏條形碼研究。DNA宏條形碼可以更快速、準確和自動化地進行物種鑒定, 這一技術可同時分析一定環境中的生物多樣性, 且更經濟和簡便, 相關技術方法也在不斷改進和發展[16,69,70]。在進行eDNA宏條形碼研究時, 通常利用生物類群的通用引物進行擴增, 這些通用引物通常被設計在線粒體或核基因DNA某一基因區段的保守區域內[11]。根據湖泊內不同的生物類群, 通用引物的選擇有所不同: 針對微生物種群和群落的研究, 多選擇16S rRNA基因設計引物; 對于底棲動物和浮游動物,COⅠ基因是更好的分類鑒定基因; 浮游植物則優先選擇18S rDNA基因, 該基因具有更高的物種覆蓋率及較完善的條形碼數據庫, 已被廣泛應用于真核藻類的檢測; 魚類引物設計通常選用的基因片段為Cytb、12S rRNA或16S rRNA等線粒體基因, 其中12S rRNA基因被證實表現更為出色[47,71—75]。Zhang等[75]基于計算模擬PCR方法(Silico PCR)比較了22對硬骨魚類的eDNA宏條形碼通用引物, 并在北京水體中進行了應用, 結果表明不同引物在對不同生物類群的擴增范圍和比例、檢測魚類物種豐富度和群落結構等方面均存在明顯差異, 12S rRNA區段引物對魚類多樣性的擴增表現優于其他區段引物。但由于物種的個體差異、引物存在偏好性和測序深度等問題, eDNA宏條形碼技術在開展物種精確定量方面還存在不足[73,74]。
eDNA樣品擴增得到的PCR產物經等量混合和純化后, 構建文庫。目前, 湖泊eDNA研究中的文庫構建均采用商業試劑盒進行, 常選用的建庫試劑盒包括: NEBnext DNA Sample Prep Master Mix Set2(New England Biolabs, Ipswich, MA)[16]、Sequal-Prep Normalization Plate Kit (Invitrogen, Life Technologies)[76]和Agilent SureSelect Target Enrichment Kit[54]等。我們利用eDNA研究鄱陽湖魚類物種多樣性時, 選用的建庫試劑盒是適用于Illumina測序平臺的Illumina TruSeq DNA PCR-free LT Sample Prep kit?,F在市場上可選擇的建庫試劑盒種類繁多, 如何選擇是與測序平臺的類型和所需數據深度密切相關的。已有研究中用到的高通量測序平臺主要包括: Roche GS FLX 454、Illumina Miseq和Hiseq等[16,54,72,76]。在我們開展湖泊eDNA研究時,選用過Illumina HiSeq X Ten測序平臺, 利用12S rRNA序列分析魚類物種多樣性。根據數據量的大小, 高通量測序平臺一般被分為超高通量和中等通量測序, 如Roche GS FLX 454和Illumina Hiseq 2000、2500和HiSeq X Ten屬于超高通量測序平臺,適合大規?;蚪M學研究; Illumina Miseq是中等通量測序平臺, 適合靶向和小型基因組測序。Illumina測序平臺是目前最常被使用到的, 近期該公司又推出了介于Hiseq和Miseq之間的NextSeq 500測序儀, 可在高產量和中等產量2個模式下進行測序。
eDNA宏條形碼技術依賴于成熟的DNA數據庫, 可以將用于物種鑒定的靶序列與數據庫中的序列進行比對來確定物種信息。如果DNA數據庫中涵蓋的信息較少或缺少某些物種的DNA信息, 靶序列通常聚類為分子可操作分類單元(Molecular Operational Taxonomic Units, MOTUs), MOTUs往往更容易鑒定到科和屬級水平[11,47]。Deiner等[77]對利用eDNA宏條形碼開展動植物群落調查進行了詳細綜述, 其中利用湖泊沉積物的古DNA和宏條形碼檢測植物多樣性, 重建生物群落; 微生物宏條形碼可用于檢測真菌和細菌多樣性。eDNA宏條形碼或將成為監測動植物多樣性的標準方法, 可結合傳統調查方法快速開展生物多樣性監測。
利用eDNA宏條形碼進行物種鑒定時需要對測序序列進行生物信息學分析, 主要分析流程如圖 2所示, 目前常用的分析軟件包括PhyloPythia[78]、Mothur[79]、Cutadapt[80]、Usearch[81]、QIIME[82]和OBITools[75]等。通常進行eDNA宏條形碼分析, 需要科研人員具有一定的序列分析和計算機編程能力。但最近新開發的一些HTS數據分析平臺可以提供更友好、便捷的序列分析方案, 科研人員只需要在線提交數據就可以完成分析, 如MiFish Pipeline (http://mitofish.aori.u-tokyo.ac.jp/)魚類多樣性在線數據分析平臺[47]。

圖 2 eDNA高通量測序序列主要分析步驟Fig. 2 Major analysis steps of eDNA high-throughput sequences
影響eDNA檢測的因素基于eDNA的原理,eDNA是否能被檢測到是與其釋放、擴散和降解有著密切關系[34,83,84]。生物和環境條件, 即水溫、pH、微生物活性、生物量和生物活動等, 是影響eDNA釋放和降解的重要因素。Thomse等[16]在水族館和實驗池塘條件下, 以鯉(Cyprinus carpio)為研究對象, 分析了水溫、生物量和鯉的活動與eDNA釋放量和濃度之間的關系, 結果表明eDNA釋放量會隨鯉活動的增加而增加; 在水族館條件下, 水溫的變化不會影響eDNA濃度; 在水族館和實驗池塘條件下, 鯉的生物量與eDNA濃度呈正相關。Klymus等[36]在實驗條件下, 以鰱(Hypophthalmichthys molitrix)和鳙(Hypophthalmichthys nobilis)為研究對象,研究了水溫、生物量和攝食如何影響eDNA釋放率, 結果表明生物量和攝食與eDNA釋放率存在正相關, 但水溫對其沒有明顯影響。Lacoursiere-Roussel等[85]比較了在7和14℃水溫條件下魚類eDNA釋放量, 結果表明溫水中的釋放量高于冷水。Lacoursiere-Roussel等[86]對采自加拿大魁北克12個自然湖泊的水樣品進行了eDNA檢測, 分析了水溫、溶氧、pH、污濁度、生物量與eDNA濃度之間的關系, 結果表明eDNA濃度與幾個環境指標沒有明顯相關性, 但與生物量有正相關性。Tsuji等[87]研究了水中pH高低對eDNA過濾量的影響, 結果表明: pH在5—9, eDNA濃度與pH呈負相關, 在酸性條件下eDNA量相對較高。Jo等[88]利用實驗魚缸研究了水溫和魚類生物量對eDNA釋放、降解率和片段大小的影響, 結果表明水溫越高、生物量越大,eDNA釋放率越高, 但降解率也隨之升高; 將魚從魚缸中取走, 大于10 μm的eDNA片段會減少, 但更小的片段會增加。
eDNA在水中的降解率也與目的片段大小存在密切關系。Bylemans等[89]利用實驗魚缸研究了水中魚類不同長度線粒體eDNA和核eDNA短片段的降解情況, 結果表明在有魚的情況下, 線粒體eDNA短片段的豐富度高于長片段和核eDNA短片段; 在魚被取走的情況下, 各種片段的降解表現出相似的情況。Jo等[90]比較了eDNA長片段(719 bp)和短片段(127 bp)拷貝數的時間變化, 結果顯示長片段相較于短片段更容易降解, 但長片段的濃度可以更好地被用于生物量的估算。
eDNA作為一個新興領域, 雖然相較傳統生物多樣性調查方法具有很多優勢, 但也因為其樣品的復雜性和對實驗操作的嚴格性和數據分析的困難性, 使得這一研究仍存在很多技術性問題需要我們在未來去解決。
通過回顧自20世紀90年代以來eDNA在湖泊生物多樣性方面的研究, 選擇效果最佳、最為經濟、簡便的樣品采集和eDNA提取方案一直是科研人員的關注焦點, 且這一趨勢在近年表現得尤其突出。隨著eDNA技術的發展和更多不同國家科研人員的加入, 可選擇的采樣和實驗方案越來越多, 且正在不斷更新和發展。因此針對湖泊這一生態環境和不同目標類群, 如何選擇和開發最佳采樣和實驗方案將是未來該領域發展的一個重要趨勢。
污染是eDNA研究面臨的最大挑戰, 其可能發生在采樣、DNA提取、PCR擴增等各個環節, 造成假陽性結果的出現。避免采樣環境和實驗室污染發生, 可以利用10%漂白劑和75%酒精進行清潔, 并注意操作人員佩戴口罩和手套。但是在實驗過程中, 由于試劑藥品和操作過程中造成的交叉污染幾乎是不能避免的, 或多或少會對實驗結果造成一定誤差, 特別是通過HTS測序, 很容易得到少量由于交叉污染產生的片段。針對這一問題, 在研究的各個環節都需要設置陰性對照(空白對照), 監控污染情況。另外, 開發一些新的采樣技術也是降低甚至避免污染的有效途徑。目前已有研究嘗試利用無人機技術開展eDNA采樣[91], 使得交叉污染基本被避免。
環境樣品中包含的腐殖酸、腐殖質和有機復合物等抑制因子在eDNA提取過程中被一同提取出來, 將對后續PCR產生一定抑制作用。且像湖泊這樣相對靜止的環境, eDNA中更容易產生這些抑制因子, 影響實驗的順利開展。eDNA研究快速發展的這二十年中, 科研人員也發現了抑制因子的存在,針對這一問題摸索出一些降低抑制反應的方法, 如利用稀釋或純化等方法去除抑制因子[49,92], 或在PCR過程中添加BSA、RSA和Tween 200等反應加強劑[93,94]。但隨著eDNA研究中環境樣品量不斷增加的趨勢, 如何降低抑制反應的發生仍然是該領域未來重要的研究方向。
誤差和錯誤的產生除了由于實驗過程中發生交叉污染, eDNA樣品的長期保存、PCR和測序過程中都有可能產生誤差或錯誤。PCR導致的錯誤主要是由于嵌合子、異源雙鏈分子的形成和TaqDNA聚合酶錯誤[95]。測序過程中也有更多機會產生錯誤。針對這一問題, 通過對測序所得原始序列進行過濾和去除假陽性等方法可以在一定程度上降低誤差和錯誤的發生。一方面, 開發高效的擴增引物并發展高通量測序序列分析方法將是未來eDNA研究中減少錯誤和誤差發生的重要趨勢; 另一方面, eDNA技術可結合傳統調查方法, 用于監測湖泊生物多樣性, 有利于更為高效準確地開展生態調查。
eDNA研究特別是eDNA宏條形碼研究離不開DNA分類數據庫, 一個好的參考數據庫, 可以保證分類鑒定結果的準確性, 是物種鑒定重要的參考系。NCBI數據庫(http://www.ncbi.nlm.nih.gov/genbank)正在快速發展和完善, 一些針對特定類群建立的DNA數據庫也在不斷出現(如: 世界魚類world’s fish, www.fishbol.org; 哺乳動物DNA數據庫www.mammaliabol.org和鳥類條形碼數據庫www.barcodingbirds.org)[11]。盡管如此, 這些國際數據庫中的分類學數據仍存在很大欠缺, 特別是中國生物類群的相關數據。作者團隊在利用eDNA研究中國洞穴魚類多樣性過程中就發現, NCBI數據庫中記錄的洞穴魚類DNA條形碼數據僅占到所有洞穴魚類不到一半。這就需要科研人員在這方面投入更多研究, 對數據庫進行不斷完善的同時, 也要增強數據庫的準確性, 能夠使每條序列與對應標本匹配。建議涉及對特定湖泊生物多樣性開展長期性監測, 可考慮建立地區性數據庫, 有針對性地整理DNA分類數據; 通過不同數據庫跨庫間的比對篩選, 可識別出存在鑒定問題的物種, 再對數據庫進行針對性改善; 加強各實驗室數據庫共享。