王 萌,金小偉,林曉龍,杜麗娜,崔永德,吳小平,孫紅英,謝志才,王新華,王備新,*
1 南京農業大學植物保護學院,南京 210095 2 中國環境監測總站,北京 100012 3 南開大學生命科學學院,天津 300071 4 廣西師范大學珍稀瀕危動植物生態與環境保護教育部重點實驗室,桂林 541006 5 中國科學院水生生物研究所淡水生態與生物技術國家重點實驗室,武漢 430072 6 南昌大學生命科學學院,南昌 330031 7 南京師范大學生命科學學院,南京 210023
淡水大型底棲無脊椎動物簡稱底棲動物,是指生活史的全部或部分生活在水體底部,個體大小不能通過500 μm孔徑網篩的無脊椎動物[1]。常見的有節肢動物門昆蟲綱的水生昆蟲、軟甲綱的淡水蟹、鉤蝦,軟體動物門的蚌類、螺類,環節動物門的寡毛綱、蛭綱,以及扁形動物門的渦蟲等[1]。底棲動物是維護水生態系統結構與功能完整性的重要生物類群。它具有分布廣泛,生活周期長,對水質變化敏感等特點,因此是水質監測與評價中應用最廣泛的生物類群[2]。近些年,日益增強的人類活動干擾、水污染和氣候變化導致底棲動物多樣性銳減,嚴重威脅水生態系統健康[3]。如何科學、快速和準確地為淡水生物多樣性和水質評價的研究與實踐提供大量底棲動物數據,已是當前水生態環境管理關注的重要問題。
傳統以形態學鑒定為基礎的底棲動物監測方法存在成本高、耗時長、代表性低、專業性強和精確性不夠高等缺陷。首先,以生物個體為目標的采樣方法需要消耗較大的人力財力,并在采樣空間方面存在局限性[4]。其次,跨越數個不同動物門類的底棲動物形態學鑒定高度依賴分類專業人員,然而動物分類研究者數量正在不斷減少。再者,采集到的水生昆蟲絕大多數是幼體,科級水平以下的鑒定特征模糊甚至缺乏,往往難以準確鑒定到屬和種,因此無法準確識別物種與脅迫因子間的專一響應關系,有可能降低評價等級的準確性和精確性[5-6]。綜上,傳統監測方法的缺陷使其難以適應當前水質監測要求的大規模、高頻率、高要求的管理需求,因此急需新的調查方法滿足現階段日益增長的對水生態環境和生物多樣性的評估需求。
近年來,環境DNA-宏條形碼技術通過對環境樣品中混合DNA進行高通量測序和比對,能夠快速大規模地得到生物多樣性鑒定信息和群落組成,極大得革新了生物多樣性調查方法,現已被廣泛應用于土壤和水生態環境的生物多樣性監測中[7-10]。相比于傳統方法,環境DNA-宏條形碼技術不需大量的人力物力,成本低、操作簡便,因此更適合于大尺度的流域生物多樣性監測[11]。同時,該方法靈敏度高,即使在物種密度很低的情況下也能準確檢測到目標物種的存在[4]。此外,環境DNA-宏條形碼技術可以不依賴分類人員同時對跨門類物種進行監測,并且不受發育時期的限制,完成物種的準確鑒定[4]。因此,環境DNA-宏條形碼技術被認為是現階段實現水生態環境快速、大尺度和大樣本物種監測最有發展前景的方法[11]。
目前,環境DNA-宏條形碼技術對底棲動物的檢測和鑒定仍存在部分問題和不足,制約其進一步在水質監測中的應用。主要問題有低豐度物種漏檢、物種鑒定錯誤、采樣流程與方法不統一以及生物量精確估測困難等[11]。這些問題在技術層面體現在樣品采集與處理流程、分子標記選擇、引物設計、PCR偏好性,以及參考數據庫的完整性等影響因素[12-14]。因此在推動環境DNA-宏條形碼技術應用底棲動物監測時應重點關注這些關鍵影響因素。近十年來,針對以上關鍵影響因素國內外開展了比較多的優化研究[14-19]。然而其中大部分研究較為分散,部分結論不一致,且缺少系統性的分析和比較,制約了底棲動物環境DNA-宏條形碼監測技術方案的規范和優化,因此亟需對相關問題進行系統性的梳理與整合。鑒于此,本文對環境DNA-宏條形碼的概念和在底棲動物監測的應用進行了綜述,重點針對影響環境DNA-宏條形碼技術用于底棲動物監測和水質評價的關鍵因素及其相應優化進行了分析總結,并基于此提出提高環境DNA-宏條形碼技術監測底棲動物效率和準確率的有效途徑,期望為基于環境DNA-宏條形碼技術的底棲動物監測方案的標準化和規范化提供建議和參考,最后對該技術在底棲動物監測和水質評價中的最新發展方向進行了展望。
環境DNA概念最早于1987年提出,用于從沉積物中提取微生物的DNA,2000年左右開始引入生態學領域[20]。環境DNA(environmental DNA,eDNA)是指從土壤、水和大氣等環境樣品中直接提取的不做任何分離得到的生物釋放的游離DNA片段的總和[20]。具體包括微生物、動物和植物不同物種本身以及向環境中釋放的分泌物、唾液、精子、糞便和脫落的皮膚等一系列降解程度不同的各種DNA混合物[20]。環境DNA-宏條形碼技術(eDNA metabarcoding)指從土壤、水等環境采樣提取總DNA片段,使用通用引物進行PCR擴增并結合高通量測序,得到上百萬條序列,再與已有數據庫中的序列信息進行比對,從而一次性對環境樣品中的多個物種或類群進行快速、大規模鑒定[10]。該方法能夠有效檢測出傳統方法未檢測到的種類,同時能夠對大部分物種進行屬或種級別的準確鑒定。目前環境DNA-宏條形碼技術在水生生態系統中的應用主要集中在物種多樣性調查[21]、入侵和稀有物種檢測[22]以及目標生物相對豐度、種群大小、分布和發生動態檢測等方面[23]。2008年,環境DNA-宏條形碼技術首次應用于入侵水生生物美國牛蛙(Ranacatesbeiana)的監測[22]。此后其他研究人員先后利用該技術對亞洲鯉科魚類中的鰱(Hypophthalmichthysmolitrix)和鳙(H.nobilis)[24]、藍腮太陽魚(Lepomismacrochirus)[25]和新西蘭泥蝸牛(Potamopyrgusantipodarum)[26]等物種成功進行了監測。
2011年,Hajibabaei等[27]首次證明環境DNA-宏條形碼技術適用于底棲動物多樣性監測。隨后的研究進一步證明該技術對環境敏感類群蜉蝣目、毛翅目和襀翅目(蜉蝣目Ephemeroptera、襀翅目Plecoptera和毛翅目Trichoptera昆蟲,簡稱EPT昆蟲)物種有良好的檢出效果[28-29]。Elbrecht和Leese[30]的模擬實驗進一步證明環境DNA-宏條形碼技術對大部分底棲動物的檢出率較高,總體檢出率達98%,其中EPT的檢出率均為100%。Beermann等[31]對濕地搖蚊的研究表明,環境DNA-宏條形碼技術對搖蚊的檢出率比傳統調查方法高70%以上。當前,環境DNA-宏條形碼技術已經開始從獨立樣點或者特定物種監測向大尺度、大樣本監測和評估轉變(表1)[32,39]。基于環境DNA-宏條形碼技術的生物監測被稱為“Biomonitoring 2.0”[40],該技術的廣泛應用標志著生物多樣性監測進入全新的分子時代。環境DNA-宏條形碼技術進行底棲動物多樣性監測和水質評價具有廣闊的發展前景,然而相比國外目前國內相關研究較少[41-42],因此需要更多的方法學和應用研究來推動我國基于環境DNA-宏條形碼的水質監測的發展。

表1 環境DNA-宏條形碼技術監測淡水底棲動物典型研究示例Table 1 Examples of environmental DNA (eDNA) metabarcoding technique for biomonitoring of freshwater macrozoobenthos
環境DNA-宏條形碼技術對水生態環境監測的一般操作流程主要包括:樣品采集、eDNA提取、PCR擴增、eDNA高通量測序和序列生物信息學分析(圖1),技術層面上影響環境DNA-宏條形碼技術監測效率和準確性的關鍵因素主要在于不同的采樣方法與流程、分子標記選擇、引物設計、PCR偏好性以及DNA條形碼參考數據庫的完整性等[11-12](圖2)。

圖1 環境DNA-宏條形碼技術的一般操作流程Fig.1 The basic workflow of environmental DNA (eDNA) metabarcoding

圖2 環境DNA-宏條形碼技術在底棲動物監測應用中的關鍵問題與優化策略Fig.2 Critical factors influencing the application of environmental DNA metabarcoding in macrozoobenthos monitoring and their optimized strategies
與eDNA樣品采集方法相關的優化研究是環境DNA-宏條形碼研究的熱點方向之一[20,40]。底棲動物的采樣方法對最后的檢測結果有著顯著影響,目前水樣法和混合組織樣法是獲取底棲動物eDNA的兩種主要方法。
2.1.1水樣法
水樣法指通過水環境樣本進行eDNA的富集,現階段水樣eDNA的采集方法主要有兩種:沉淀法和過濾法[43]。沉淀法[21]特點是不過濾水樣,直接加入氯化鈉和乙醇并結合離心操作獲取eDNA,更適用于原核生物細菌等的獲取。過濾法則通過過濾水樣將eDNA截留在濾膜上,效果取決于過濾孔徑大小[43]。無論在靜水和流水中,對于底棲動物而言,采用過濾法eDNA捕獲率最高[43]。采集水樣量也是影響物種檢測準確度和檢出率的重要因素。根據研究對象不同,每個重復水樣的采集量從15 mL到10 L不等[16,44]。一般來說采集量大時樣品代表性較好,但同時采樣難度和后續工作量也顯著增加,目前底棲動物eDNA的水樣采集量一般是1 L或2 L[45]。當目標生物密度較低或調查江河、湖泊等大型水體時,應適當增加采樣重復數以及單次水樣取樣量[46],過少的水樣量以及無重復樣本都可能會導致物種檢出率降低甚至數據無效。
水樣法是淡水生態多樣性監測的常用方法。然而由于水的流動性,流水中的eDNA會沿河網向下游擴散,從而影響下游真實的物種豐富度和多樣性[47]。因此水樣法更適合流域尺度的物種多樣性調查,但無法重建微觀尺度下的生物多樣性空間分布模式[48]。此外,水環境樣本的異質性和采樣的隨機性也常導致不穩定的檢出結果[49,50]。近期一些研究表明水樣中的底棲動物檢測率僅有傳統形態學采樣方法的1/3,且對一些關鍵指示生物的檢測較為困難[51]。
2.1.2混合組織樣法
混合組織樣法是將全部個體或部分混合后進行研磨,然后基于均質化后的混合組織勻漿(bulk sample)進行總DNA提取的方法。大部分底棲動物調查時先獲得踢網樣品,然后進行分揀,去除其中的雜質、底泥以及植物和藻類等非目標有機物后再對目標樣品研磨均一化后提取eDNA[32,52]。少數研究不進行分揀,底棲動物樣品和雜質混合在一起研磨后提取eDNA[15,27,37]。一般認為不進行分揀時樣品成分往往較為復雜,包含多種PCR抑制劑,影響DNA的提取和PCR擴增效率[18,53]。但近期一些研究發現樣品中的雜質不影響重要指示生物的檢測[54],甚至未分揀的樣品檢測率高于分揀樣品與水環境樣本[55]。
混合組織樣法的優點在于DNA的提取率高,但缺點是損失了相應的憑證標本,導致無法進行后續研究。鑒于此,Hajibabaei等[52]提出了一種無損提取法(non-deconstructive method),即通過樣品酒精保存液中提取eDNA來替代從組織混合樣中提取eDNA。該方法能夠成功檢測到大部分底棲物種,其底棲動物檢測率僅略低于混合組織樣法(87%vs89%)[17,56-58]。研究表明70%—96%濃度的酒精保存液都適用于提取混合DNA[17,57,59],且酒精浸泡后取樣時間的長短對于物種檢測率影響并不顯著[17]。早期酒精保存液法提取eDNA要先進行酒精的蒸發再進行DNA的提取[52,57],步驟繁瑣不利于大規模酒精樣品的處理。近期一些研究者對此進行了優化,一方面省略樣品分揀,對酒精保存液進行二次過濾來提取eDNA,顯著縮減處理的時間和步驟[59];另一方面通過一系列方法(超聲波、震蕩、冷凍)增加DNA的釋放率,進一步提高該方法的檢測率[59]。酒精保存液法的優點在于保存了憑證標本的完整性,但其在物種檢測率上仍低于混合組織樣法[17,52]。此外,該方法容易造成少數物種漏檢,尤其是外殼骨化強烈的物種如鞘翅目、帶殼的軟體動物以及帶巢生活的一些毛翅目種類[17,59]。
綜上,當進行一些重點指示生物如EPT昆蟲多樣性監測時,酒精保存液法對憑證標本無損傷、節省時間,是可替代組織樣法一種方法。而當對整個底棲動物類群多樣性做評估時建議采用常規的混合組織樣方法進行監測[17]。
選取合適的分子標記與擴增引物是環境DNA-宏條形碼擴增成功的關鍵。理想的適用于環境DNA-宏條形碼監測的分子標記應同時具備高度保守區域和高度可變區域,前者便于通用引物設計,后者有助于物種識別[60-61]。動物線粒體細胞色素氧化酶COI基因保守度適中,在不同物種之間有良好的解析度,并且現有數據庫最為全面,是目前最常用的標記基因[30]。然而COI作為分子標記也有著顯而易見的缺陷,體現在COI基因作為一個蛋白編碼基因,第三位密碼子的突變率較高,在不同物種中差異較大,導致難以設計物種覆蓋度較為全面的通用引物[62]。此外,基于COI基因的引物容易引起一些優勢物種的過度擴增,從而導致一些低豐度和難擴增物種檢測不到[13]和物種生物量估測不準確[12,63]。
鑒于以上COI基因的缺陷,一部分研究者致力于尋找能夠替代COI基因的其他分子標記。此類研究主要集中在16S rRNA、18S rRNA等基因標記[14,61]。Elbrecht等[14]通過模擬實驗驗證16S rRNA相較COI基因在底棲動物中具有更高的檢測率,尤其昆蟲綱的檢測率接近100%。此外,16S rRNA引物偏好性較小,對生物量的估測也更為準確,但其對除昆蟲綱以外的其他底棲動物檢測率不佳[14,64]。Ficetola等[64]比對16S rRNA、18S rRNA和COI基因標記在環境DNA監測中的效果發現,18S rRNA通用性最強但分辨率較差,更適合對生物多樣性做整體評估,而COI基因種級界定效果最佳。16S rRNA、18S rRNA相較COI基因具有更廣泛的物種覆蓋度,然而缺少像COI基因一樣強大而廣泛的參考數據庫,物種比對難以達到滿意的精度[14]。
綜上可知,沒有單獨一個基因標記能夠完美實現宏條形碼技術監測對于物種覆蓋度和解析度的要求。因此我們建議在進行eDNA監測時將16S rRNA或其他分子標記擴增的結果作為COI基因的補充[14]。或者在PCR擴增時中采用多分子標記(multiple primers)的策略[64-65](例如16S-COI、18S-COI、COI-COII),兼顧物種的覆蓋度和精確性[66-67],并利用COI基因強有力的參考數據庫進行物種的注釋[14]。
引物的設計在eDNA監測中至關重要,合適的引物可以顯著提高eDNA的擴增質量并減少引物的偏好性[19]。現階段引物設計的主要思路是設計COI基因的高簡并性引物,增加通用性的同時盡可能地減少其引物偏好性。目前效果較好的有Geller等[68]設計的COI基因通用引物jgHCO2198和jgLCO1490,該引物適用于所有后生動物;Hajibabaei等[52]針對底棲動物設計的三組高簡并性COI引物。目前由Elbrecht和Leese[30]設計的高兼并性COI引物BF1/BF2和BR1/BR2不僅對底棲動物檢測率顯著高于傳統的COI引物和16S rRNA,同時減少了其擴增偏好性。
引物設計的另一思路是采用短片段引物(mini-barcode)。由于環境DNA-宏條形碼研究中廣泛存在高度降解的短片段DNA和高通量測序短的特點,短片段引物在底棲動物環境DNA-宏條形碼檢測中更有優勢[35]。當前應用的有Leray等[69]設計出的短片段引物(313 bp)mlCOlintF/mlCOlintR和Vamos等[70]設計出的短片段引物fwh1 set、fwh2 set(擴增長度分別為178 bp和205 bp)。相比傳統通用引物(如LCO1490/HCO2198)與較為成熟的高兼并性引物(如BF1/BF2和BR1/BR)[30],短片段引物所含信息相對較少,引物偏好性較高,但對于短片段DNA擴增效率更高。因此在樣品保存較好、eDNA降解程度小時,建議使用高兼并性COI引物如BF1/BR1和BF2/BR2。如果樣品DNA高度降解,使用短片段引物會使擴增更為有效。
引物設計好后更重要的是如何評價其擴增的效率和特異性。新設計的引物應通過模擬實驗和電腦檢測(e.g.In silicon PCR軟件)的雙重驗證后方可大規模地應用[30,60-61,71]。MacDonald等[72]總結出在環境DNA-宏條形碼研究中引物設計和評價的九個步驟,按步驟進行引物的設計和評價能夠有效地降低陰性錯誤和陽性錯誤發生的概率。這9個步驟包括:(1)定義eDNA實驗涉及到的生物范圍,并據此確定合適的基因標記,如COI;(2)建立物種類群的基因比對數據庫;(3)通過系統發育關系檢驗目標基因區別物種的能力;(4)針對目標物種進行特異性引物的設計,注意引物序列中包含非目標生物的堿基錯配;(5)通過遺傳距離分析找到容易混淆的近似種;(6)通過模擬實驗檢驗引物的特異性,評估假陽性和假陰性錯誤的風險;(7)通過連續稀釋的DNA樣本檢驗引物的靈敏性;(8)基于野外實驗樣品評估引物性能及PCR條件是否合適、有效;(9)實施大范圍的實驗來制定具有使用限制和可能錯誤的標準調查原則。
PCR偏好性是由于引物和不同樣品模板之間親和力不同,某些親和力強的樣品模板在PCR的每輪循環中更容易被擴增,導致其在最終的PCR產物中過量表達的現象。引物和模板之間存在不同堿基數量的錯配是造成PCR偏好性的重要原因,即引物和模板錯配數量少比錯配數目多的更容易擴增[46]。此外,基因片段長度與堿基組成也影響引物結合效率(比如短片段更容易被擴增,GC含量過高的模板不易擴增)[19]。
PCR偏好性是造成環境DNA-宏條形碼技術對低豐度物種檢測率低[28]和物種生物量估測錯誤[12,30]的最主要因素。在生態研究中,生物多樣性和生態系統功能的評估都離不開對物種相對豐度的準確的分析。然而,現階段環境DNA-宏條形碼基于分子數據對物種的定量分析無法準確反映物種真實的生物量和相對豐度[11]。盡管很多研究都證明環境DNA-宏條形碼擴增的序列數和生物量之間具有正相關的線性關系[12,23,73-74],但這種線性關系只有在PCR偏好性沒有顯著影響時才成立[75]。因此,控制和減輕PCR的偏好性是環境DNA-宏條形碼技術應用于水生態環境監測的主要挑戰之一。建議可以采用以下方法來避免或減弱PCR偏好性。
(1)使用多重分子標記同時擴增,即使用不同分子標記基因的保守區設計多對通用引物。不同引物配套使用,能夠在一定程度上減輕PCR偏好性[65,67]。但此方法獲得的種類往往較為復雜,給序列比對和多套數據整合等帶來困難,同時也增加了假陽性率和監測成本。
(2)引物設計上,增大對非目標物種的錯配[46]。同時,針對優勢種設計封閉引物,減少不必要的DNA擴增,對低豐度物種設計更為特異性的引物。
(3)在PCR擴增階段,改進和優化擴增條件,包括降低引物量、適當增加模板量、減少循環次數以及適當提高退火溫度等[19]。或者采用降落PCR(Touch-down PCR)和巢式PCR提高擴增的特異性[19]。
(4)使用宏線粒體基因組技術,直接從混合樣品中獲取總DNA并測序,避開PCR擴增環節[19]
參考數據庫的完整性和質量直接決定了運用環境DNA-宏條形碼技術進行物種鑒定的可靠性和準確度[76]。雖然近年來GenBank、BOLD(The Barcode of life Data System)等公共數據庫收錄了大量數據,但其中水生生物類群收錄不足。除此之外,文庫中收錄的數據多為COI、16S rRNA等序列片段,而基于其他分子標記基因的數據收錄較少[12,77]。數據庫的不完善使得大量的環境DNA-宏條形碼數據不能得到注釋或正確注釋,造成物種漏檢或鑒定錯誤,這是很多環境DNA-宏條形碼檢測結果低于形態學檢測結果的首要原因[12]。此外,注釋數據中超過50%的數據只能鑒定到門或目,對物種的辨識度很低[77],無法滿足大多數水生生物多樣性監測和水質監測需要鑒定到屬或種的要求。
針對此問題,全球很多研究機構開始著手建立可靠完整的分子數據庫和信息分享平臺。澳大利亞專門建立了針對底棲動物的數據庫Aquatic Invertebrates of Australia[78]。加拿大建立了EPT數據庫,收錄了112個EPT物種,2277條COI序列[79],近期又建立了包含150萬條條形碼數據和憑證標本的參考數據庫[80]。美國建立了收錄209種毛翅目昆蟲和超過1000多條條形碼數據的參考庫[81]。同時,德國也建立了EPT數據庫,收錄了363個物種和2000多條序列[82]。
目前我國條形碼數據庫發展相對較慢,尚未建立針對底棲動物的條形碼數據庫。雖然有GenBank和BOLD等公共數據庫,但其數據在地理空間和物種覆蓋度方面極不平衡,導致我國特有底棲動物種類鮮有收錄,且已有的序列還存在著大量鑒定和標記錯誤[83]。因此急需一個由專業分類學家通過準確鑒定和測序而建立的更為完備的,特別是包含我國種群數據的底棲動物條形碼數據庫。鑒于我國受限于缺乏條形碼數據庫的現狀,2019年11月由南京農業大學水生昆蟲團隊首倡召開的中國底棲動物條形碼數據庫研討會在南京舉行。會議上確定由南京農業大學、南開大學、中國科學院水生生物研究所、中山大學、南京師范大學、廣西師范大學等15個高校與科研院所的分類專家及團隊共同攜手參與構建中國首個具有自主知識產權的底棲動物條形碼數據庫。目前,數據庫已完成昆蟲綱(毛翅目、蜉蝣目、襀翅目、蜻蜓目等)、寡毛綱、軟體動物門(腹足綱和瓣鰓綱)與軟甲綱(溪蟹和鉤蝦)等合計400余種的條形碼測序工作,收錄共計1000余條形碼序列。該條形碼數據庫的建立有利于摸清我國底棲動物多樣性家底,并為我國底棲動物多樣性保護研究和水生態的健康評價提供堅實的數據基礎和技術保障。
當前底棲動物水質監測的取樣及分析流程多樣,然而不同方法獲得的結果可比性較差。采集過程中不同水樣的采集位置、過濾水量、重復次數以及后期實驗室不同的PCR重復次數、測序深度等都會導致測定結果之間有較大差異[67]。此外,采樣過程中的防交叉污染,對照設立以及樣品存放條件等都對結果有重要影響,然而這些標準至今仍未統一[54]。采樣方法與流程的標準化是底棲動物環境DNA監測結果具有可重復性與可比性的重要前提。因此探索有效的采樣方法和流程并統一標準對今后開展基于環境DNA的水生態系統的大規模日常監測具有重要意義,后續應加強對底棲動物環境DNA方法標準化的研究。
環境DNA-宏條形碼技術監測在調查物種多樣性中具有諸多優勢,但在水質監測和評估方面尚未建立獨有的評價體系。傳統的水質監測和評價建立在形態學鑒定的基礎上,檢測的單位是生物個體,通過計算一系列以指示生物有無和豐度等為基礎的生物指數來進行[6]。而基于環境DNA-宏條形碼技術的分子監測得到的是大量DNA序列,以分子可操作單元(Molecular Operational Taxonomic Units,MOTUs)為單位。然而,MOTUs的劃分取決于主觀設定的閾值,不同的閾值劃分可導致MOTUs的數量和歸類顯著不同[67]。其次,由于缺少較為完整的數據庫,MOTUs中只有小部分能精確注釋到屬或種進而與傳統方法對接而被利用,使得大部分生物多樣性監測和生態學研究結果停留在MOTUs階段,難以將獲得的多樣性分布數據與現有的生物學和生態學指標結合起來,從而分析多樣性現狀、空間分布格局及脅迫因素的相關關系[83]。此外,環境DNA-宏條形碼技術較形態學方法更易檢測出稀有物種。這類物種可參考資料較少,未納入傳統的生物指數評價范圍,無法用于生物指數的計算。因此,環境DNA-宏條形碼技術在水質監測的廣泛應用尚需于建立起其獨特的評價體系[77]。
針對以上問題,可以考慮建立基于宏條形碼數據的生物指數及評價體系。直接利用序列的相對豐度和MOTUs數計算的生物指數,已在細菌microgAMBI[84]、硅藻[85-86]和海洋底棲動物gAMBI等[87-88]中得到應用,并已顯示出與傳統手段相似的生態評價效果[89]。同時,該方法可進一步與人工智能相結合,利用監督式機器學習(Supervised Machine Learning,SML),通過輸入大量序列和MOTUs數樣本訓練模型進行分子生物指數計算[85],進而用來評估水生態健康狀況和預測水體質量[90]。該方法能快速地從海量的宏條形碼數據中重建生態網絡,提升水質監測效率。未來,大數據和智能化技術為基礎的分子生物指數將成為水環境生態管理的重要指標。
宏線粒體基因組技術采用免PCR擴增法(如短核苷酸鏈捕獲探針法、全基因組鳥槍法等)直接對多物種混合樣品進行高通量測序,并通過生物信息學分析獲得樣品中物種的線粒體全基因組,進而對物種類群進行注釋[91]。線粒體基因組比傳統分子標記基因包含更長的序列片段,可大幅提高混合物種的鑒定靈敏度和分辨率。該方法的有效性已在無脊椎動物中已得到驗證[92]。如Tang等[93]開發出一套針對昆蟲的基于高通量Illumina測序平臺的宏線粒體基因組對混合物種相對豐度的分析流程,并利用該方法替代傳統的COI條形碼進行物種鑒定,研究顯示物種鑒定的位點信息擴大了約20倍。目前該方法由于測序成本高,對下游生物信息分析技術要求較高等問題,仍處于探索階段。但該方法解決了由于PCR擴增造成的物種偏倚性,同時獲得更多信息位點,可更靈敏和準確地評估物種組成,進而實現各物種生物量乃至相對豐度的分析[92],因此,宏線粒體基因組技術無疑是未來宏條形碼技術發展的重要方向之一。
環境DNA-宏條形碼相對于傳統生物調查方法的劣勢在于無法區分物種的生活個體和死亡個體,也無法判定檢測到的物種所處發育階段以及群體的性別比例等信息。近年來出現的環境RNA(Environmental RNA,eRNA)技術以環境中的RNA為研究對象,能夠彌補這一劣勢,不僅能夠判斷物種存在與否,還能更好地反映物種在環境中的活躍程度[94]。
少數結合eDNA和eRNA技術同時進行監測的研究發現,eDNA和eRNA兩者得到的MOTUs數以及物種數有較大差異[95]。研究表明eDNA對真菌有更高的檢測率,而eRNA對后生動物有更高的檢測率,其中19.5%的OTUs為eDNA特有,17.7%為eRNA特有[95]。由于只在eRNA數據中出現的OTUs有可能是某些生物代謝過量表達或者反轉錄和建庫過程中出現的假序列,因此一些研究者倡導聯合使用eDNA和eRNA的數據,以期更好地對生態環境進行評估[94,96]。由于RNA在環境中相對于DNA更容易降解,其特殊的樣品采集、保存、處理以及反轉錄等操作都會增加調查的難度和成本。但該方法對活體的檢測能力能夠進一步促進對生物環境和群落結構的認知,是一項非常有潛力的環境分析方法。