高養春, 李海濤, 王孝程, 孫 藝, 戰愛斌, Aileen TAN Shau-Hwai, 李宏俊,*
1 國家海洋環境監測中心,大連 116023 2 中國科學院生態環境研究中心,北京 100853 3 國家海洋局南海環境監測中心,廣州 510300 4 Centre for Marine and Coastal Studies, Universiti Sains Malaysia (USM), 11800, Penang, Malaysia 5 廣東省生物資源應用研究所,廣州 510260
浮游動物種類多、數量大、分布廣,是海洋生物多樣性的重要組成部分[1]。作為海洋初級生產力向高營養級傳遞的關鍵環節,浮游動物在海洋生態系統的物質循環和能量流動中起著重要作用,同時浮游動物對環境擾動非常敏感,其種類組成和群落結構可作為海洋生態系統結構變化的重要指示[2],可以為評價海洋生態系統環境質量和健康狀況提供指標[3]。浮游動物種類的準確鑒定是浮游生態學研究的基礎,傳統形態鑒定方法無法滿足現代海洋生態管理與保護自動化、標準化的數據需求,ZOOSCAN圖像識別[4]和DNA條形碼技術[5]等新技術的出現,極大推動了浮游動物分類學、生態學及相關領域的研究進展。
為加強海洋生態監測和強化海洋生態管理,我國自2003年開始組織建立海洋生態監控區并實施業務化監測,目前已經在我國近岸海域生態脆弱區和敏感區建立了21個生態監控區。海洋生物多樣性是生態監控區業務化監測的重要內容,其目的是掌握海洋生物種類和數量的分布及變化趨勢,監測對象包括浮游植物、浮游動物、底棲生物和游泳動物等[6]。浮游動物類群具有多樣性高的特點,傳統基于形態學的顯微計數法對鑒定人員的專業技能要求較高,并且不同鑒定人員的結果可比性較差,導致不同年際間的結果也缺乏可比性,這些缺陷導致基于形態學的鑒定方法難以滿足業務化監測的需求,因此,急需開發自動化、標準化的浮游動物種類鑒定技術[5,7]。此外,在海洋浮游動物中,隱存種廣泛存在,形態鑒定導致種類多樣性被低估[8]。隨著高通量測序技術的發展和浮游動物DNA條形碼數據庫的不斷擴充,分子鑒定為浮游動物種類鑒定及多樣性的評估提供了機遇,基于高通量測序的宏DNA條形碼技術為浮游生物物種、種群和群落的分子生態鑒定和生態監測提供了契機[9- 12]。在業務監測領域,分子鑒定技術在歐洲水框架指令(European Water Framework Directive)已經成為生物種類形態鑒定的有益補充,甚至在未來有望取代形態鑒定[13]。我國海域遼闊,跨越溫帶、亞熱帶和熱帶三個氣候帶,生物多樣性豐富,我國海洋生物多樣性監測急需準確和高效的技術方法。
自2003年Hebert等[14]提出DNA條形碼技術以來,DNA條形碼技術和數據庫不斷完善,目前生命條形碼聯盟(The Consortium for the Barcode of Life,CBOL)已經擁有來自40多個國家的120多個成員組織,生命條形碼數據系統(The Barcode of Life Data System,BOLD)已經收錄DNA條形碼序列超過600萬條。選擇合適的DNA條形碼是開展分子種類鑒定的基礎,需要滿足合適的變異速率、足夠的分辨率、保守的通用引物等條件[15]。在浮游動物DNA條形碼研究中應用較多的標記包括核糖體大亞基(Ribosomal Large Subunit, LSU)、核糖體小亞基(Ribosomal Small Subunit, SSU)和線粒體細胞色素氧化酶亞基I(Cytochrome Oxidase Subunit I, COI)等[9],不同條形碼在實際應用中各有優缺點。SSU因具有較快的進化速率且易于設計出覆蓋較廣物種類別的通用引物而廣泛應用于基于宏條形碼水生生物多樣性的研究中[16- 19]。
本研究在鴨綠江口海域采集了22份浮游動物樣品,分別利用宏條形碼鑒定方法和形態鑒定方法分析浮游動物群落組成,并通過比較兩種方法得出的多樣性指數來評價基于高通量測序的宏條形碼分子鑒定方法在我國海洋生物多樣性業務化監測中的應用潛力。
2017年8月沿鴨綠江入海口在中國海域布設22個浮游動物站位(圖1)進行采樣。使用淺水II型浮游生物網(網目孔徑0.160 mm,網口內徑31.6 cm,網長140 cm),依據《海洋監測規范》(GB 17378.7—2007)采集浮游動物樣品。每個站位采集的樣品進行充分混勻后均分成兩份:一份用5%甲醛固定用于形態學鑒定,另一份用同孔徑篩絹過濾掉海水后,加入無水乙醇固定用于分子鑒定。

圖1 鴨綠江口海域浮游動物樣品采集點Fig.1 Sampling sites along the coastal regions of Yalvjiang Estuary
形態鑒定:在體視顯微鏡下對浮游動物樣品進行分類鑒定和計數。
分子鑒定:分別從每份酒精(總體積100 mL)保存的樣品中分三次吸取浮游動物樣品,每次吸取10 mL,三次吸取的浮游動物樣品合并在一起,并用20 μm的篩絹過濾,除去酒精及殘留的浮游藻類等。采用DNA血液及組織提取試劑盒(Qiagen Canada lnc., ON, Canada)提取浮游動物基因組DNA,提取的DNA采用NanoDrop 2000(Thermo Scientific lnc., USA)進行質量評價。利用浮游動物通用引物(Uni18S:AGGGCAAKYCTGGTGCCAGC; Uni18SR:GRCGGTATCTRATCGYCTT)擴增核糖體小亞基的V4區[20],此引物已證實可以成功擴增幾乎所有的浮游動物類別[21]。為了將22份浮游動物樣品進行混合測序,我們對每份樣品聚合酶鏈式擴增(Polymerase Chain Reaction, PCR)的引物添加8堿基的條形碼,同時也便于后續數據的拆分。PCR反應體系如下(25 μL):1×Ex Taq Buffer(20 mmol/L Mg2+plus, TaKaRa, 大連,中國),5.0 mmol/L dNTP,15 pmol含barcodes的引物,100 ng 基因組DNA;PCR反應程序為95℃ 5min,35個PCR循環(95℃ 30s,50℃ 45s,72℃ 30s),72℃ 7min的延伸;為了保證取樣的均一性,每個樣品進行8次PCR重復。擴增產物經電泳質檢后用Qiagen PCR production purification kit進行PCR產物的純化,純化的DNA經NanoDrop 2000定量后進行樣品間的等量混合。構建好的文庫于Miseq PE300進行測序。
高通量測序下機數據用fastaq_strip_barcode.relablel2.py腳本進行數據的拆分并去除非生物學序列,如測序接頭、樣品標簽序列及引物。利用USEARCH V8.1對拆分的數據進行長度的修剪、質量過濾、操作分類單元(Operational Taxonomic Units, OTUs)聚類等處理。因源于Miseq PE300的序列右端的測序質量急劇下降,尤其是最后20 bp,故將所有數據右端的20 bp刪除,以提高序列的整體質量。質量過濾采用USEARCH V8.1推薦的方法,將期望誤差閾值設為1.0。采用97%的閾值進行OTUs的聚類。除此之外,在后續的數據分析中,我們采用不刪除OTUs單體、二體及三體的方式,因為這些物種可能是真實存在的物種,只是以低豐度的形式存在[20]。采用SEED V1.46[22]軟件對聚類出OTUs比對到美國國立生物技術信息中心(National Center for Biotechnology Information, NCBI)中的非冗余蛋白質序列數據庫(Non-Redundant Protein Sequence Database, NR)中進行物種的注釋。比對的結果只保留序列的覆蓋度大于85%、相似度大于90%的注釋結果[20]。
為便于宏條形碼鑒定方法與形態學方法的比較,我們選取海洋浮游動物中豐度較高的橈足亞綱(Copepoda)進行分析。采用PRIMER 6.0[23]計算形態學及分子鑒定物種的多樣性指數,包括物種豐度(Species richness)和香濃維納多樣性指數(Shannon Winner diversity index)。采用SPSS 18.0并應用Pearson相關系數對兩種方法多樣性指數進行相關性分析。

圖2 鴨綠江口22個浮游動物樣品高通量測序稀疏曲線 Fig.2 Rarefaction plots of 22 zooplankton samples based on metabarcoding methodsOTUs:操作分類單元 Operational Taxonomic Units
高通量測序總計產出291.6萬條序列,每個采樣點得到的序列數在7.3萬至27.0萬之間,平均為13.3萬條,數據已上傳到NCBI (SRA accession: PRJNA490610)。經去除重復序列、OTUs聚類等步驟,共獲得1957個OTUs。序列數與物種數(OTUs)關系的稀疏曲線(圖2)顯示:隨著序列數的急劇升高,物種數增加的速度逐漸變慢,表明各采樣點的測序量足夠覆蓋大部分的種類。將獲得的OTUs與NR進行比對,成功注釋1502個,其中229個OTUs被注釋為浮游橈足亞綱(Copepoda),隸屬于4目、23科、32屬(表1)。共鑒定浮游橈足類1069394條序列,其中哲水蚤目(Calanoida)包含12屬(57.628%),劍水蚤目(Cyclopoida)包含6屬(36.359%),鞘口水蚤目(Poecilostomatoida)包含12屬(5.406%),管口虱目(Siphonostomatoida)包含2屬(0.607%);并且樣點內哲水蚤目和鞘口水蚤目相對豐度沿采樣點1至12逐漸升高,而劍水蚤目和管口虱目相對豐度沿采樣點1至12逐漸下降(圖3)。在這些屬中,豐度最高的種類分別為擬哲水蚤屬(Paracalanus)和長腹劍水蚤屬(Oithona),且樣點內擬哲水蚤屬(Paracalanus)的相對豐度沿采樣點1至22逐漸升高,而長腹劍水蚤屬(Oithona)具有逐漸降低的趨勢(圖4)。
基于形態學特征,共鑒定出橈足綱3目、5科、5屬、6種(表1;圖5;圖6)。哲水蚤目(Calanoida)包含4屬(66.67%),劍水蚤目(Cyclopoida)和鞘口水蚤目(Poecilostomatoida)各包含1屬(16.67%);且哲水蚤目(Calanoida)的相對豐度沿采樣點1至12逐漸降低,而鞘口水蚤目(Poecilostomatoida)逐漸升高(圖5)。其中豐度最高的物種是擬哲水蚤屬(Paracalanus),在大部分采樣點擬哲水蚤屬(Paracalanus)所占的比例均較高,少部分采樣點(7和8)長腹劍水蚤屬(Oithona)所占的比例較高(圖6);并且擬哲水蚤屬(Paracalanus)的相對豐度沿采樣點1至12逐漸降低,而屬于鞘口水蚤目(Poecilostomatoida)的劍水蚤屬(Corycaeus)相對豐度逐漸升高(圖6)。

表1 基于宏條形碼分子鑒定和形態學鑒定的浮游橈足類

圖3 在目水平分子鑒定物種相對豐度Fig.3 Histogram of relative abundance for each sampling site based on metabarcoding method at the order level

圖4 在屬水平分子鑒定物種相對豐度Fig.4 Histogram of relative abundance for each sampling site based on metabarcoding method at the genera level

圖5 在目水平形態鑒定物種相對豐度Fig.5 Histogram of relative abundance for each sampling site based on morphological method at the order level

圖6 在種水平形態鑒定物種相對豐度Fig.6 Histogram of relative abundance for each sampling site based on morphological method at the species level
基于高通量測序的宏條形碼分子鑒定方法每個采樣點平均鑒定出19個屬,樣點間的屬數變異為15—22,而基于形態學方法每個采樣點平均鑒定出4個屬,樣點間的屬數變異為3—5(表2)。利用形態學方法鑒定出來的大部分類別(目:100%、科:80%、屬:80%)同時能用分子方法鑒定出來,而分子方法鑒定出的大部分類別(目:25%、科:83%、屬:88%)卻不能用形態學方法鑒定出來(表1)。對于物種多樣性指數,基于分子鑒定的物種豐度指數均高于基于形態學特征鑒定的結果(圖7,表2)。同時,基于分子方法鑒定的平均香濃維納指數(1.52±0.23)也高于基于形態學鑒定的結果(1.32±0.32)(表2)。對于大部分采樣點,基于分子方法鑒定的香濃維納指數與基于形態學方法鑒定得出的香濃維納指數差異較小,只有在較少的采樣點(1、2、3、4及15)中發現兩種方法鑒定的結果存在較大的差異(圖8)。

表2 基于宏條形碼分子鑒定和形態學鑒定浮游橈足類在屬水平的多樣性指數

圖7 分子和形態鑒定結果的物種豐度比較 Fig.7 Variation of species richness index along the sampling sites based on both metabarcoding and morphological methods

圖8 分子鑒定和形態鑒定結果的香濃維納指數比較 Fig.8 Variation of Shannon-Wiener index along the sampling sites based on metabarcoding and morphological methods
而在一致性方面,對于所有采樣點,基于分子鑒定與基于形態鑒定得出的多樣性指數沒有顯著的一致性(r=0.080,P=0.723,圖9)。但當排除香濃維納指數差異較大的少量采樣點(1、2、3、4及15,22.73%),只關注差異較小的多數樣點(77.27%)時,基于分子與基于形態的香濃維納指數呈現顯著的一致性(r=0.542,P=0.024,圖10)。

圖9 基于所有采樣點分子鑒定與形態鑒定的香濃維納指數相關性Fig.9 Correlation of Shannon-Wiener index between metabarcoding and morphological methods for all sampling sites

圖10 基于大部分采樣點(77.28%)分子鑒定與形態鑒定的香濃維納指數相關性Fig.10 Correlation of Shannon-Wiener diversity index between metabarcoding and morphological methods for most sampling sites (77.28%)
DNA宏條形碼技術基于標準化DNA序列進行PCR擴增、高通量測序和比對,可以實現不同物種的批量鑒定。伴隨著高通量測序技術的發展和DNA條形碼數據庫的擴充,宏DNA條形碼可以同時完成批量樣品中批量物種的分子種類鑒定,從而實現全面、快速評估群落種類組成和物種多樣性的目的。利用DNA宏條形碼進行種類鑒定需要選擇合適的標準序列和相應的通用引物,標準序列需要具備足夠的種間DNA變異,通用引物需要實現不同類群的高效擴增。由于DNA條形碼在不同類群的分辨率和通用性不同,目前尚未找到適用于所有分類階元的通用引物。海洋浮游動物DNA條形碼研究常用的標準序列包括LSU、SSU和COI等[12]。雖然COI具有較高的物種分辨率,但因其物種間具有較大的序列變異,導致無法在較廣的分類單元上設計出通用引物,這限制了其在宏條形碼分子鑒定中的應用。盡管SSU物種分辨率不及COI,但可以設計出通用性較好的引物,可較好地用于物種多樣性的評價。本文選取的Uni18S-Uni18SR[20]已廣泛應用于海洋及淡水生物多樣性的評價中[24-25]。雖然此引物并不能將所有物種鑒定到種的水平,但對大部分種類而言鑒定到科及屬水平具有較高可信度[20-21]。利用此引物進行宏條形碼的測定及分析鑒定出了大量的物種類別,宏條形碼分子方法鑒定出的物種豐度明顯高于形態學鑒定出的物種豐度:基于分子鑒定出的橈足類的類別在科及屬水平上明顯多于形態學鑒定,發現了基于形態學特征無法鑒定出的管口水蚤目,且鑒定出了基于形態學特征無法分類的幼蟲期橈足類。此結果與國外在浮游動物、底棲生物及浮游藻類的研究結果一致[26-28]。這些發現表明基于高通量測序的分子鑒定方法可揭示出傳統基于形態學特征鑒定方法無法揭示出的物種多樣性。
本研究中,雖然對于小部分采樣點(22.73%),基于分子的多樣性指數高于形態鑒定出的多樣性指數;但對于大部分采樣點(77.27%),基于分子的多樣性指數均低于形態鑒定出的多樣性指數,并且變化趨勢呈現顯著的一致性(r=0.542,P=0.024)。國外的研究中也普遍發現類似的結果[29-30]。Lejzerowicz等[30]在蘇格蘭的利斯莫爾島海域采集了10個樣品,通過比較基于宏條形碼和形態學鑒定的結果發現,基于兩種方法得出的生物評價指數(Infaunal Trophic Index 和AZTI Marine Biotic Index)具有較高的一致性(P< 0.01)。這些結果表明在海洋浮游動物多樣性評價中,分子鑒定的結果與形態鑒定的結果具有較好的可比性。
與形態學鑒定方法相比,分子鑒定除了具有省時、省力、不需要專業的形態學鑒定人員等優點外[12,18, 30-31],還具有能鑒定出光學顯微鏡下難以發現的物種的優點,致使鑒定出的種類豐度明顯高于形態學鑒定出的結果。本研究中利用形態鑒定得到的分類階元多數(目:100%、科:80%、屬:80%)能用宏條形碼方法鑒定出來,而分子方法鑒定得到的分類階元多數(目:25%、科:83%、屬:88%)卻未能用形態鑒定出來基于宏條形碼方法得出,此結果進一步證實了這個觀點的正確性。且宏條形碼鑒定方法已在國外的海洋生物多樣性評價中得到了廣泛的應用[16- 18],在我國海洋浮游動物多樣性評價中具有較高的應用潛力。
在海洋浮游動物多樣性評價所需成本方面,我們估算了鑒定每份浮游動物樣本所需的時間成本和經濟成本(表3),根據國家海洋局印發的《海域使用論證收費標準(試行)》,對于浮游動物的鑒定,每個站位的樣品(包含I型網和II型網兩份樣品)鑒定需要花費1500元,每個樣品的鑒定費用也將約在750元。而利用宏條形碼分子鑒定,一個站位的花費僅為103—203元(建庫費用60元+Miseq測序費用135元/Hiseq測序費用35元+分析費用8元),約是采用形態學方法所需花費的1/13—1/27之間。而隨著測序成本的不斷降低及形態學鑒定所需人工成本的不斷增加,這種差距還將持續增加。根據我國海洋監測機構反映,完成1個浮游動物樣品物種鑒定及多樣性分析的時間為1.5—3個小時,而利用宏條形碼技術完成22份浮游動物樣品分析總共需要一個普通環境監測人員20個小時(8個小時建庫+12小時數據分析),平均每份樣品花費約1小時。從時間成本考慮,利用宏條形碼技術所需的時間僅為形態學鑒定的1/3—1/2,表明利用宏條形碼技術極大地提高了浮游動物分析工作的效率。

表3 基于宏條形碼和形態學鑒定方法的每份浮游動物樣本所需金錢成本與時間成本
目前DNA宏條形碼鑒定技術在我國海洋浮游動物業務化監測應用,仍有幾個方面有待于提升。首先,同一個種的不同地理種群會因遺傳漂變、建群者效應及自然選擇等進化生態學過程發生遺傳分化[32-34],尤其在較大的地理尺度上如大洋、區域甚至國家之間[35]。如果遺傳分化發生在宏條形碼所選擇的引物區間,歐美國家所構建的參考數據庫可能就會不適用于我國。所以,宏條形碼鑒定方法可靠的前提是建立我國甚至我國特定海域的條形碼數據庫。其次,本研究中,對于浮游動物類群,之所以一部分形態學鑒定出的種類沒有被宏條形碼方法鑒定出,可能是因為數據庫中沒有對應的物種序列,也有可能是因為本研究中所采用的宏條形碼引物序列并不能與這些物種的相應的序列很好的匹配。所以,在今后的研究工作中應根據我國海域浮游動物條形碼的序列特征,對現有的宏條形碼引物進行改進或者重新設計適應于我國海域浮游動物分子特征的引物,以提高宏條形碼方法鑒定物種類別的覆蓋度,另外,構建本地化DNA條形碼數據庫也是開展基于DNA條形碼浮游動物種類業務化監測的必要條件。最后,在PCR擴增及高通量測序過程均會產生假陽性及假陰性的錯誤,雖然PCRfree建庫策略能有效減少假陽性的錯誤[21],但在高通量測序過程中容易丟失豐度較低的物種而引起假陰性,在未來的生物信息學領域,通過改進現有軟件或開發新軟件有望降低這些過程所引起的錯誤。
現階段,形態學鑒定方法是我國海洋浮游生物多樣性監測的主要手段。因其在生物多樣性評價中存在許多方面的缺陷,尤其比較耗時費力,致使很難在短期內完成大尺度多樣品的多樣性評價工作。而基于高通量測序的宏條形碼方法提供了可供選擇的海洋浮游生物多樣性快速評價方法。雖然宏條形碼技術具有其固有缺陷,如不能反映生物的生長階段,無法準確對浮游生物進行準確定量等。但因其具有鑒定效率高、花費較低等優點使其有望在未來成為一種互補甚至替代現有評價方法的技術體系。隨著宏條形碼技術體系的不斷完善,我國有可能在海洋浮游生物多樣性評價方法方面打破既有的體系,形成新的技術體系及規范。