余海軍,王 茜
(天津農學院水產學院/天津市水生生態及養殖重點實驗室,天津 300384)
搖蚊屬(Chironomus)隸屬于雙翅目搖蚊亞科(Diptera:Chironomidae),該屬由德國昆蟲學家Mei?gen 于1803 年建立,迄今為止全世界已記錄種類達303 種;搖蚊屬的幼蟲可以生存于各種水體(尚未污染至嚴重污染的水體),其中寬葉搖蚊亞屬(Lobochi?ronomus)在缺乏營養的水體中較為豐富,并且能耐受酸性環境,另一些搖蚊亞屬喜歡生長在鹽分較高的環境中,對重金屬污染具有耐受性[1]。搖蚊屬部分種類雄成蟲能引起人類過敏性疾病;裸露在外和正在產卵的搖蚊屬種類可以成為新鮮水體中魚類(鱒魚)的主要食物來源;在日常生活中,某些垂釣者所用誘餌也為搖蚊屬幼蟲[2]。
搖蚊屬是搖蚊科最古老的屬之一,由于種種歷史原因,該屬的研究在世界上一直存在很大的爭議,屬內物種的分類地位至今沒有獲得廣泛的認可。依據中國搖蚊名錄中統計,中國已有該屬種類共23種,其中只有13種具有明確記錄,另包括3種可疑種和7種只進行鑒定而沒有正式發表的[3]。因此,搖蚊屬的物種界定一直存在爭議[3]。隨著DNA 條形碼的提出,其通過將基因組的標準部分提取一個或幾個相對較短的基因序列,用于識別物種[4,5];雖然使用DNA序列識別生物并不新穎[6],但DNA 條形碼能快速且可靠地識別所有生命形式的物種層次,包括動物、植物、真菌、微生物;其在論證物種群落組成、食物鏈和種內遺傳變異方面也有所研究[7-9];同時也扮演著生物安全和淡水生態監測中一個不可缺少的角色[10-13]。Lin 等[14]使用DNA 條形碼對長跗搖蚊屬(Tanytarsus)121 個形態種進行物種鑒定有效性分析,結果表明DNA 條形碼明確區分出94.6%的先前通過形態學研究分類的長跗搖蚊屬物種;Song 等[15]使用DNA 條形碼對多足搖蚊屬(Polypedilum)161 個形態種進行物種鑒定有效性分析,結果表明現已有研究中多足搖蚊屬94.4%的種類能有效被DNA 條形碼區分。
本研究基于編碼細胞色素C 氧化酶甲基I(COI)基因對搖蚊屬157 種的749 條DNA 條形碼進行分析研究,并利用相關軟件對搖蚊屬類群進行了遺傳距離和系統發育樹的分析,目的是探索DNA 條形碼在搖蚊屬物種界定方面的有效性,同時為完善搖蚊科DNA 條形碼數據庫提供參考,以填補當前國內該屬的研究空白。
研究中695 條DNA 條形碼數據為BOID 和Gen?bank 數據庫提供,54 條為收集樣本,采集于新疆、寧夏、海南、貴州、廣西、天津、浙江等地;采集方式包括燈誘、馬氏網、D 型網、掃網;將采集后的幼蟲樣本保存于95%乙醇中,成蟲樣本保存于85%乙醇中,并存于4 ℃冰箱,用于后續的形態學和分子學研究。
本研究通過Qiagen DNA Blood and Tissue kit 試劑盒,采用搖蚊成蟲的頭、胸部和幼蟲的腹部提取基因組DNA。提取后成蟲的頭、胸部保存到與翅、足和觸角一致的玻片標本上,用Euparal 樹膠封片,憑證標本均存于天津農學院水產遺傳育種實驗室。
使用通用引物LCO1490和HCO2198擴增COI條形碼[16]。PCR 擴增反應體系為25 μL,包含12.5 μL 2×Es Taq MasterMix,上下游引物各0.625 μL,dd H2O 8.75 μL,DNA模板2.5 μL。通過Master Cycler Gradient進行擴增,擴增程序為98 ℃預變性10 s,94 ℃5 min,35個循環(94 ℃1 min,51 ℃1 min,72 ℃1 min),最后72 ℃延伸5 min;10 ℃保存。PCR 擴增產物經1.5%瓊脂糖凝膠電泳檢測后,送北京六合華大基因科技股份有限公司進行純化測序。
各個基因片段都采用雙向測序,根據測序公司返回的測序結果,使用軟件SeqMan 7.1.0.44 觀察峰圖質量編輯序列[17]。將編輯好的FASTA 文件導入MEGA7.0 后選擇標準密碼子進行后續密碼子比對。
用MEGA7.0 軟件分析對比后,對各樣本堿基的組成、簡約信息位點、變異位點(Variable sites)、保守位點、自裔位點、平均堿基含量、遺傳距離和堿基轉換與顛換比值進行統計。選用Kimura-2-parameter(K2P)分子進化模型,節點處置信度為1 000,其他設置均為默認值,建立鄰接樹。
利用ABGD 軟件分析mOTU 的數量[18]:將編輯好的FASTA 文件在線提交到ABGD 網站(http://ww?wabi.snv.jussieu.fr/public/abgd/),選擇K2P 模型,種內差異先驗值P 為0.001~0.100,相對gap 寬度值X 為1.0,其余參數設置為默認值[15]。本研究的54 條DNA 序列及其相關信息均已上傳BOLD(http://www.boldsystems.org)數據庫。
研究共獲得搖蚊屬749 條DNA 條形碼,其中實驗 室 獲 得54 條DNA 條 形 碼,695 條 來 自BOID 和Genbank 數據庫,所有序列的長度均為658 bp,各堿基的平均含量分別為A=26.56%,T=37.67%,C=18.82%,G=16.92%,序列存在堿基的偏倚性,C+G的含量顯著低于A+T 的含量,特別是第三核酸位點A+T 的含量為85.15%。通過比對序列得出,信息位點有244個,占37.08%;變異位點有261 個,占39.67%。大部分的變異位點都集中在第三核酸位點,其比例為78.16%,表明在第三核酸位點上的堿基進化速率快。
在DNA 條形碼研究中,種內與種間遺傳距離的差異是一項非常重要的指標,當種間遺傳距離大于種內遺傳距離,就會形成一個明顯的空白區[15,19]。
實驗室共獲得54 條DNA 條形碼,形態鑒定約為12 種。結合BOID 和Genbank 數據庫已下載的數據,分析統計共獲得形態種約50 種。在MEGA 7.0軟件中,對所有形態種進行分組,即60 個組。種內遺傳距離為0~7.21%,平均值為1.10%;種間遺傳距離為0.2%~19.4%,平均值為14.25%;種間平均遺傳距離是種內平均遺傳距離的12.95 倍,因此本研究的749 條形碼數據存在明顯的空白區。
Hebert 等[5]通過對無脊椎動物及脊椎動物11門13 320 個物種進行了DNA 條形碼的研究,并提出了種間平均遺傳距離大于種內平均遺傳距離的10 倍作為區分物種的標準;隨著DNA 條形碼的深入研究,不同領域的學者對該標準進行了驗證,在搖蚊科不同類群中也出現了相應的研究,詳細結果見表1。

表1 搖蚊科不同類群遺傳距離比較
本研究采用DNA 條形碼分析中最常用的鄰接法,基于54 條DNA 條形碼明顯分離出13 個分類操作單元,代表搖蚊亞科中12 個已命名的物種,結果顯示DNA 條形碼的鑒別結果與形態學鑒定結果一致(圖1)。

圖1 54 條DNA 條形碼鄰接樹
ABGD 在線軟件通過比較種內和種間的遺傳距離,當種間最小遺傳距離大于種內最大遺傳距離時則出現空白區,DNA 條形碼空白區的存在很容易將物種分開(圖2)。

圖2 749條DNA條形碼基于K2P模型得到的遺傳距離分類
基于ABGD 在線軟件評估搖蚊亞科OTUs 的數量,即通過設定不同的閾值P,得到不同的OTUs 數量;隨著P 增大,OTUs 的數量減少(圖3)。當P 為0.002 637 時,749 條DNA 條形碼被分為104 OTUs;P 為0.026 827 時,被分為61 OTUs。即OTUs 的置信區間可為61~104,ABGD 所評估的OTUs 的數量略大于形態評估的種類。當P 為0.037 276 時,被分為58 OTUs,最為接近鄰接樹法評估的分子操作單元數量,因此ABGD 方法評估749 條搖蚊亞科DNA條形碼的遺傳距離閾值為3%~4%。

圖3 ABGD 在線評估OTUs的數量隨P 的變化
目前為止,DNA 條形碼技術存在5 種分析方法,即遺傳距離的分析、遺傳相似度的分析、系統發育樹的分析、序列特征的分析和統計分類法的分析[21],而在搖蚊DNA 條形碼研究中,主要是基于遺傳距離和系統發育樹的分析[22-28]。
基于遺傳距離的分析,即通過計算DNA 條形碼序列的遺傳距離,從而實現物種的區分,主要分析方法包括DNA 條形碼間隙和遺傳距離閾值分析[21]。DNA 條形碼間隙的一項非常重要指標是種內與種間遺傳距離的差異,當種間遺傳距離大于種內遺傳距離,就會形成一個明顯的空白區。本研究中種內平均遺傳為距離為1.10%,種間平均遺傳距離為14.25%,后者大約是前者的12.95 倍,形成了空白區。遺傳距離閾值是指物種在能形成空白區的前提下,使用物種種間遺傳距離與參比的遺傳距離閾值進行對比,當種間遺傳距離大于參比的閾值,則可以將物種區分為不同物種。閾值法在DNA 條形碼的物種鑒定中起著不可替代的作用,然而隨著DNA 條形碼的研究不斷出現,有學者發現不同物種DNA 條形碼的閾值各不相同,沒有一個統一的標準閾值[29]。BOLD 數據庫最初將遺傳距離1%作為生物物種的劃分閾值,由于其閾值寬泛,在一定程度上造成了物種的鑒別過度,導致同種異名的出現,為了不使物種混亂,近年來BOLD 系統默認鑒別閾值為3%[30];Meier 等[31]在對449 個雙翅目昆蟲物種的研究中,發現在物種劃分時,其遺傳距離大于3%;He?bert 等[5]以3%作為閾值對200 個鱗翅目昆蟲物種進行鑒別;蜉蝣目[32-34]、襀翅目和毛翅目[35,36]的物種以2%的閾值就能將物種區分開。本試驗研究的物種隸屬于雙翅目,通過使用ABGD 方法評估得到的遺傳距離閾值為3%~4%,與Meier 等[31]的研究相符,且與搖蚊亞科中其他屬研究的閾值差異不大,Song 等[15]區分多足搖蚊屬的遺傳距離閾值為5%~8%,Lin 等[14]區分長跗搖蚊屬的遺傳距離閾值為4%~5%。本研究是分析搖蚊屬物種的DNA 條形碼,其屬于搖蚊亞科中比較大的屬級之一,屬內物種的豐富度極高,但由于時間有限,加之中國地大物博,從而不能完全覆蓋已記錄所有物種和一些隱種;為此還需要更深入的研究,才能達到對中國地區搖蚊屬遺傳距離的準確界定。
系統發育樹能直觀地反映物種之間的親緣關系,本研究采用的是鄰接樹法,其基于遺傳距離和最小進化原理,通過自舉檢驗法進行聚類,并通過統計給定樹分支的可信度,得出最優樹[37]。在鄰接樹中,基于54 條來自實驗室的DNA 條形碼明顯分離出12 個物種,與形態學鑒定結果一致,匹配率達92.3%;通過結合BOID 和Genbank 數據庫中的695條DNA 條形碼,分離出50 個形態種,其中發現本試驗數據Chironomus pseudothummi 與參比數據Chi?ronomus sp.TE11 聚為一支(圖4),由于數據庫中參比數據Chironomus sp.TE11 不能提供證據標本與本研究比較,將基于本研究的數據將參比數據Chi?ronomus sp.TE11 修 改 為Chironomus pseudothummi,并將相關信息上傳至BOLD 數據庫。

圖4 Chironomus pseudothummi 類群鄰接樹
本研究通過采集中國地區的搖蚊屬昆蟲12 種54 個樣本,結合BOID 和Genbank 數據庫中的相關數據,共計749 條DNA 條形碼,運用ABDG 法分析該數據集遺傳距離,結果顯示種內與種間存在一個明顯的空白區;基于鄰接樹結果得出數據集分離出50 個物種,與傳統形態學鑒定一致,匹配率高達92.3%,并修正數據庫中Chironomus sp.TE11 為Chironomus pseudothummi,證明DNA 條形碼能有效鑒別搖蚊屬昆蟲。本研究的數據均已上傳中國DNA 條形碼數據庫,在豐富中國搖蚊科數據庫的同時,也為探索DNA 條形碼在搖蚊昆蟲中鑒別的有效性提供了基礎數據。