左佳俊,徐 倩,鄧元告,梁雪嬌,韓學凱,隋麗英
(亞洲區域鹵蟲參考中心,天津科技大學海洋與環境學院,天津 300457)
鹵蟲是一種廣溫性、耐高鹽的小型甲殼類浮游動物,分布于日曬鹽場和內陸鹽湖高鹽水域中.目前普遍認為鹵蟲包含8大種類[1],其中5種為來自舊大陸的A. salina、A. urmiana[2]、A. sinica[3]、A. tibetiana[4]和Artemiasp.[5],2種為來自新大陸的A. franciscana[5-6]和A. persimilis[7],1個孤雌生殖種,被命名為A. parthenogenetica[8].同時因地域和生境的不同,形成不同的品系.營養豐富的鹵蟲是水產苗種極佳的鮮活餌料.不同品系鹵蟲卵及其無節幼體的品系特征不同,在大小、營養和孵化特性等方面差別較大,而這些差異也決定了不同品系的鹵蟲作為開口餌料的效果不同[9].單一地理鹵蟲品系中存在著不同種的鹵蟲混雜共存現象,這給鹵蟲分類和系統進化研究工作帶來挑戰.
DNA條形碼是在種內遺傳變異始終低于種間遺傳變異的假設下,利用短而標準化的基因區域作為內部標記進行物種和品系鑒定[10].如今該技術已被應用于鹵蟲種的分類,特別是形態特征相似鹵蟲種的鑒別[11].目前,已有多種DNA條形碼技術被成功應用于鹵蟲的分類和系統發育研究.如線粒體DNA細胞色素氧化酶亞基I(COI)基因,因其序列相對保守,但又有足夠的變異,而成為鑒定鹵蟲種最常用的DNA條形碼[12-14].內部轉錄間隔區(ITS)序列為中度保守序列,ITS基因的轉錄產物在rRNA形成之前即被剪掉,不參與成熟核糖體的形成,因此面對的選擇壓力相對較小,進化速率快,被認為是在品系水平上對生物體進行分類的有效DNA標記[15-16]. 研究[17-19]表明ITS1可以作為鹵蟲系統發育研究的有效DNA標記.對于線粒體核糖體RNA基因,16S或12S核糖體RNA基因也被認為是鹵蟲系統發育研究的有效標記[18-20].16S rRNA與12S rRNA基因序列常常被單獨使用,但是一些物種間的進化關系僅顯示于某些基因中,而通過“聯合”途徑直接利用所有序列位點提供進化信息,系統發育分析結果可能會更接近于正確的物種樹.雖然目前關于DNA條形碼已有較多相關研究,但是將16S rRNA與12S rRNA基因區域視為一個整體作為鹵蟲DNA條形碼的研究則較少.同時也缺乏對這些不同DNA條形碼的比較研究,特別是在鹵蟲的分類和鑒定方面.
本研究旨在通過比較線粒體基因條形碼(COI基因和16S-12S rRNA基因)和核基因條形碼(ITS1基因)的基因片段,建立適合于鹵蟲種水平鑒定的DNA條形碼,并利用這3個標記對48個鹵蟲樣品進行遺傳距離和進化關系分析.
本研究所用48個鹵蟲卵樣本來自天津科技大學亞洲區域鹵蟲參考中心.4個參照鹵蟲卵樣本ARC1709、ARC1187、ARC1188和ARC1321取自比利時根特大學鹵蟲參考中心.稱量蟲卵樣品25mg,置于盛有10mL 3%稀釋鹵水的試管中進行水合;水合3h后,在充氣狀態下加入100μL脫殼液(8%的NaClO溶液與30%的NaOH溶液的體積比為20∶1)去殼,3min后用清水沖洗去殼卵,直至無NaClO氣味.將沖洗后的去殼卵收集于1.5mL EP管中,75%酒精沖洗1次,滅菌ddH2O沖洗3次.處理好的鹵蟲卵于-20℃臨時保存,并用于下一步DNA提?。?/p>
將處理保存的鹵蟲卵運用研磨法制備組織液,用TIANGEN?動物組織DNA提取試劑盒從組織液中提取全基因組DNA.利用Primer Premier 6.06(http://www.premierbiosoft.com/primerdesign/)軟件從GenBank數據庫中獲得鹵蟲的基因序列,設計引物.本研究將16S rRNA基因與12S rRNA基因結合在一起作為一個DNA標記,單獨設計擴增16S-12S rRNA基因片段的引物.擴增COI、16S-12S rRNA和ITS1基因片段的引物見表1.

表1 用于擴增線粒體COI、16S-12S rRNA基因區域以及核內ITS1基因區域的引物Tab. 1 Primers designed for amplifying COI,16S-12S rRNA and ITS1 gene
對COI基因片段、16S-12S rRNA基因區域以及核內ITS1基因進行PCR擴增,反應體系(25μL):1μL模板DNA,12.5μL PremixTaqDNA聚合酶(日本Takara公司),上下游引物各1 μL,9.5 μL無菌ddH2O.擴增反應:4℃預變性5min;94℃變性1min,退火1min(COI、16S-12S rRNA、ITS1基因的PCR退火溫度分別為54、56、58℃),72℃延伸1.5min,30個循環;72℃延伸10min.由于Shuanghu 2014、ARC1188、Yuncheng 2012、Inner Mongolia 2011、Naritusumu 2013、ARC1709和ARC1321樣品的ITS1基因序列剪接失敗,因此利用單個鹵蟲卵代替混合卵用于ITS1序列擴增,PCR反應中加入6μL模板DNA.PCR產物送華大基因公司測序.利用在線軟件 Cloud Splicing(http://customer.genomics.cn/customer-self/home#/show/pinjie-view)進行基因拼接.COI、16S-12S rRNA和ITS1基因片段測得的正反向序列成功拼接后,獲得的序列上傳到GenBank數據庫(表2),部分測序拼接未成功的則沒有上傳.

表2 實驗所用鹵蟲卵樣本信息Tab. 2 Information on Artemia cysts samples used in this study
通過MEGA 6軟件(http://www.mega.com/)[21]實現多序列比對、序列信息分析和Neighbor-Joining進化樹的構建.Neighbor-Joining進化樹構建使用最大組成似然法(maximum composite likelihood method),自展檢測(Bootstrap test)設置為1000次.利用Genedoc 2.7.000(http://www.softpedia.com/get/Science-CAD/GeneDoc.shtml)軟件進行多序列比對.整體轉化/顛換比率(R)計算公式為

式中:A、T、C、G為堿基數,K1和K2分別代表嘌呤和嘧啶的轉化/顛換比率.遺傳距離使用最大復合似然法計算,并使用Kimura 2參數模型[22]進行分析.
分別用3種DNA分子標記對48份鹵蟲卵擴增測序.擴增的COI、16S-12S rRNA和ITS1基因片段長度分別為1597bp、1238bp和1089bp.對各個序列進行比對和修剪后,用于分析的最終片段長度分別為1197bp、1007~1020bp和676~942bp.本研究使用的所有序列均已保存在GenBank數據庫中,通過BLAST序列比對結果見表2.BLAST結果表明,3種標記對鹵蟲種的鑒定結果一致.
分別對44份、47份和42份鹵蟲樣本進行COI、12S-16S rRNA和ITS1基因的拼接.在使用混合卵時,同一樣品的序列在電泳圖上存在有規則的重疊峰,導致無法提供參考序列.為了排除鹵蟲卵樣品被其他物種污染的可能性,進一步將單個鹵蟲卵作為實驗材料.同一樣本可獲得理想序列,只有少數樣本未能成功拼接,其中以ITS1測序樣本最多,這可能與ITS1基因非編碼區存在多拷貝有關.
分別對COI、16S-12S rRNA和ITS1基因片段進行多序列比對,未發現COI基因序列插入或缺失.與16S-12S rRNA基因序列中獲得的少量插入不同,序列插入在ITS1基因中頻繁出現.A. franciscana、A.persimilis和A. salina的樣本插入或缺失較長,插入最長的有28個核苷酸(圖1).

圖1 部分ITS1核苷酸序列的多重比對結果Fig. 1 Multiple alignment of partial ITS1 nucleotide sequences
各位點及密碼子各位置上核苷酸組成見表3.COI、16S-12S rRNA和ITS1基因的A+T含量分別為62.5%(24.0%+38.5%)、66.1%(30.9%+35.2%)和53.1%(24.9%+28.2%).COI和16S-12S rRNA基因序列有輕微的A+T偏好性.16S-12S rRNA基因的堿基頻率表現出A+T偏好性,相比于COI基因,15條16S-12S rRNA序列密碼子各位上堿基比例的多態性更明顯些.

表3 各位點及密碼子各位置上核苷酸組成Tab. 3 Percentage of nucleotide composition at all sites and three codon positions
序列的堿基替換矩陣見表4.與顛換替代率相比,轉化替代率占主導地位.各基因片段最大轉化/顛換值為COI基因片段的T對C為41.15%,16S-12S rRNA基因片段的A對G為32.95%,ITS1基因片段的T對C為19.17%.COI基因序列的轉化/顛換的比率為K1=17.759(嘌呤)和K2=32.257(嘧啶).整體轉化/顛換比率R值為13.41.16S-12S rRNA基因序列K1=8.326,K2=3.652,R=2.539.ITS1基因序列K1=2.131,K2=3.132,R=1.262.

表4 序列的堿基替換矩陣Tab. 4 Nucleotide substitution matrix for markers
基于3個基因片段的種間(對角線下)和種內(對角線)遺傳距離見表5.COI、16S-12S rRNA和ITS1序列的平均種內差異分別為0.6%、1.4%和0.6%.COI、16S-12S rRNA和ITS1序列的平均種間差異分別為16.2%、17.6%和9.1%.A. parthenogenetica、A.urmiana、A. tibetiana和A. sinica的種內和種間遺傳距離均較低.

表5 基于3個基因片段的種間(對角線下)和種內(對角線)遺傳距離Tab. 5 Interspecies(below diagonal)and intraspecies(diagonal)genetic distance based on three gene fragments of Artemia

續表
采用Neighbor-Joining方法構建基于3個標記的系統進化樹(圖2—圖4).

圖2 基于COI基因序列構建的系統進化樹Fig. 2 Phylogenetic tree based on COI gene sequences
根據COI基因系統進化樹(圖2),將樣本分為7大類群.其中A. parthenogenetica與A. urmiana聚集后再與A. tibetiana聚集,形成明顯的分枝.而A.franciscana和A. sinica聚集,再與上述3個種聚集.進化樹的基部位置為A. persimilis,其次為A.salina.基于16S-12S rRNA基因的聚類結果(圖3)與基于COI基因的結果比較相似.

圖3 基于16S-12S rRNA基因序列構建的系統進化樹Fig. 3 Phylogenetic tree based on 16S-12S rRNAgene sequences
與COI不同的是,A. franciscana先與A. salina和A. persimilis聚集,然后與A. sinica聚集,進化樹的根部也不再只是A. pesimilis.
基于ITS1基因構建的系統進化樹(圖4),A.franciscana、A. salina和A. persimilis的聚類情況與基于COI基因的結果相似.其余樣本的分類結果則不一致,尤其是A. parthenogenetica、A. urmiana、A.tibetiana和A. sinica雜亂地聚集而無法分開.

圖 4 基于ITS1基因序列構建的系統進化樹Fig. 4 Phylogenetic tree based on ITS1 gene sequences
一般而言,鳥類、哺乳動物等高等生物的線粒體DNA中G+C含量較高,而無脊椎動物等低等生物的線粒體DNA中A+T含量較高[23-24].鹵蟲作為低等浮游甲殼動物,其COI和16S-12S rRNA基因序列有輕微A+T偏好性,而核基因ITS1則無明顯A+T偏好性.替代率表示從一個堿基到另一個堿基的替代概率[25].眾所周知,在線粒體和核基因中,轉化替代比顛換替代更有優勢[26-27],而在線粒體DNA(mtDNA)中這一優勢更為顯著[28].在本研究中,3個組基因片段的轉換替換率均高于顛換替換率,這與上述原則一致.這可能是鹵蟲不同地方種群之間長期隔離沒有基因交換導致的,而這將有利于維持鹵蟲種群繁衍和進化的穩定性.序列比對發現相較于COI和16S-12S rRNA基因序列,在ITS1基因序列插入中頻繁出現,尤其A. franciscana、A. persimilis和A. salina的樣本插入或缺失較長,說明A. francis-cana、A. persimilis和A. salina三者間ITS1基因的種間差異較大,這也是相關研究認為ITS1基因在鹵蟲鑒定方面具有較高潛力的原因之一.
遺傳距離反映了不同物種間的遺傳關系.研究表明COI基因標記在不同物種間的遺傳差異應大于3%的閾值[11].本研究基于COI和16S-12S rRNA標記的種內距離數據均小于閾值3%,與理論相符.然而,由于某些物種間的親緣關系非常密切,因此基于3個標記的種內變異并非都小于3%,如ITS1標記的種內距離數據超過3%.此外,本研究中一些親緣關系密切的物種,3個標記的遺傳距離矩陣中存在種內差異和種間差異的重疊.如在原始COI遺傳距離數據中,樣本ARC1188與Inner Mongolia 2011的種內差異為2.1%,大于序列A. urmianaJQ975176.1與A.parthenogeneticaKF707700.1的種間差異(數據未列出),這一方面可能是個別鹵蟲種之間的親緣太近所致,另一方面可能是相關分子標記并不完全適用于近緣種間區分.
DNA條形碼在物種分類和鑒定中起著重要的作用.為了比較和確定3種DNA條形碼的有效性,構建鹵蟲系統進化樹并進行聚類分析.COI和16S-12S rRNA系統進化樹顯示,鹵蟲樣品被分為7個類群,與傳統分類一致,而基于ITS1系統進化樹的聚類則不同,將A. parthenogenetica、A. urmiana、A. tibetiana和兩個A. sinica樣本聚集.Baxevanis根據COI和16S-12S rRNA基因樹將不同地區的兩性鹵蟲樣本聚類為6個類群(A. urmiana、A. tibetiana、A. sinica、A.franciscana、A. persimilis和A. salina)[19].也有研究[17]表明,兩性鹵蟲根據COI序列可劃分為6個不同的遺傳類群,而ITS1樹則顯示不出完整的譜系,并由此推測孤雌生殖鹵蟲與A. urmiana和A. tibetiana的親緣關系非常密切.這與本研究結果是一致的.
盡管ITS1基因區域被認為是鹵蟲種分類的潛在工具[12],本研究中A. parthenogenetica、A. urmiana和A. tibetiana的種內和種間遺傳距離很低(0~0.7%),沒有顯示出ITS1基因的優勢.結果表明,只有A.franciscana、A. sinica、A. salina和A. persimilis之間存在較大的遺傳差異,而A. parthenogenetica、A. urmiana和A. tibetiana之間的種間差異不足以支持其在物種水平上分化.鄒山梅[29]在以ITS1基因序列作為DNA條形碼研究新腹足目貝類的系統發育關系時,也發現了ITS1序列沒能成功地完成亞種水平的鑒定,其未能將N. festiva和N. festivaⅡ區分開.這可能的原因是盡管核基因ITS1在面對巨大的選擇壓力時具有很大的突變率,但它沒有足夠的時間產生新的變異,A. parthenogenetica、A. urmiana、A. tibetiana之間具有一些共同的單倍體也說明了這一點.此外,已有研究報道,A. urmiana和A. tibetiana親緣關系非常密切,可能是一個復合種,A. tibetiana可能在這個復合種的起源和A. parthenogenetica的起源中發揮關鍵作用.這也部分解釋了為什么在本研究中A.urmiana、A. tibetiana和A. parthenogenetica關系如此相近以至于ITS1基因很難將其分開.此外,考慮到樣本量的影響,還需要大量的樣本進一步驗證ITS1基因用于鹵蟲種間和種內分類可行性.雖然應用于DNA條形碼工作中的基因很多,但是目前鹵蟲系統分類研究所用基因條形碼主要為COI、ITS1以及16S rRNA與12S rRNA.也有研究者利用核基因條形碼Na/K ATPase開展鹵蟲系統分類學研究[30],發現Na/K ATPase基因可以區分兩性生殖鹵蟲和孤雌生殖鹵蟲,但卻難以顯示完整的系統發育關系,這可能是由于線粒體基因比核基因具有更高的遺傳變異.后期還需要開發更多高效基因條形碼用于鹵蟲近緣種間或者品系鑒定研究.
本研究利用3種DNA條形碼對鹵蟲進化史進行研究.在COI和ITS1基因構建的系統進化樹中,除外群外,A. persimilis均位于基部位置,說明A. persimilis可能是一個原始分支.之前研究也通過構建COI基因的系統發育樹,發現A. persimilis與A.sinica、A. urmiana、A. franciscana相比更接近物種的祖先種[12].也有研究發現,在ITS1基因構建的系統發育樹中A. persimilis處于基部位置,而在COI基因樹中A. salina比A. persimilis更為原始.但在本研究16S-12S rRNA構建的進化樹中,祖先類群似乎是沿著兩個方向進化的,一支進化為A. persimilis和A.salina,然后是A. franciscana和A. sinica,另一支進化為其他物種.本研究基于COI和ITS1進化樹認為A. persimilis屬于一個物種的祖先群,這與大多數研究相一致.Barigozzi[31]研究表明,至少在距今較近的一段時期里A. persimilis具有廣泛的地理分布,這也間接證明了上述論點的可能性.
為了提高鹵蟲分類和鑒定的準確性和可靠性,本研究用多個DNA條形碼技術對中國、哈薩克斯坦、俄羅斯等國的48個取自日曬鹽場或鹽湖的鹵蟲標本進行分類和進化研究.每個DNA標記擴增的基因片段均大于1kbp,以確保DNA條形碼可獲得更多的遺傳信息.結果表明,COI和16S-12S rRNA序列對鹵蟲分類鑒定有效,而ITS1序列僅對A.franciscana、A. salina和A. persimilis等幾種鹵蟲鑒別有效.COI和ITS1基因構建的系統發育樹表明A.persimilis可能是一個原始分支,屬于一個物種的祖先群.研究結果可為鹵蟲樣本鑒定和鹵蟲資源保護與可持續開發利用提供重要工具和分析手段.