王茂元,賴銘勇,黃洪貴,吳妹英,田田,黃柳婷
(福建省淡水水產研究所,福建 福州 350002)
棘胸蛙Rana spinosa(俗稱石蛙、石鱗、石雞、石凍等)主要分布于中國南部以及越南北部丘陵山區[1]。棘胸蛙肉質鮮美、口感爽滑、營養豐富,具有較高的食用和醫用價值,是一種經濟價值較高的名貴珍品。據《本草綱目》記載:“石蛙主治小兒癆瘦,疳疾最良,產婦尤佳”,市場需求量大[2]。由于人為捕殺和自然環境的惡化,野生棘胸蛙資源遭到嚴重破壞,已被中國物種紅色名錄列為易危(Vu)等級[3]。近年來,隨著棘胸蛙養殖技術逐步成熟,養殖業者為擴大養殖規模,不斷進行頻繁引種、近親繁殖、累代人工養殖等,存在產量下降、品質退化、生物遺傳多樣性降低等諸多風險,嚴重危及棘胸蛙種質資源。因此,開展棘胸蛙養殖群體遺傳多樣性研究,從分子水平分析其種群遺傳結構特征和種群分化,對棘胸蛙的種質資源保護與科學開發利用具有十分重要的意義。
測序基因分型技術(Genotyping-by-sequencing,GBS)[4]是近年來常見的單核苷酸多態性標記(Single Nucleotide Polymorphism,SNP)開發最為有效、經濟的簡化基因組測序方法之一。其原理是采用限制性內切酶加標簽的方法,實現多樣本高通量平行測序[5],獲取目的物種在基因組層面上的高密度SNP標記。這些標記可用于遺傳圖譜構建[6,7]、種質鑒定[8,9]、基因多樣性[10,11]及群體遺傳學[12,13]等多方面的研究。本研究通過利用GBS 簡化基因組測序技術分析三明、龍巖和南平三個地區棘胸蛙群體的遺傳多樣性,旨在從分子水平揭示不同地域棘胸蛙的種群遺傳結構,進一步了解福建棘胸蛙的遺傳特征和種群分化,為棘胸蛙種質資源保護和遺傳改良提供參考。
2017 年10 月,于南平市正綠石蛙養殖有限公司取試驗用棘胸蛙23 只、三明市龍源棘胸蛙養殖場20 只以及龍巖市武平鑫旺質勝農業發展有限公司23 只,共計66 個樣品,平均體質量為(143.79±26.55)g,均為當地野生蛙群子一代3 齡蛙,分別命名為Rs-N、Rs-S 和Rs-L,采用低溫麻醉,使棘胸蛙進入休眠狀態,活體解剖取后肢于95%乙醇中保存備用。
1.2.1 DNA 的提取與純化
采用SDS 法提取棘胸蛙后肢的肌肉組織全基因組DNA,在1%的瓊脂糖凝膠上100 V 電泳40 min,檢測樣本基因組DNA 的完整性。用核酸濃度測定儀(BioDrop-μLite)測定其濃度和純度,質檢符合要求的高質量DNA 樣本進行后期的文庫構建和測序。
1.2.2 GBS 文庫構建
選擇質檢合格的基因組DNA 樣本,采用限制性內切酶ApekⅠ酶切基因組DNA。酶切后的片斷鏈接帶有內切酶序列末端的普通接頭和探針接頭,再將不同樣品的鏈接產物集中,通過凝膠電泳回收180~480 bp 區間的DNA 片段,再進行PCR 擴增,用磁珠富集純法,構建測序樣本文庫。
1.2.3 測序
構建好的文庫用Agilent 2100 Bioanalyzer 和QPCR 的方法進行質控,通過質控的文庫進行測序。利用第二代測序技術(Next-Generation Sequencing,NGS),在Illumina HiSeq4000 測序平臺上進行雙末端150 bp 測序。
1.3.1 數據處理
由測序所得的原始數據(Raw data)進行質控過濾,包括去除含有接頭序列的雙末端序列;去除N的含量超過該條序列長度比例的10%時的雙末端序列;去除低質量的序列(質量值Q≤5 的堿基占整條序列的50%以上的被定義為低質量序列);去掉無法依據接頭區分樣品的序列等。過濾后的數據進行后續分析。
1.3.2 聚類與比對
原始數據經過過濾后獲得的數據為有效數據(Clean data)。將每個樣本的有效數據分別與擬參考基因組非洲爪蟾Xenopus laevis 進行BWA 0.5.7 比對分析[14,15],bwa mem 使用參數:-M-R-R"@RG;ID:wHAIPI016410-33;PL:Illumina;PU:150211_I19 1_FCC6L7EANXX_L5_wHAIPI016410-33;LB:wHAI PI016410-33;SM:TEST1;CN:BGI"all.chrs.con.faread1.fq.gz read2.fq.gz >aligned_reads.sam。統計比對完成后,應用samtools eference{samtools1}軟件[16,17]根據基因組上的坐標對SAM 文件進行排序,并將其轉化成BAM 文件。
1.3.3 SNP 檢測
應用GATK 檢測SNPs,應用BGI 自主開發軟件對其進行注釋和統計[18,19],SNP 過濾參數為:"QD<2.0||FS>60.0||MQ<40.0||MQRankSum<-12.5||Read-PosRankSum<-8.0"。SNP 檢測的過程如下:(1)將所有樣本的比對文件bam 放到一個list 文件里面;(2)使用GATK 得到所有樣本的SNP;(3)使用GATK過濾得到的變異結果,選取可靠的變異結果。
1.3.4 群體遺傳學分析測定
基于各樣品的SNP 使用p-distance 方法計算各樣品的遺傳距離矩陣[20],用NJ 法構建群體間的系統發育樹。應用Admixture 軟件基于最大似然法對66 份棘胸蛙樣品進行主成分分析。
用1%瓊脂糖凝膠電泳檢測棘胸蛙樣本的總DNA(圖1)。結果顯示:基因組DNA 條帶單一清晰可見,無拖尾,表明基因組DNA 提取質量良好,無明顯降解、無RNA 和蛋白質污染,能夠滿足后期建庫測序要求。
通過Illumina HiSeq 測序平臺,下機原始數據(Raw data)按照探針拆分、過濾后獲得有效數據(Clean data)共66.79 G。三區市66 個棘胸蛙樣本測序數據統計見表1。由表1 計算得出,66 個樣品的平均原始數據約為6.98 M,平均有效數據約為3.69 M,且Q20 均在97%以上,Q30 均高于93%,GC 含量平均為46.70%,表明測序數據質量值高,能滿足后續信息分析。
以非洲爪蟾為參考基因組,應用BWA 軟件將所有的測序數據比對到參考基因組上。其基因組大小為2 734 636 505 bp,有效基因組大小為2 408 724 787 bp(參考序列中不含N),參考基因組GC 含量為34.34%。所有樣本的比對率介于58.40%和60.76%之間。
對3 個地區棘胸蛙所獲得的SNP 進行統計匯總(表2),為確保鑒定得到的SNP 的質量,對檢測到的SNP 進行過濾:(1)異置信度與質量深度的比值≥2;(2)使用Fisher's 精確檢驗來檢測鏈偏倚現象而得到的Fhred 格式的p 值,本試驗設置為≤60;(3)均方根值比對質量值≥40;(4)變異非參檢驗、秩和檢驗的零-均值(Zscore)和比對序列質量值的比值≥-12.5;(5)變異非參檢驗、秩和檢驗的零-均值(Zscore)和比對序列位置偏差的比值≥-8.0。最終經過過濾,3 個地區的棘胸蛙樣本共獲得396 969個SNP 位點,其中龍巖群體獲得SNP 位點數最多,為139 169 個;三明群體最少,為123 437 個SNP 位點。經過再次篩選檢測,3 個地區的棘胸蛙樣品共獲得8 615 個共有SNP 位點用于高級分析。

表3 3 個地區的棘胸蛙樣本基因分型結果統計Tab.3 Test result of genotypes of all samples spine frog Rana spinosa collected from three areas
由表3 可知,南平棘胸蛙群體(Rs-N)純合基因型的占比平均為99.77%,雜合基因型的占比平均為0.23%;三明棘胸蛙群體(Rs-S)純合基因型的占比平均為99.66%,雜合基因型的占比平均為0.34%;龍巖棘胸蛙群體(Rs-L)純合基因型的占比平均為99.65%,雜合基因型的占比平均為0.35%。3 個群體的純合基因型的占比都在99%以上,表明3 個群體種質都比較純,遺傳多樣性不夠豐富;南平群體的純合性占比最高,雜合性最低,表明南平群體種質更加純合,受到外源種質的污染更低,種質保存更好;龍巖群體雜合基因型占比較高,說明其群體的種質不夠純,但遺傳多樣性相對豐富。
為探究3 個棘胸蛙群體之間的遺傳分化程度,基于各樣品的SNP 使用p-distance 方法計算各樣品的遺傳距離矩陣,使用TreeBest 軟件中的鄰接算法,經過1 000 次迭代繪制系統NJ 發育樹(圖2)。
由圖2 可知:南平(Rs-N)23 個棘胸蛙群體中絕大部分個體聚成1 支,可以很好地與三明群體(Rs-S)和龍巖群體(Rs-L)區分開來,說明與這兩個群體的進化差異顯著,群體遺傳距離近,種質比較純,更適合作為種質選育材料;三明群體和龍巖群體個體間都不能完全聚成1 支,表現為群體中的個體相互摻雜聚成多個分支,呈現無規律分散,說明這兩個地區的棘胸蛙群體各自進化差異不顯著,群體種質不如南平地區的種純。
根據個體水平的遺傳距離對3 個棘胸蛙群體進行主成分分析(圖3)。由圖3 可知,3 個地區的棘胸蛙群體區分度不明顯,群體遺傳差異不顯著。
群體遺傳學及其分子系統進化等研究的基礎是遺傳標記技術。從20 世紀80 年代至今,DNA分子標記技術快速發展,由最初的限制性片段長度多態性(Restriction fragment length polymorphism,RFLP)[21]到隨機性擴增DNA(Random amplified polymorphic DNA,RAPD)[22,23],到現在應用十分廣泛的微衛星DNA(Microsatellite DNA)[24]以及單核苷酸多態性(Single nucleotide polymorphism,SNP)[25]。這些傳統的分子標記方法工作量大,比較繁瑣和耗時。近些年,隨著高通量測序技術(Next generation sequencing,NGS)的飛速發展,簡化基因組測序(Reduced-representation sequencing)技術避免了上述方法的不足,開始逐漸被應用于非模式生物的研究中[26-28],成為一種十分有前景的分子標記技術。
棘胸蛙作為一種經濟價值較高的易危蛙類,逐漸被人們所認識。國內外關于棘胸蛙的研究主要集中在分類與分布、形態學、繁殖與發育生物學、細胞遺傳學以及人工養殖技術等方面,而從分子生物學角度探討棘胸蛙種群遺傳結構和系統發生的研究還不多,并且多停留在線粒體DNA 標記技術[29,30]以及傳統的分子遺傳標記技術[31-33]。本研究突破傳統分子標記技術,首次將GBS 技術應用于棘胸蛙遺傳多樣性分析,在3 個地區的棘胸蛙群體中開發獲得8 615 個高質量SNP,其中以龍巖群體的SNP 最多,為3 589 個,南平群體的SNP 最少,為2 153 個,說明不同地區棘胸蛙群體SNP 數存在較大差異,這可能與其棲息的生態環境或人工干預不同有關;在同一群體不同個體間SNP 也不相同,這為今后開展品種選育提供更多的遺傳信息。
本研究中的群體進化樹表明,南平棘胸蛙群體主要聚在一起,與其地理分布一致,不存在與三明和龍巖個體聚類時混合交叉的現象,能很好地與三明和龍巖群體區分開。三明和龍巖群體在聚類時,個體混合交叉聚類現象明顯,不能很好地相互區分開。PCA 主成分分析表明,3 個群體的區分度均不明顯,雖然在聚類時呈現一定程度的分化,但未形成一定的地理隔離現象。
總之,本研究首次采用GBS 簡化基因組測序技術,揭示了福建省南平市、三明市和龍巖市3 個地區棘胸蛙群體的遺傳多樣性與遺傳結構關系。南平種群的遺傳多樣性已表現出雜合度低、遺傳多樣性下降等趨勢。系統發生樹以及PCA 主成分分析發現,南平種群與其他2 個種群的種群分化表現出一定程度的遺傳分化,但還未形成地理隔離。此次研究結果為制定有效的棘胸蛙種質保護措施,更好地保護與利用棘胸蛙種質資源提供了參考。但由于本次試驗受采樣困難、覆蓋度不高等客觀原因限制,研究結果還不夠深入,下一步將提高采樣密度,結合核基因標記技術,進行更深入、精細的研究分析,以期獲得更為詳細的棘胸蛙群體遺傳信息資料。