陳雪峰 王春琳 李榮華 顧志敏 徐賓朋 程海華 彭 菲
(1. 浙江省淡水水產研究所, 國家羅氏沼蝦遺傳育種中心, 湖州 313001; 2. 寧波大學海洋學院, 寧波 315211)
羅氏沼蝦(Macrobrachium rosenbergii)食性廣、病害少、生長快、營養價值高、經濟價值高,是世界多地的重要養殖品種之一。我國于1976年從日本引進該蝦, 經40多年的發展, 羅氏沼蝦產業處于世界第一。據不完全統計, 至2020年, 中國苗種年生產量達到300億尾, 養殖面積超過300 km2,總產量超過15×107kg。產業的穩定快速發展得益于中國羅氏沼蝦育種項目的開展及選育良種的產業化推廣。浙江省淡水水產研究所自2006年開始以緬甸野生群體、浙江養殖群體和廣西養殖群體為基礎群體, 運用BLUP育種技術, 經過連續4年的家系選育, 2009年, 獲得了第一個經中國水產原種和良種審定委員會審定通過的羅氏沼蝦選育新品種“南太湖2號”(品種登記號: GS-01-001-2009), 經遺傳改良后, 羅氏沼蝦“南太湖2號”的生長速度和成活率顯著提高, 與商業苗種相比生長速度提高36.87%, 成活率提高7.76%。隨后, 以生長速度、成活率及餌料利用率為育種目標進行繼續選育, 至2018年, 核心育種群更新至第13代, 選育世代全世界最長。
然而, 傳統的選擇育種是基于性狀表型值進行選育, 育種周期長、效率低, 隨著現代分子生物學技術的發展, 高通量開發分子標記越來越便利, 分子標記輔助育種成為熱點, 與常規育種相比, 該技術有效地克服了常規育種過程中所采用的形態學標記存在數目少、受環境影響較大和不易直接選擇等缺點, 從而可加速育種進程, 提高育種效率, 縮短育種年限[1]。分子輔助育種中應用最多的一類位點是微衛星位點。微衛星(Microsatellites)又稱簡單重復序列(Simple sequence repeats, SSR), 具有多態性高、信息含量豐富和共顯性遺傳等優點[2,3], 被廣泛應用于水產動物的種質鑒定、遺傳結構分析、遺傳連鎖圖譜構建和QTL定位等方面[4—6]。傳統SSR標記的開發是通過構建基因組文庫進行篩選, 方法操作繁瑣, 費時費力且費用昂貴, 在一定程度上限制了SSR標記的研究與應用[7]。近年來, 高通量測序技術的發展為全基因組水平篩選短串聯重復序列變異提供了基礎, 已有大量基于高通量測序數據開發SSR標記的成功案例[8—10]。基于轉錄組測序結果挖掘SSR標記已在黃姑魚(Nibea albiflora)[11]、黃唇魚(Bahaba taipingensis)[12]、翹嘴鱖(Siniperca chuatsi)[13]、東海帶魚(Trichiurus lepturus)[14]、雙須骨舌魚(Osteoglossum bicirrhosum)[15]、大口黑鱸(Micropterus salmoides)[16]、口蝦蛄(Oratosquilla oratoria)[17]、紅螯螯蝦(Cherax quadricarinatus)[18]等水產動物中開展并獲得大量群體特異性位點。國內外在水產動物中篩選與生產性能相關微衛星標記的工作也得到了廣泛開展。Cnaani等[19]篩選得到與羅非魚(Oreochromis mossambicus)體長相關的微衛星標記。Lu等[20]篩選得到與文蛤(Meretrix meretrix)生長相關的微衛星標記; Hsu等[21]發現了石斑魚(Epinephelus tukula)中與生長性狀相關的微衛星標記。國內學者在凡納濱對蝦(Litopeneaus vannamei)[22]、中國對蝦(Fenneropenaeus chinensis)[23]等品種中均發現了與生長相關的微衛星標記。有關羅氏沼蝦SSR相關的研究工作已有開展, 但大多集中在群體遺傳結構評估方面,目前尚未見運用SSR標記對羅氏沼蝦生產性狀進行關聯分析的研究。本研究對轉錄組中的SSR位點進行了多態性篩選, 而后分別以家系、群體為研究對象, 進行SSR標記與體質量關聯分析, 以期找到與體質量相關的SSR標記, 為今后開展羅氏沼蝦的分子標記輔助育種打下基礎。
2017年4月, 從浙江國家級羅氏沼蝦遺傳育種中心內核心育種群中選取1尾雄蝦、1尾雌蝦進行交配, 構建全同胞家系群(FS)1個。通過群體隨機交配, 構建孟加拉封閉群(MJL)1個, 該群體為2014年從孟加拉國天然河流中引進, 引進后至本實驗前共經歷3代人工隨機交配。兩個群體于5月份繁殖出苗, 設置養殖密度2萬/畝, 兩個群體分別養殖于2個池塘, 養殖4個月, FS群體隨機起捕119尾蝦, MJL群體隨機起捕199尾蝦, 測定每尾蝦的體質量。剪取肌肉組織, 固定于95%的乙醇中用于DNA提取。
2017年本實驗室采用Illumina HiSeq? 4000高通量測序平臺對羅氏沼蝦卵巢組織進行轉錄組測序, 原始數據經經質控、組裝后, 拼接獲得95379個Unigenes, 采用MISA軟件對Unigenes進行SSR檢測[24]。選取重復次數在5次以上的三堿基、四堿基或五堿基重復序列, 使用Primer Premier5.0軟件進行引物設計, 隨機選擇10個個體進行多態性SSR位點篩選, 引物由生工生物工程(上海)股份有限公司合成。
采用TaKaRa基因組抽提試劑盒對兩個群體的樣品進行基因組DNA抽提, 具體操作方法參照說明書, 1%的瓊脂糖凝膠電泳和分光光度計檢測DNA質量和濃度, DNA樣品保存于–20℃備用。
PCR反應總體積為25 μL, 模板為基因組DNA 50 ng, 其他組分根據Taq酶(TaKaRa)說明書要求,在正向引物5′端標記熒光素FAM(藍色)。PCR反應條件為: 94℃ 2min; 94℃ 30s, 60℃ 45s, 72℃ 2min, 30個循環; 72℃延伸10min; 4℃保存。用ABI3730XL(美國應用生物系統公司)DNA分析儀對PCR產物進行自動熒光檢測。
用Genemapper4.0軟件生成每個位點的圖譜文件, 測出PCR擴增產物長度與熒光強度峰值, 獲得每個位點的基因型。Popgene1.32計算等位基因數(Numbers of the alleles,Na)、有效等位基因數(Numbers of the effective alleles,Ne)、期望雜合度(Expected heterozygosity,He)、觀測雜合度(Observed heterozygosity,Ho)及Hard-weinberg平衡檢驗(P值)[25]。參照Botstein等[26]的方法計算多態信息含量(Polymorphism information content,PIC)。利用GenAlEx6.5軟件進行群體間非偏Nei遺傳距離分析、群體配對遺傳分化系數Fst檢驗、群體配對GStatistics分析、分子方差分析(Analysis of molecular variance, AMOVA)及主坐標分析(Principal coordinates analysis, PCoA)。利用structure2.3.4軟件計算群體結構, Structure Harvester在線工具(http://taylor0.biology.ucla.edu/structureHarvester/)確定最優K值, distruct1.1軟件構畫群體結構圖。
利用SPSS15.0軟件進行統計分析, 首先對表型數據正態性檢驗, 應用一般線性模型(General Linear Model, GLM)進行微衛星位點與體質量關聯分析, 并對同一位點不同基因型進行多重比較(LSD)。由于一些位點中某些基因型頻率太少, 不具統計分析意義。因此在實際統計分析中, 每種基因型的樣本數出現4次以上觀察值時才被考慮。
119尾FS群體質量介于3.12—53.82 g, 平均體質量(24.18±1.13) g; 199尾MJL群的體質量介于2.30—47.47 g, 平均體質量(16.65±0.69) g。體質量顯示出連續變異的特點, 表明體質量性狀受多基因控制為典型的數量性狀。通過SPSS軟件進行正態性檢驗, FS群體體質量性狀符合正態分布, MJL群體體質量性狀不符合正態分布, 為了下一步分析,將MJL群體體質量進行了SQRT轉換, 轉換后體質量的分布符合正態分布(表 1)。

表1 體質量(克)的表型數據及正態分布檢驗Tab. 1 Phenotype data of body weight (in g) and normal distribution test
共查找到18592個由1—6個核苷酸重復序列組成的SSR位點, 占Unigenes總數的比例為19.49%。單核苷酸重復類型比例最高, 達52.71%, 隨后依次為二、三、四、五和六核苷酸重復類型, 占比分別為32.61%、15.90%、0.80%、0.05%和0.04%。在單、二、三核苷酸重復類型中, 數量最多的重復基元分別為A/T(9407個)、AG/GA(2244個)、AAT/ATA/TAA(344個), 數量最少的重復基元分別為C/G(392個)、CG/GC(12個)、CGG/GGC/GCG(15個; 圖 1)。隨機選取了63個位點進行了多態性篩選, 結果31個位點表現出多態, 32個位點沒有多態性, 多態位點比例占49.2%(表 2)。

表2 多態性位點篩選結果Tab. 2 Screening results of polymorphism loci

續表2

圖1 羅氏沼蝦轉錄組中Unigenes的SSR分析結果Fig. 1 SSR analysis results of unigenes in transcriptome of M.rosenbergii
在31個多態位點中, 選取19個位點進行遺傳多樣性分析。用19個微衛星引物對FS群體與MJL群體進行PCR擴增, 結果顯示, 在FS群體中位點MR32與MR45沒有多態性, 整個群體中共檢測到40個等位基因, 平均等位基因數為2.1053, 有效等位基因數為1—2.6454, 平均值為1.6983, 觀測雜合度為0—0.9076, 平均值為0.4525, 期望雜合度為0—0.6246, 平均值為0.3804, 多態信息含量為0—0.5516, 平均值為0.3076, 有2個位點PIC值大于0.5, 2個位點PIC值小于0.25,15個位點的PIC值在0.25—0.5, 19個位點中, MR30與MR45位點符合Hard-weinberg平衡, 其余17個位點顯著(P<0.05)或極顯著(P<0.01)偏離Hard-weinberg平衡; 在MJL群體中共檢測到65個等位基因, 平均等位基因數為3.4211, 有效等位基因數為1.0901—4.2309, 平均值為2.0941, 觀測雜合度為0.0854—0.6734, 平均值為0.4105, 期望雜合度為0.0826—0.7656, 平均值為0.4496, 多態信息含量為0.0805—0.7267, 平均值為0.3882, 6個位點PIC值大于0.5, 4個位點PIC值小于0.25, 9個位點的PIC值在0.25—0.5, 19個位點中,MR08、MR10、MR17、MR22、MR27、MR30、MR34、MR46與MR65位點符合Hard-weinberg平衡, 其余10個位點顯著(P<0.05)或極顯著(P<0.01)偏離Hard-weinberg平衡(表 3)。

表3 兩個群體遺傳多樣性分析Tab. 3 Analysis of the genetic diversity of the two populations
利用GenAlEx6.5軟件分析, FS群體與MJL群體的Nei非偏遺傳距離為0.158, Nei非偏遺傳一致性為0.854。配對G-Statistics分析中Gst指數和G′st(Nei)指數分別為0.094 (P=0.001)和0.172 (P=0.001)。分子方差分析估測了由多位點多態性信息造成的方差的主要成分及各成分占比。估測總分子方差為4.868, 其中群體間差異導致的分子方差組分、群體內個體間差異導致的分子方差組分和個體內差異導致的分子方差組分及其占比分別為0.820(17%)、0.000(0%)和4.049(83%; 表 4)。F檢驗計算獲得的Fst、Fis和Fit分別為0.169(P=0.000)、–0.005(P=0.634)和0.165(P=0.000)。基因流(Nm)為1.229。

表4 分子方差分析Tab. 4 Analysis of molecular variances (AMOVA)
主坐標分析計算獲取的前3個主成分占比分別為20.64%、8.95%和7.79%。通過第一個主成分組分, 能夠將FS群體和MJL群體區分為兩個集團, 但區分距離較小。
群體結構分析顯示, FS和MJL兩個群體的多態性位點至少可以溯源至3個來源(最優K值為3),MJL群體結構較復雜, 多數多態性位點來源自3個來源的其中2個, 群體雜合度高, 存在大量高雜合度的個體; FS群體結構較簡單, 絕大多數多態性位點來源自3個來源的另外一個(相對于MJL群體), 群體純和度較高。
利用GLM模型進行SSR位點與羅氏沼蝦體質量關聯分析, 結果顯示, 19個SSR位點與FS群體體質量沒有相關性, 而在MJL群體中, MR28、MR32、MR34和MR45等4個SSR位點與體質量顯著相關(P<0.05; 表 5)。在MJL群體中對具有顯著差異的SSR位點進行不同基因型與體質量多重比較, MR28位點277/285基因型個體體質量均值極顯著高于277/289和285/285基因型個體(P<0.01), 顯著高于285/289、273/289、270/273和285/293基因型個體(P<0.05); MR32位點266/266和266/270基因型個體體質量均值顯著高于270/270基因型個體(P<0.05);MR34位點210/214基因型個體體質量均值顯著高于210/210和214/214基因型個體(P<0.05); MR45位點174/190基因型個體體質量均值顯著高于182/182和182/190基因型個體(P<0.05; 表 6)。

表5 微衛星位點與體質量性狀的關聯性Tab. 5 Correlation between microsatellite loci and body weight

表6 基因型與體質量多重比較Tab. 6 Multiple comparisons of genotype and body weight
轉錄組測序技術的發展, 測序數據覆蓋度越來越高, 而測序成本越來越低, 成為大規模、高通量開發SSR標記的重要手段[27,28], 相比于傳統的SSR標記開發方法, 具有耗時少、數據量大和效率高等優點, 已被用于甲殼動物的SSR標記開發。Nguyen等[27]從凡納濱對蝦轉錄組中篩選得到11173個SSR位點, SSR位點發生頻率為16.17%。Yan等[29]從口蝦蛄(Oratosquilla oratoria)轉錄組中篩選得到13737個SSR位點, SSR位點發生頻率為14.15%。本研究共查找到18592個SSR位點, SSR位點發生頻率為19.49%, 這種差異可能與 SSR 搜索標準、數據庫大小及物種等有關。本研究隨機選取了63個位點進行了多態性篩選, 結果63個位點都能有效擴增,表明了本次測序的拼接質量較高, 其中31個位點表現出多態, 由于是從轉錄組數據中篩選得到的多態性位點, 位點可能與功能基因相關, 可為后續與生長性狀關聯分析、遺傳圖譜構建, QTL定位等提供有力支持。
評估遺傳多樣性是育種項目開展的重要環節,對各類群體進行遺傳多樣性評價有利于進行科學的種質資源管理及優良品種的選育。之前, 許多學者已經通過各種分子標記對羅氏沼蝦野生、養殖、人工定向選育群體的遺傳多樣性進行了比較分析, 其中SSR標記運用得最為廣泛, Karaket等[6]使用7個SSR位點對泰國3個品系的遺傳多樣性進行了評估, 結果顯示3個品系具有較高的遺傳變異,3個SSR位點顯著偏離Hard-weinberg平衡, 品系間的遺傳分化顯著。Kancee等[30]為了找到泰國5個養殖群體與2個野生群體的養殖性能下降的原因, 使用6個SSR位點對7個群體進行了遺傳多樣性分析,結果表明養殖群體與野生群體都具有較高的遺傳變異, 養殖性能的下降與遺傳多樣性水平可能不相關。Thanh等[31]使用6個SSR位點對來自中國廣東、浙江、上海和廣西的4個養殖群體及來自越南的2個野生群體進行遺傳多樣性分析, 6個群體的多態信息含量(PIC)均大于0.5, 表明遺傳多樣性高。本研究通過19個SSR位點對羅氏沼蝦FS與MJL兩個群體進行了檢測, 結果顯示, MJL群體的平均等位基因數、有效等位基因數、期望雜合度和多態信息含量均高于FS群體, 這是由于MJL群體為孟加拉野生群體保種傳代而來, 雖然在保種傳代過程中會人為的挑選個體大的作為留種親本, 但遺傳背景的基礎較大, 而FS群體為一個全同胞家系群體, 遺傳背景相對單一。群體處于 Hardy-Weinberg平衡的基本條件應是群體足夠大, 隨機交配, 同時沒有選擇、突變、遷移和遺傳漂變等現象, 本研究19個SSR位點中, MJL群體有10個位點偏離Hard-weinberg平衡, 遠低于FS群體的17個偏離位點數, FS群體的親本來源為以生長速度為育種目標的育種核心群體, 經過了高強度的人工定向選擇, 會不可避免地喪失某些特定的等位基因, 因此造成了大部分SSR位點偏離Hard-weinberg平衡。多態信息含量是衡量遺傳多態性的重要指標,PIC>0.5為高度多態性位點, 0.25 尋找與經濟性狀緊密相關的微衛星標記, 并進行標記輔助選擇, 已經成為當前水產生物遺傳育種的研究熱點, 許多學者報道了在魚、蝦、蟹等水產動物中找到了與其生產性狀相關的SSR位點[29]。本研究從家系與群體兩個水平進行了羅氏沼蝦體質量相關的SSR位點篩選, 19個SSR位點與FS群體的體質量都沒有相關性, 而在MJL群體中, 找到4個與體質量相關的SSR位點。本研究采用的是隨機群體關聯分析法, 是把19個位點在所選的群體中進行掃描, 通過方差分析找到與目標性狀相關聯的SSR位點, 可以全面分析19個位點的情況, 準確度好, 因而在MJL群體中所獲得的4個與體質量相關聯的位點可靠性高。4個與MJL群體體質量相關SSR位點中, 出現多個標記同一個性狀相關, 說明這些位點存在多因一效的現象, 體質量性狀是由一個以上的 QTL 所控制, 符合數量性狀位點的定義。本研究在FS群體沒有獲得與體質量相關的位點, 而在MJL群體中獲得了4個與體質量相關的位點, 可能是由于兩個群體的遺傳差異造成的, 不同群體會導致與性狀相關的分子標記存在差異, 因此本研究中所篩選到的與體質量相關標記在其他群體的適用性值得進一步研究, 這也提示我們在今后運用SSR標記進行輔助育種的研究工作中, 必須需擴大群體的規模和類型, 進行多方比較與驗證, 從而提高標記輔助性狀選擇的準確性。3.3 與體質量相關的SSR標記