張曉峰,欒培賢,戶國,李超,魯翠云,曹頂臣
(中國水產科學研究院黑龍江水產研究所,淡水魚類育種國家地方聯合工程實驗室,黑龍江 哈爾濱 150070)
水產品是人類的重要營養來源,特別是在食物缺乏的國家和地區[1,2]。持續改良和提高水產品的產量性狀,滿足人們不斷增長的對水產品的需求,一直是水產育種者面臨的長期挑戰之一[3,4]。作為全球最重要的養殖魚類之一,鯉(Cyprinus carpio)在全球100 多個國家養殖,全球年產量超過400 萬公噸(http://www.fao.org/fishery/statistics/global-aquaculture-production/query/en)。鑒于鯉對水產養殖業的重要性,在過去幾十年中,開發了各種基因組資源和遺傳工具,以促進鯉遺傳改良和育種計劃[5-10]。鯉育種方法已經從傳統的選擇發展到現代生物技術,如標記輔助選擇(MAS)和分子育種等[11-13]。
魚類多數經濟性狀都為數量性狀,如生長、抗病性、性別和肌肉品質等,由多個基因控制,稱為數量性狀座位(quantitative trait locus,QTL)[14-16]。這些性狀的表型變異被認為是由多個數量性狀位點(QTL)等位基因分離產生的數量遺傳變異引起。通過傳統常規選育費時費力,分子標記輔助選擇(marker-assisted selection,MAS)可以利用分子標記直接選擇基因型,使得優勢基因型快速富集,提高目標性狀的改良效率。MAS 的實施需要通過QTL定位或關聯分析獲得與感興趣的性狀緊密連鎖的DNA 標記[17,18]。QTL 定位的目的是了解決定性狀的基因的數量和作用,并協助育種選擇,以加速重要性狀的遺傳改良[19]。
生長性狀作為鯉的重要經濟性狀之一,揭示其性狀復雜的分子機制并挖掘影響該性狀的重要功能基因,可以為鯉生長性狀分子標記輔助選擇育種奠定基礎。近年來隨著鯉基因組資源的快速開發利用,鯉重要性狀相關QTL 定位分析已開展了很多研究。例如生長[20-25]、抗性[5,26]、肌肉品質[16,27]和飼料轉化率[28,29]等,大大促進了鯉分子標記輔助選擇和分子育種進程。尤其是,不同品種和家系鯉生長相關QTL 定位分析取得了很多研究結果。雖然關于鏡鯉生長相關性狀的QTL 已有多篇報道,但由于作圖群體的樣本量和使用的標記數量相對較少,并不是所有性狀相關的DNA 變異完全被捕獲。因此,亟需構建高密度相對較高的遺傳連鎖圖譜,以利于QTL 精細定位和候選基因的篩選。
本研究擬對鏡鯉F1家系進行SLAF-seq(specific-locus amplified fragment sequencing)測序,利用SNP 標記構建鯉高密度遺傳連鎖圖譜。利用該高密度圖譜對鏡鯉主要生長性狀進行QTL 精準定位,挖掘與這些性狀相關的分子標記及候選基因,為鯉MAS 育種提供依據。
本實驗用鏡鯉采自黑龍江水產研究所呼蘭試驗站。F0(祖父母本)為早期由國家原種和良種審定委員會鑒定為良種的德國鏡鯉選育系的后代,經微衛星分子標記檢測親本間的遺傳距離,選取遺傳距離大的一對親本構建F1家系,池塘養殖6 個月后,隨機選取200 尾子代個體,測量表型性狀。
表型性狀的測量:根據中華人民共和國國家標準《養殖魚類種質檢驗》(GB/T 18654.3-2008),測量了研究群體的體質量(BW)、體長(SL)、體高(H)和體厚(TH)4 個性狀,獲取試驗群體生長性狀表型值。利用SPASS 19.0 對性狀進行描述性統計分析和正態分布檢驗。
基因型分析:表型值測量結束將實驗魚麻醉,尾靜脈抽血0.5 mL。采用QIAampDNA Blood Midi Kit 血液提取試劑盒,參照標準流程提取血液樣本的DNA。用1.5%瓊脂糖凝膠電泳檢測基因組DNA的完整性,利用NanoDrop-1000 超微量分光光度計檢測基因組DNA 濃度,檢測合格的DNA 樣本置于-20 ℃冰箱保存備用。委托百邁克生物有限公司,利用Illumina HiseqTM 平臺進行SLAF-seq 和SNP 標記的鑒定分型。
遺傳連鎖圖譜的構建和QTL 定位:選擇符合孟德爾遺傳的多態性SNP 標記用于進一步的連鎖分析。連鎖分析采用雙偽測交策略(CP)。根據分離模式將SNP 分為三類:ABxAA 或ABxBB(僅在母本中1∶1 分離)、AAxAB 或BBxAB(僅在父本中1∶1 分離)和ABxAB(雙親中1∶2∶1 分離)。利用Join-Map 4.0 軟件構建鏡鯉高密度遺傳圖譜[30]。分析模型為CP(cross pollinators),作圖函數為Kosambi 函數。以極大似然法構建遺傳連鎖圖譜,LOD 值設置為6.0;采用Kosambi 函數計算標記間的遺傳距離(cM)。圖譜繪制軟件為MapChart 2.2[32]。
用MapQTL5.0[31]軟件包中區間作圖(interval mapping,IM)對四個生長性狀進行QTL 定位分析,取LOD 閾值為2.5。通過逐步回歸(stepwise regression)估計表型方差(PVE)。QTL 最近的SNP 標記附近的生長基因做為候選基因,注釋基因的功能。
利用SPSS19.0 對生長性狀數據進行描述性統計,計算了性狀的平均值、偏度、峰度、最小值、最大值和P 值(表1)。表1 表明,體質量測量值介于88.90~273.30 g,平均(162.84±42.71)g;體長測量值介于11.73~17.90 cm,平均為(15.91±1.32)cm;體高測量值介于5.58~8.32 cm,平均為(6.83±0.66)cm;體厚測量值介于2.94~4.59 cm,均值為(3.51±0.33)cm。根據Shapiro-Wilk 正態分布檢驗的顯著性閾值,四個性狀P 值均大于0.05,符合正態分布(圖1)。

圖1 體質量、體長、體高和體厚性狀的正態分布Fig.1 The normal distribution of body weight(BW)(a),body length(SL)(b),body depth(H)(c)and body thickness(TH)(d)

表1 4 種性狀表型數據統計及正態分布檢驗Tab.1 Descriptive statistics of phenotypic data of growth-related traits.
SNPs 標記基因分型數據由百邁克生物有限公司自主開發的軟件進行處理分析,剔除低質量的基因分型和不符合孟德爾標記后,剩余4 026 個均勻分布鯉基因組的高質量的多態性SNPs 標記用于鏡鯉遺傳連鎖構建圖譜。為提高構建圖譜的準確性,將個體基因型缺失20%以上的個體剔除,剩余107個子代用于遺傳連鎖圖譜的構建。用JoinMap4.0 軟件的“CP”作圖模型對這4 026 個分子標記進行連鎖分析,共得到50 個連鎖群,最終構建的圖譜包含3 903 個SNP 標記,圖譜總長度為3 923.31 cM,全基因組覆蓋度97.26%,每個連鎖群有78.06.1 個標記,連鎖群長度范圍為40.83~120.01 cM,標記間平均距離為0.998 cM。
采用MapQTL5.0 軟件的區間定位作圖,取LOD值2.5 做為閾值,共檢測到29 個與鏡鯉生長性狀相關的QTLs,分別定位到11 個連鎖群(LG3、LG5、LG6、LG7、LG12、LG16、LG30、LG38、LG44、LG46 和LG47)上,LOD 值介于2.50~4.09 之間,解釋表型變異介于9.0%~24.2%之間(表2、圖2)。其中,與體質量相關的QTLs 最多,為20 個,其次為體高和體厚性狀,均為15 個,體長最少,為11 個。從連鎖群分布看,LG5、LG6 和LG38 連鎖群最多,均為6 個QTL區間。其次是LG30 和LG12,分別為3 個和2 個,其余6 個連鎖群(LG3、LG7、LG16、LG44、LG46 和LG47)均含有1 個QTL 區間。本研究中的29 個生長性狀QTLs 中,3 個QTLs(QTL6_5、QTL6_6 和QTL44_1)的單個QTL 解釋表型變異率大于20%,為生長性狀的主效QTL 區間。解釋表型變異最大的為QTL6_5,分別解釋體質量和體長性狀表型變異的24.2%和24.1%。

圖2 QTLs 在聯鎖群中的分布Fig.2 QTL mapping of growth-related traits distribution in linkage groups
本研究共檢測到17 個QTL 區間在不同生長性狀間共享,其中與4 個性狀都相關的QTL 區間3個,分別為QTL5_3、QTL6_2 和QTL38_4。4 個性狀解釋表型變異9.1%~13.7%;12.0%~13.3%;和10.6%~16.3%。與3 個性狀相關的QTL 區間有9 個,分別為QTL3_1、QTL5_2、QTL5_4、QTL5_5、QTL6_3、QTL6_6、QTL30_1、QTL38_5 和QTL44_1;與兩個生長性狀相關QTLs 有5 個,分別為QTL5_6、QTL6_5、QTL12_2、QTL38_1 和QTL38_6;其余12 個QTLs(QTL5_1、QTL6_1、QTL6_4、QTL7_1、QTL12_1、QTL16_1、QTL30_2、QTL30_3、QTL38_2、QTL38_3、QTL46_1 和QTL47_1)僅與一個性狀相關。
對所有與生長性狀相關的29 個QTL 區間與鯉全基因組物理圖譜進行了比對分析,在所有QTL 區間上基因進行生長基因篩選(圖3),結果在12 個QTL 區間篩選到了生長相關候選基因(表3),分別為:轉化生長因子-β 受體(Transforming growth factor beta receptor type I b,tgfbr1b)、生長因子非依賴性新蛋白(Novel protein similar to growth factor independent,gfi)、生長激素調節的TBC 蛋白2(Growth hormone_regulated TBC protein 2,grtp2)、生長激素調節的TBC 蛋白1(Growth Hormone Regulated TBC Protein 1,grtp1)、轉化生長因子β 受體3(Transforming growth factor beta receptor 3,tgfb3)、胰島素樣生長因子Ⅱ受體(Insulin-like growth factor II receptor,igf2r)、含轉化生長因子β 樣結構域蛋白(Transforming growth factor beta like domain containing protein,tgfb)、生長激素受體Ⅱ型(Growth hormone receptor type II,ghr2)、表皮生長因子樣蛋白6(Epidermal growth factor like protein 6,egf6)、表皮生長因子樣蛋白8(Epidermal growth factor-like protein 8,egf8)、生長因子受體相關結合蛋白2(Growth factor receptor bound protein 2-associated,grb2)和生長激素受體Ⅰ型(Growth hormone receptor type I,ghr1)等,這些候選功能基因為鏡鯉生長相關的分子機理研究提供了有價值的信息。

圖3 QTL 定位及生長相關的候選基因分析Fig.3 QTL mapping and association analysis of candidate growth-related genes

表3 四個生長性狀候選基因Tab.3 Summary of candidate genes for four growth-related traits
在過去二十年中,魚類育種方法已從傳統選擇發展到現代生物技術,如標記輔助選擇(MAS)和分子育種[11]。魚類最重要的經濟性狀,大都由多個被稱為QTL 的基因控制。這些性狀的表型變異是由多個數量性狀位點(QTL)等位基因分離產生的數量遺傳變異引起[18]。這些QTL 中的大多數對性狀影響較小,但多個QTL 位點的累加效應可能對性狀產生重大影響。如果識別出與感興趣的性狀相關的基因和遺傳標記,遺傳變異可作為MAS 分析的工具[33]。
高質量的遺傳圖譜是進行高效、準確定位QTL分析所必需的至關重要的工具。然而,傳統標記數量有限,難以覆蓋整個基因組[34]。隨著高通量測序成本的降低,利用高通量測序可快速、批量地開發SNP 標記,構建高密度遺傳圖譜,為后續經濟性狀QTL 精準定位提供重要工具。SNP 標記是基因組中最豐富的多態性標記,非常適合構建高密度連鎖圖譜。本研究利用SLAF-seq 高通量測序技術,對鏡鯉F1全同胞家系進行高通量測序,構建了鏡鯉含有3 903 個SNP 標記的高密度遺傳連鎖圖譜,圖譜平均標記間隔0.998 cM,較之前用于鏡鯉生長相關性狀QTL 定位的圖譜的平均圖距(5.77~16.8 cM)小很多,標記數量也明顯增多[20-23]。
用高密度圖譜對生長性狀進行QTL 定位,可快速、批量獲得生長相關的標記和基因。本研究利用新構建的高密度連鎖圖譜對6 月齡鏡鯉四個生長性狀進行QTL 精準定位,共檢測到29 個QTLs 與鏡鯉幼魚生長性狀顯著相關。這些QTLs 多數(18 個)呈簇狀分布于第5、6 和38 連鎖群上,少數(11 個)位 于LG3、LG7、LG12、LG16、LG30、LG44、LG46 和LG47 上。進一步分析發現,鏡鯉幼魚體質量相關的20 個QTLs 中有17 個均不同程度與其他4 個性狀中至少1 個生長性狀QTL 位點一致。與本研究中的4 個生長性狀均共享的QTLs 有3 個,分別為QTL5_3、QTL6_2 和QTL38_4,說明生長性狀之間存在高度的相關性,這與其表型數據相關性結果一致。在獲得的29 個鯉長相關的QTLs 中,絕大多數單個QTL 對性狀的貢獻率在10%以上,3 個QTLs(QTL6_5、QTL6_6 和QTL44_1)的單個QTL 解釋表型變異率大于20%,為生長性狀的主效QTL 區間。其中,解釋表型變異最大的為QTL6_5,分別解釋體質量和體長性狀表型變異的24.2%和24.1%。
為了獲得生長相關的候選基因,本研究比對29個QTL 區間對應的鯉全基因組序列,篩選了12 個生長相關的候選基因。包括轉化生長因子-β 受體tgfbr、生長激素調節的TBC 蛋白grtp、胰島素樣生長因子igf2r 和生長激素受體ghr 等。這些基因的功能涉及脂質代謝、碳水化合物代謝、細胞增殖和分化等[35-38],其基因參與魚體生長的具體生理生化即代謝過程還需進一步研究驗證。
本研究采用的6 月齡早期階段的鏡鯉家系檢測和估計了QTL 效應,對后期和收獲產量存在高度的遺傳相關性,幼魚早期生長速度也會影響最終的收獲質量[39,40]。這些研究結果暗示,本研究獲得的生長相關的QTLs,可在早期實施對該性狀的遺傳改良,縮短選育周期。