張 濤 常立春 郭春貴 張立國 武 劍 梁建麗 高 杰 王曉武*
(1 新疆農業大學園藝學院,新疆特色園藝作物種質資源與高效生產實驗室,新疆烏魯木齊 830052;2 中國農業科學院蔬菜花卉研究所,蔬菜生物育種全國重點試驗室,北京 100081;3 贛州農業學校,江西贛州341000)
遺傳多樣性是生物體之間遺傳物質的差異,并且這種差異可以遺傳給后代?;蚪M學的飛速發展實現了在全基因組范圍大規模鑒定DNA 序列變異(Batley & Edwards,2009),包括單核苷酸多態性(SNP)、插入缺失(InDel)以及更大的結構變異(SV)。其中,SNP 數量最多,分布最廣泛,非常適合用于開發分子標記。分子標記在研究生物的進化途徑、分析遺傳多樣性、開展基因圖位克隆時都是必不可少的研究工具,特別是在作物育種中分子標記輔助選擇(MAS)發揮了巨大的作用,在多基因聚合、目標基因快速導入、遠緣雜交等育種過程中都能顯著提高育種效率。
辣椒(Capsicumspp.)是茄科(Solanaceae)植物的一員(2n= 24),世界范圍內辣椒品種繁多(Kim et al.,2014;Pereira-Dias et al.,2019)。中國市場的辣椒品種遺傳背景較窄,對辣椒的育種改良不利(顧曉振,2016)。對中國市場的辣椒品種進行遺傳多樣性分析,將為辣椒遺傳改良提供指導。前人利用分子標記開展了辣椒的遺傳多樣性分析。廖芳芳等(2023)利用果實性狀與STR 標記檢測相結合的方法對30 份辣椒種質資源進行遺傳多樣性研究,發現地理隔離并未對辣椒的遺傳分化產生顯著影響;張曼等(2020)基于20 個SSR 標記對112 份朝天椒種質資源進行遺傳多樣性分析,發現總體上材料的多樣性與地理來源存在一定關聯,但同時也存在地區間的互相滲透。
競爭性等位基因特異PCR(Kompetitive Allele Specific PCR)簡稱為KASP 標記,具有標記轉化成功率高、分型準確、開發和檢測費用低、檢測通量靈活性強等特點,是目前開展高通量基因分型的主流標記類型(Semagn et al.,2014;王鵬 等,2021;范妍芹 等,2022)。KASP 標記是開展遺傳多樣性分析的有力工具。Yang 等(2020)在對4份大白菜重測序的基礎上,鑒定篩選出SNP 位點,選擇在染色體上遺傳位置分布均勻的53 個KASP標記,對34 份大白菜材料進行基因分型和聚類分析,結果顯示34 份大白菜可聚為3 簇,與其結球類型相一致;Shen 等(2021)利用23 份代表性青花菜材料全基因組重測序數據,鑒定并篩選了SNP位點,開發出100 個KASP 標記,對372 份青花菜材料進行遺傳多樣性分析,并從中選擇了28 個KASP 標記對青花菜材料DNA 指紋圖譜進行構建;Scholten 等(2016)利用轉錄組數據開發了蔥屬的洋蔥與野蔥和大蔥間具有多態性的1 100 個KASP標記,用于構建種間的遺傳連鎖圖譜;任海龍等(2023)從前人開發的200個蕓薹種KASP 標記中,篩選出18 個核心KASP 標記,并構建了89 份菜薹品種的SNP 指紋圖譜,證明了KASP 技術在菜薹品種鑒定中的可行性。最近,Zhang 等(2023)基于GWAS 分析的結果開發了165 個辣椒疫霉病抗性的KASP 標記,經驗證,其中在抗/感材料之間有多態性的30 個KASP 標記被認為與辣椒疫霉病抗性相關聯。此外,歐立軍等(2019)開發了與辣椒素含量緊密連鎖的KASP 標記。但是,迄今關于辣椒全基因組范圍分布的、在資源材料或品種間具有高多態性、能夠進行背景篩選的KASP 標記還未見報道。
基因組中SNP 廣泛存在,其中絕大多數沒有受到選擇壓力,使得它們在進化上是中性的,可以更完整地估計多樣性水平(Edwards et al.,2007)。本研究旨在開發一套在辣椒基因組中均勻分布、在國內辣椒品種中具有高多態性、普適性強的KASP標記集,為開展辣椒資源多樣性評估和育種改良提供技術支撐。
供試辣椒材料包含安信沃椒的F2代以及來自全國14 個引種地區的207 份辣椒材料(表1),其中安信沃椒的F2代用于KASP 標記的多態性初步篩選,207 份辣椒材料用于多態性KASP 標記在辣椒品種資源中多態性驗證。全部辣椒材料于2021年4 月播種至中國農業科學院蔬菜花卉研究所日光溫室。

表1 207 份供試辣椒材料引種名稱及來源
1.2.1 DNA 提取 取辣椒幼嫩葉片,采用磁珠法提取DNA(張立國,2022)。使用NanoDrop1000(Thermo,USA)對DNA 進行質檢。
1.2.2 KASP 標記設計 一套KASP 引物包括兩條正向競爭性引物和一條反向通用引物。利用安信沃椒F1代重測序數據(中國農業科學院蔬菜花卉研究所分子遺傳課題組前期已完成)與參考基因組CM334 進行比對,獲得變異數據集,再根據辣椒的高密度遺傳圖譜(Zhang et al.,2019)與物理圖譜的對應關系,確定SNP 位點對應的遺傳位置,以20 cM 為間距從中篩選出234 個位點用于開發KASP 標記。利用DNAMAN(v6)與Primer 3(https://bioinfo.ut.ee/primer3-0.4.0/) 設計KASP引物。著絲粒區域只設計1 個標記(Zhang et al.,2019)。引物設計標準:引物長度20~26 bp,Tm值58~63℃,自身互補性小于5,3′端互補性小于3(Long et al.,2017;Wu et al.,2020;Yang et al.,2020)。
1.2.3 KASP 標記多態性篩選 利用Caliper(Life Sciences,USA) 和QuantStudio 12K Flex(Life Sciences,USA)進行引物多態性篩選。選取30株安信沃椒F2代植株,同時設置2 個空白對照(ddH2O)。反應體系包括樣本DNA 2.5 μL(濃度為30~50 ng · μL-1)、HiGeno 2 × Probe Mix A(北京嘉程生物科技有限公司)2.5 μL、SNP primer Mix(上海生工生物公司)0.07 μL(100 μmol · L-1,引物配比為A1∶A2∶C = 1∶1∶2.5,其中A1、A2表示兩條正向競爭性引物,C 表示反向通用引物)。
KASP 標記的PCR 擴增程序:階段1,95 ℃預變性10 min;階段2,95 ℃變性20 s,61 ℃退火40 s(每個循環降低0.6 ℃,循環數為10);階段3,95 ℃變性20 s,55 ℃退火40 s(循環數為34)。
1.2.4 KASP 標記體系轉化 為實現更小的反應體系以及適應高通量基因分型,反應體系轉化為烘干DNA 體系,文中出現的“體系轉化”均指引物篩選體系轉化為高通量分型體系。反應體系包括20~30 ng DNA,SNP primer Mix 0.028 μL,HiGeno 2 × Probe Mix A 1 μL。PCR 擴增程序階段3 循環數變為39,其他條件與1.2.3 相同。
1.2.5 KASP 標記在辣椒品種資源中多態性驗證 使用Microsoft Excel 的宏插件GenAlex(6.51 b2)對基因分型原始數據進行處理(Smouse et al.,2017),導出popgen 的輸入文件。使用popgen32計算引物在引種材料中的多態性位點數及多態性位點百分率(Brown et al.,1980;Brown & Feldman,1981)。
在辣椒全基因組范圍共設計了234 個KASP 標記。所有設計引物的Tm 值在57.9~62.9 ℃之間,兩條競爭性引物的Tm 值差值在0~2.3 ℃范圍內。引物的序列長度20~26 bp,兩條競爭性引物的序列長度差為0~3 bp。位點的變異類型有12 種,其中堿基互補配對氫鍵數量變化的有201 個,氫鍵數目未變化的有33 個。變異位點堿基互補配對氫鍵數目為三鍵不變時,每對引物的兩條競爭性引物的長度差均為0;變異位點的堿基互補配對氫鍵數目為二鍵不變時,兩條競爭性引物的長度差為0 的引物數量僅占43%;變異位點的氫鍵數目變化時,兩條競爭性引物的長度差為0 的引物數量占58.7%。
引物的發夾結構分為引物自身互補性和3′末端互補性。在234 個標記中,引物存在發夾結構的有119 個,無發夾結構的有115 個;引物自身互補性為0~5,3′末端互補性為0~3。
234 個KASP 標記中,159 個在F2群體中表現多態性,引物設計成功率為67.9%(圖1)。在具有多態性的標記中,包括32 個相同基因型分簇集中的標記(圖1-a),這類標記為最優標記;以及67個相同基因型分簇較分散的標記(圖1-b),7 個雜合基因型和純合基因型較近并且相同基因型分簇集中的標記(圖1-c)和53 個雜合基因型和純合基因型較近并且相同基因型分簇分散的標記(圖1-d),這3 類標記后續進行種質資源或品種材料的遺傳多樣性分析時存在風險。不可使用的75 個標記的分型可分為3 類,無擴增的標記占比最大,為46 個(圖1-e);4 個為相同基因型分簇分散的標記(圖1-f),這類標記雖然可以將樣本聚成3 種基因型,但其過于分散使3 種基因型的分型結果彼此之間距離太近,容易產生誤判,故將其歸為無法使用;25個為純合基因型與雜合基因型無法區分的標記(圖1-g)。
辣椒的12 條染色體中,每條染色體引物設計成功率不同,其中5 號染色體成功率最低,為56.0%;6 號染色體成功率最高,為100.0%(表2)。在115 個引物無發夾結構的KASP 標記中,引物設計的成功率為73%,與整體成功率基本相同,說明發夾結構并不會對多態性標記的引物設計造成大的干擾。

表2 辣椒多態性KASP 標記在12 條染色體上的分布
根據分型結果,從159 個可使用的KASP 標記中篩選出141 個標記用于體系轉化(表3)。篩選原則為:分簇集中優于分簇分散;分簇分散優于雜合純合靠近;雜合純合靠近的引物中,分簇集中優于分簇分散。

表3 KASP 分子標記集引物序列
141 個辣椒KASP 標記能夠成功用于高通量反應體系的有130 個,成功率為92%,這些KASP 標記在辣椒染色體上基本均勻分布(圖2)。分型結果中,有42 個標記與進行標記篩選時的分型結果不同,其中31 個標記表現為分簇效果提升,10 個標記表現為效果下降(表4)。

圖2 KASP 標記在辣椒染色體上的物理位置與遺傳位置的對應關系

表4 體系轉化后分型效果與標記篩選時表現不同的KASP標記數量
按照引種來源地將207 份辣椒材料分為14 個群體,通過使用popgen 計算所有材料的多態性位點數及多態性位點百分率來驗證設計引物的多態性和穩定性。遺傳多樣性分析結果表明,130 個KASP 標記在辣椒材料中多態性表現良好,多態性位點數為24~129 個,多態性位點百分率范圍為18.46%~99.23%(表5)。

表5 130 個KASP 標記在207 份辣椒材料中的多態性位點數及百分率
影響KASP 引物設計成功的主要因素有4 個:引物自身的Tm 值、序列長度、發夾結構和兩條競爭性引物的擴增效率。引物的Tm 值決定了引物的特異性結合的效率,Tm 值越高引物特異性越強,KASP 引物特異性結合的PCR 反應過程是Touchdown PCR,設定溫度是55~61 ℃,所以引物的Tm 值應盡量接近61 ℃。
兩條引物的擴增效率主要被兩條競爭性引物的Tm 值差值及序列長度差值影響,SNP 位點變異類型會影響兩條競爭性引物的序列長度差。兩條競爭性引物的Tm 值差值的調節可通過增減某一條競爭性引物5′端堿基的數量實現,但長度差要盡量小,此時可盡量選擇SNP位點變異類型為G、C互變的類型。
本試驗在引物篩選時出現的一類特殊的引物分型效果,即雜合基因型與純合基因型混在一起,此類分型效果出現的可能性有二:一是由于引物篩選時F2代樣本數量只有30 個,樣本中并未出現第3 種基因型;二是這類標記本身是共顯性標記,不能區分雜合子。由于本試驗旨在找到高多態性的共顯性標記,所以在多態性篩選時將這類標記歸為不可使用。
本試驗中,烘干DNA 體系反應體系更小、通量顯著提高(由篩選引物的Quant Studio 12 k flex的1 板384 孔板提高為20 板384 孔板),而且從分型結果來看與引物篩選反應體系效果基本相同,甚至很大比例的標記表現出更好的分型效果,所以干體系的轉化十分必要。其中干體系的熒光信號產生PCR 反應過程的循環數確定需要進行預實驗,從34 個循環試起,每次增加3 個循環,觀察分型結果,使分型結果盡量集中,但要保證NTC 在原點附近。
對于干體系的分型結果,標記篩選時表現為分簇分散的在干體系中,有43.7%的標記分簇效果顯著提升;標記篩選時表現理想的、分簇分散的、雜合純合較近且聚類集中的標記,其分簇情況基本不變;而引物篩選時表現為雜合純合較近且分簇分散的引物在干體系中分型失敗率較高,由此說明本試驗在挑選用于高通量反應體系轉化的標記時,所采用的分簇集中優于分簇分散,分簇分散優于雜合純合靠近,雜合純合靠近的引物中分簇集中優于分簇分散的選擇原則是正確的。
通過由207 個辣椒品種組成的群體的基因分型結果,證明本試驗設計的130 個辣椒的KASP 標記具有高多態性、強普適性,并且適用于高通量基因分型平臺。
本試驗開發了一組包含130 對辣椒KASP 引物且均勻分布在辣椒12 條染色體上的分子標記集,其多態性高,普適性強,且適用于高通量基因分型。