劉麗華, 劉陽娜, 張明明, 李宏博, 龐斌雙, 趙昌平
(北京市農林科學院北京雜交小麥工程技術研究中心, 雜交小麥分子遺傳北京市重點實驗室, 北京 100097)
小麥是我國的第二大口糧作物,優良新品種的選育和推廣對國民經濟發展與人民生活水平提高具有重要意義。截至目前,在中國種業網的大數據平臺上(http://202.127.42.145/)可查詢到的小麥審定品種3 766個。隨著近年我國《主要農作物品種審定辦法》的改革,品種審定渠道拓寬,每年參加區試統一試驗或聯合體的小麥品種已達2 000余份。不同生態區過度集中利用少數骨干優良親本導致育成品種的同質化嚴重,遺傳背景趨于狹窄。傳統的田間種植鑒定周期長,易受環境因素的影響,耗時費力。因此,面對品種數量多、同質化嚴重以及鑒定方法的局限性等問題,準確有效地鑒定小麥品種成為小麥品種管理、市場監管、執法和司法仲裁等首要難題。以SSR和SNP分子標記為代表的DNA 指紋鑒定技術具有準確可靠、簡單快速、易于自動化的優點,是國內外公認的農作物DNA指紋鑒定技術,通過構建農作物標準樣品的DNA 指紋及DNA指紋數據庫管理系統能夠實現對農作物品種進行精準快速的鑒定。
SSR標記為第二代分子標記,具有數量豐富、多態性高、操作簡單、成本低等優點,被國際植物新品種保護聯盟(International Union for The Protection of New Varieties of Plants, UPOV)推薦為作物品種鑒定的優選標記[1],SSR標記技術歷經二十余年的發展,在品種鑒定中的研究與應用已基本趨向成熟。截至目前,我國已建立了小麥[2]、玉米[3]、水稻[4]等15種作物SSR標記技術的品種鑒定標準,并廣泛應用于作物標準樣品指紋圖譜構建,為我國農作物品種管理和質量監管提供了有力技術支撐。SNP標記為第三代分子標記,通常為雙等位基因,較SSR標記具有數據統計簡單、數據兼容性強、通量高等優點。國內外學者已經開始研究基于SNP標記的指紋圖譜構建和品種鑒定技術,并取得了一定效果。趙仁欣等[5]利用油菜60K Illumina SNP芯片成功構建了我國224份冬油菜參試品種DNA 指紋圖譜,篩選出5 374個SNP 標記可用于甘藍型油菜品種特異性和一致性的鑒定分析;朱國忠等[6]利用棉花 KonSNP80K芯片對 326 份不同來源的陸地棉種質進行 SNP分型,篩選出適于陸地棉品種指紋圖譜繪的核心位點4 857個,99%以上的陸地棉材料均能夠被準確鑒定。北京市農林科學院玉米研究中心利用Maize SNP384 芯片完成4 632份審定玉米品種的SNP 指紋庫構建[7];魏中艷等[8]選用分布于13 個基因的23個SNP 標記對599 份大豆表型精準鑒定種質進行基因型分析,篩選出14個SNP用于品種鑒定,并構建了100份種質可掃描身份證。Shirasawa等[9]研究發現, 利用8個SNP標記可以區分43個水稻品種。然而,對于異源六倍體小麥來說,其基因組復雜,基因組測序完成和SNP芯片開發較晚,在小麥品種鑒定中的應用相對滯后,主要停留在評估芯片檢測平臺、遺傳多樣性和群體結構等方面的研究[10-13],目前,還沒有同時利用SNP和SSR構建小麥DNA指紋圖譜及兩者技術特征比較的相關報道。本研究以96份代表樣品為材料,利用 Illumina 公司的小麥90K SNP芯片進行基因分型,篩選適于小麥指紋圖譜構建的SNP標記;以篩選出的SNP標記和標準[2]中的SSR標記構建代表品種的指紋圖譜,并進行比較分析,以期為今后小麥品種DNA指紋檢測技術的選擇、推廣和應用奠定基礎。
小麥樣品共96份(表1),由北京市農林科學院北京雜交小麥工程技術研究中心的低溫種質庫提供。其中育成品種75份(編號1~75,為不同生態區骨干親本、生產上大面積推廣應用品種等)、地方品種3份(編號76~78)、育種中間材料10份(編號79~88)、雜交小麥及其雙親3份(編號89~91)、DH系樣品1份(編號92),為區分純合SNP位點的內參以及4個品種的第二次重復(重復內參,編號93~96)。

表1 96份代表樣品信息Table 1 Information of 96 representative samples
每份材料取50粒種子,置于培養皿浸種至露白(36 h左右),剝取胚芽30個,放入2.0 mL離心管中,利用植物基因組DNA提取試劑盒(天根生化科技有限公司)提取其基因組DNA,用0.5×TE溶解保存。DNA質量和濃度用紫外分光光度計和瓊脂糖凝膠電泳進行測定,要求DNA樣本濃度在50 ng·μL-1以上,OD260/OD280應在1.7~2.1之間,DNA總量應大于4 μg。
利用 Illumina公司的Wheat 90K iSelect Bead Chips全基因組芯片(SNP位點數目為81 587個)對96份樣本進行分析。在獲得原始數據后將其直接導入GenomeStudio軟件進行基因分型,獲得每個樣本每個位點的SNP基因分型數據。
基于毛細管電泳平臺,采用農業行業標準《主要農作物品種真實性SSR分子標記檢測 普通小麥》(NY/T2859—2015)[2]中的42對SSR引物構建75份育成品種的指紋。采用儀器自帶的Date Collection Ver.1.0軟件收集原始數據并形成FSA文件。采用北京市農林科學院玉米研究中心開發的SSR指紋分析器(軟件登記號:2015SR161217)對FSA 文件進行分析,采集指紋數據。
以75份育成品種為材料,利用Powermaker V3.25軟件[14]分析SNP和SSR位點的遺傳多樣性指數,包括基因多樣性、多態性信息量(polymorphism information content,PIC)和最小等位變異頻率(minimum allelic variation frequency,MAF)等。計算品種間的Nei’s(1983)遺傳距離,并進行UPOVE聚類分析。利用Excel計算SNP和SSR位點的鑒別力(discrimination power,DP)。采用杜邦先鋒公司提供的Uniqueness軟件和Minimal marker軟件[15]進行統計分析(基于組合最優化算法),獲得小麥品種鑒定最少的SNP和SSR位點組合。
2.1.1SNP位點的篩選 從81 587個SNP標記中篩選出得分值在0.60~1.00 之間的標記共49 539個(占比60.7%);剔除不具備重復性、不符合遺傳規律、不可靠、無多態性的位點,剩余14 940個SNP標記;剔除僅有AA或BB基因型、三種基因型所占面積比例不正常、缺失率較高、整體信號較弱、雜合率較高、連鎖的標記,最后篩選出高質量、單拷貝、無連鎖的理想位點384個(圖1),用于指紋圖譜構建。
2.1.2SNP位點的分布 384個SNP位點的染色體分布如圖2所示,總體上來看,D染色體組以及同源群3和4上的標記比較少,可能與90K芯片中D染色體組以及第3和4同源群上的標記比較少有關。
2.1.3SNP位點的多態性分析 SNP位點的PIC值變化范圍為0.07~0.38,平均0.33。MAF值(圖3)變化范圍為0.04~0.50,平均0.33,83%的位點MAF值大于0.2,表明篩選出的大部分SNP位點多樣性較高。
利用篩選出的384個SNP標記組合和42個SSR標記組合對75份育成品種進行基因分型并獲得指紋圖譜。對于SNP位點,指紋圖譜格式采用SNP變異實際的A/T/C/G堿基字母直接編碼,如某品種在某個位點上的特征編碼為“AA”。對于SSR位點,指紋圖譜格式采用等位變異名稱表示,如某品種在某個位點上特征編碼為“223/223”。固定SNP或SSR標記順序,串聯每個品種固定標記的特征編號,即為每個品種的特征指紋圖譜。表2列出了不同麥區4份代表性樣品12個位點的指紋,指紋圖譜的構建為品種識別及下一步分析鑒定了基礎。

表2 4份樣品的指紋信息Table 2 Fingerprint information of four samples
基于SNP和SSR指紋圖譜,分別計算多樣性各參數。SNP位點的平均等位變異數為2,基因多樣性和PIC值變化范圍分別為0.07~0.50和0.07~0.38,平均值分別為0.41和0.33。SSR位點的平均等位變異數為9.5,基因多樣性和PIC值變化范圍分別為0.56~0.87和0.49~0.81,平均0.75和0.72。SNP標記揭示的遺傳多樣性各參數明顯比SSR標記低,但也能較好地反映品種間的遺傳多樣性。
2.4.1遺傳相似系數比較 基于SNP和SSR指紋圖譜,計算各育成品種之間的遺傳相似系數(genetic similarity,GS),結果如圖4所示。基于SNP標記,各品種之間的GS變化范圍為0.45~1.00,平均0.62。廊研43號與揚麥158之間的遺傳相似系數最小為0.45,農大211和農大212的遺傳相似系數最大為1.00。基于42個SSR標記,各品種之間的GS變化范圍為0.02~0.99,平均0.25。煙農19號和舜麥1718之間的遺傳相似系數最大為0.99,寧麥8號與農大3432的遺傳相似系數最小為0.02。SNP揭示的遺傳相似系數高于SSR標記。
2.4.2遺傳相似系數相關性分析 利用兩種標記對75份育成品種進行遺傳相似系數相關性分析,結果(圖5)顯示,利用384個SNP位點組合與42個SSR位點組合的鑒定結果呈極顯著線性相關(P<0.01),說明兩者之間一致性較好。
2.4.3聚類分析 基于品種間的遺傳相似系數繪制SNP和SSR聚類圖(圖6),結果顯示,編號為14和70、48和68、34和71、56和51以及1、63和69的品種均在聚類圖中優先聚在一起,說明兩種標記之間一致性較好。
基于SNP和SSR指紋圖譜,計算兩種標記的鑒別力(DP)。SNP位點的DP值變化范圍為0.08~0.64,平均0.49,明顯低于SSR位點(DP值變化范圍為0.59~0.89,平均0.77)。基于遺傳相似系數分析結果,42個SSR位點組合能將75份育成品種區分開,而384個SNP位點組合僅能區分74份育成品種,不能區分的品種為農大212(農大211高度相似姊妹系),說明篩選出的384個SNP位點組合鑒別近等基因系的能力低于42個SSR位點組合。去除農大212后,基于最優化算法,發現僅需8個SNP位點組合或4個SSR位點組合(表3)即可區分剩余的74份育成品種,說明8個SNP位點組合與4個SSR位點組合對本批實驗材料的鑒定效率一致。

表3 8個SNP和4個SSR位點信息Table 3 Information of 8 SNP and 4 SSR loci
篩選重復性、穩定性和多態性好的高質量SNP標記是構建農作物高質量指紋和準確高效鑒定品種的前提。由于品種鑒定是為執法、司法仲裁等提供證明性作用的結果報告,因此其對SNP標記質量的要求遠比遺傳多樣性分析和遺傳定位等研究要高。對于異源六倍體小麥而言,所需的SNP標記除了滿足“符合孟德爾遺傳規律、無連鎖、重復性好、穩定性好、分布較均勻、分辨率高、PIC較高、易實現高通量”等二倍體作物普遍要求外,還應為單拷貝位點。由于多倍體特性,絕大部分標記是多拷貝的,不利于基因型的準確分型、記錄、統計、自動化分析等,直接影響檢測的準確性和通量。本研究所用的Illumina 90K SNP芯片中的絕大部分SNP位點在基因組上具有多個拷貝,而分型軟件主要是針對于二倍體開發的,無法實現準確分型。后期雖然開發了多倍體插件,但分型不能實現自動化,而且不利于基因型的記錄和統計。本研究通過篩選單拷貝SNP位點,將六倍體作物二倍體化,實現了SNP標記的準確和自動化分型,為構建準確可靠的指紋圖譜奠定了堅實的基礎,為其他多倍體作物提供了借鑒。
SSR和SNP均具備共顯性、高多態性、在基因組上均勻分布、高準確性、較好的重復性、較高通量、易實現自動化、成本低等優點,但各有優劣。相比之下,SSR 擁有更高的多態性,分辨力高;SNP標記在基因組中更為豐富,易實現數據共享、自動化、通量更高的優點。基于指紋圖譜,通過比較發現SNP標記揭示的遺傳多樣性各參數低,但均能較好的反映小麥遺傳多樣性;SNP標記揭示的遺傳相似系數高,但兩者呈顯著線性相關,聚類圖驗證了相關結果,說明兩者之間一致性較好,與Wurschum 等[10]的研究結果不一致。他們認為基于SNPs和SSRs揭示的遺傳相似性無顯著的相關性,可能與研究材料和標記數量不一致有關。在品種鑒定效率方面,384個SNP位點鑒定近等基因系(農大211和農大212)的能力不如42個SSR位點。分析原因,農大211和農大212來自于同一個親本組合,農藝性狀方面僅有粒色差異,而90K芯片中可供篩選的SNP標記數量有限,篩選出的384個SNP位點又與粒色無關,因此為滿足后續大規模檢測與指紋數據庫構建的需要,還需進行大量SNP標記的開發與篩選工作,加入更高密度的標記或者功能標記,作為擴展位點,以達到理想的品種鑒定效果。研究發現去掉農大212后,僅需8個SNP標記和4個SSR標記即可區分剩余的74份品種,說明8個SNP位點組合與4個SSR位點組合鑒定效率一致。雖然SNP和SSR位點平均等位變異數分別為2和9.5,相差將近5倍,但利用位點組合法鑒別同一批品種所需的位點數僅相差2倍,說明位點組合的優勢非常明顯,鑒定效率更高。另外,研究結果也說明利用SSR和SNP兩種技術進行品種身份鑒定時,兼顧成本、準確性和時效性,可先采用少量位點進行初檢,對于一些極近似品種,再增加高密度位點檢測。