宋 莎, 馮建文, 吳亞維, 羅昌國, 韓秀梅
(貴州省農業科學院 果樹科學研究所, 貴州 貴陽 550006)
花紅(MalusasiaticaNakai.)為薔薇科(Rosaceae)蘋果屬(Malus)落葉喬木,果實與蘋果相似,果較小,營養價值高,是集花果并賞的樹種,我國大部分地區均有分布,在南方可作蘋果砧木[1],通過對貴州省蘋果屬資源調查[2]和親緣關系分析[3]等發現,花紅是貴州省重要的蘋果屬種質資源。
近年來,多種分子標記被開發,蘋果集群分離、全基因組關聯分析及功能基因等方面也取得一定進展[4]。巴巧瑞等[5]利用SSR引物和SRAP引物可有效揭示37個品種的遺傳多樣性;王曉英等[6]利用AFLP分子標記對4個蘋果品種進行遺傳分析發現,聚類結果與表型特征相符;應用微衛星DNA(SSR)分子標記進行蘋果屬種質資源鑒定[7-9]和群體遺傳分析[10-11]的文獻報道也較多。RAD-seq(restriction-site associated DNA sequencing)技術是在二代測序基礎上基于全基因組酶切位點的一項簡化基因組測序技術,基因組研究熱點領域如構建高密度遺傳圖譜、精確定位重要性狀、組裝輔助基因組序列、群體基因組學以及系統發生學等應用RAD-seq技術也較多[12]。應用分子標記對貴州花紅進行種質鑒定,對保護和利用花紅資源具有重大意義。因此,以10份花紅資源為材料,利用RAD-seq技術對其進行簡化基因組測序,并全面分析花紅的SSR信息,以便為花紅新型分子標記引物的篩選提供序列參考。
2016年收集花紅10份(表1),以實生苗方式保存。2018年從每份材料選取嫩葉5片,液氮速凍,-80℃保存。委托廣州基迪奧生物科技有限公司進行RAD-Seq轉錄組測序(無參)。

表1 供試花紅的編號及來源
采用CTAB(十六烷基三甲基溴化銨)法提取材料DNA,NanoDrop微量分光光度計法和1%瓊脂糖凝膠電泳法檢測DNA質量,以保證其總量和純度。
利用NEBNextDNA雙鏈片段化酶,根據不同作用時間將dsDNA切割成50~1 000 bp片段。按End Prep 混合酶 3 μL、End Repair Reaction Buffer 6.5 μL、Fragmented DNA 55.5 μL、Total volume 65 μL的反應體系加入試劑進行PCR反應,進行末端修復、磷酸化并加A。按體系Blunt/TA Ligase Master Mix 15 μL、NEBNext Adaptor for Illumina 2.5 μL、Ligation Enhancer 1 μL、Total volume 83.5 μL配制試劑,20℃ PCR反應15 min后,在混合液中加入3 μL USER 酶37℃反應15 min,加上P1接頭。帶有不同P1接頭的樣品混合,利用超聲或酶切將其打斷成300~700 bp的序列,加上P2接頭。PCR擴增富集RAD標記。用AMPure XP Beads純化PCR反應,文庫質檢。
對每個樣品中PE reads的read1進行比對和聚類,得到個體的stacks信息。將多個樣本的stacks聚類,得到群體stacks的一致性序列信息。根據群體stacks聚類的結果對read2進行分類,將所有樣本來源同一個等位基因位點的read2歸為一類。然后對每個等位基因位點的read2進行組裝拼接,得到基于reads2拼接的重疊群;將read1聚類得到stacks的一致性序列和read2拼接得到的重疊群進行連接。若兩者有重疊,則根據重疊序列進行合并,若兩者無重疊,則在中間以N補充。最終得到基于RAD聚類和拼接的RAD標記。以群體RAD 標記為參考序列,重新進行個體的序列比對和變異檢測,并進行其他下游高級分析。
利用Treebest 1.9.2構建進化樹對樣品進行聚類分析。
簡化基因組測序結果(表2)顯示,花紅樣品的原始數據(Clean date)為1 043 992 564~1 775 387 156個,10個樣品共獲得13 976 968 360個原始數據;過濾后獲得的高質量原始數據占總量的98.18%,Q20為97.31%~97.57%,Q30為93.24%~94.04%,GC含量為38.66%~43.38%,過濾前后的數據差異較小,且Q30處于較高水平,GC含量處于較低水平,表明樣本數據量足夠,測序數據合格可靠,建庫測序成功。
Reads拼接組裝后,重疊群組裝總數為628 413,重疊群N50為346 bp,最大長度1 015 bp,最小長度200 bp(圖1),平均長度為331 bp。將得到的重疊群繼續與reads進行連接構建RAD標記,重疊群組裝總數為784 572 bp,重疊群的長度N50=501 bp,最大長度2 210 bp,最小長度156 bp,平均長度為417 bp,可作為后續變異檢測和高級分析的參考序列。

表2 RAD-seq基因組測序的花紅數據

圖1Reads組裝后長度分布
Fig.1 Contig length of the reads after assembly
經搜索最終獲得SSR位點40 623個,成功設計37 141對SSR引物,成功設計率為91.43%。經SSR檢測成功設計引物SSR位點的重復序列長度為16~141 bp,其中最多的是二核苷酸(25 293條),占總數的68.1%;其次是三核苷酸(6 543條),占總數的17.6%;其余依次為四核苷酸(3 380條)、五核苷酸(1 333條)和六核苷酸(592條)。SSR引物基序的重復次數為4~13次,通過梯度退火溫度PCR,從10對備選SSR引物中篩選出可在花紅中成功擴增并表現出多態性的引物7對,分別為1、2、5、6、8、9、10號,并確定這7對引物的最佳退火溫度(表3)。

表3 花紅10對引物的特性
由圖2可見,10份花紅材料可分為兩大類,其中貴州的8份材料聚為一類,云南的M-0916和M-0916_2聚為一類。貴州的8份材料中,安龍的M-0708與羅甸的M-0712親緣關系最近,其余依次為貴陽的JZ、威寧的M-0710、貴陽的M-0706_2、鎮寧的M-0702、興仁的M-0704、興義的M-0706。

圖2 10份花紅的系統進化樹
種質鑒定的方法有形態學、同工酶、分子標記等。試驗采用RAD-seq技術對花紅進行簡化基因組測序,獲得了花紅基因組水平上的序列信息,經聚類和組裝后也有較高的準確性,可代表花紅部分基因組。對獲得的序列進行過濾,獲得的SSR位點有40 623個,成功設計引物37 141對,從10對備選SSR引物中篩選出可在花紅中成功擴增的引物有7對。通過系統進化樹對10份花紅樣品進行聚類分析,可將貴州和云南的材料分開,也能明顯看出貴州的8份材料親緣關系的遠近,表明可利用RAD-seq技術進行種質鑒定工作,與異形花[13]和煙草[14]等物種開展的SSR信息研究相類似,RAD-seq技術具有性價比高、數據利用率高、準確性高、不受基因組序列限制等優勢[12]。
貴州省屬于典型的喀斯特地貌,由于特殊的地理環境,野生果樹資源豐富,蘊藏著豐富的基因資源,可能存在值得挖掘的種質。花紅是貴州省較常見的資源,但為零星分布,近些年受一些因素的不利影響。貴州省花紅資源具有某些獨特的基因,與云南省的花紅資源易區分,有助于揭示其遺傳信息,對未來貴州省花紅資源的收集評價及對資源的利用和改良有重要參考價值。但有些花紅果實品質良好,經過了較多的人為干預,其具體價值有待進一步研究探討。