劉萬達 楊光 焦奎寶 王昆 王天鶴 王禹 吳立仁



摘要:為了解黑龍江蘋果種質資源的遺傳關系,利用特異性位點擴增片段測序技術(SLAF-seq)對在黑龍江地區收集的31份蘋果種質資源進行SNP 位點開發和遺傳多樣性分析。最終獲得了107.52 Mb讀長數據,不同材料的SNP標記數目在 309 012~540 030 間,樣品測序質量值平均Q30為93.78%,平均GC含量為40.90%。共開發獲得 1 072 115 個SLAF標簽,其中,多態性SLAF標簽有275 389 個。通過序列分析,共得群體SNP位點121 352 個,基于開發SNP分子標記,結果表明,31 份蘋果種質資源分為3 個亞群,特異性的蘋果SNP位點開發和研究可為蘋果種質資源鑒定和遺傳多樣性分析提供理論基礎。
關鍵詞:蘋果;SLAF-seq技術;SNP;遺傳多樣性分析
中圖分類號:S661.102 文獻標志碼:A
文章編號:1002-1302(2023)08-0061-06
基金項目:農業農村部園藝作物種質資源利用重點實驗室開放基金(編號:NYZS201906);黑龍江省自然科學基金聯合引導項目(編號:LH2022C097)。
作者簡介:劉萬達(1982—),男,黑龍江齊齊哈爾人,碩士,副研究員,主要從事寒地蘋果育種及栽培技術研究。E-mail:haaslwd@163.com。
蘋果(Malus pumila MILL.)是我國主要栽培果樹樹種之一,分布廣、品種多,具有很高的經濟價值,與柑橘、葡萄、香蕉并稱為世界四大水果[1]。黑龍江省中小型蘋果由于干物質含量高,口味純正,品質佳,深受廣大消費者喜愛與認可。這些蘋果種質資源中較大部分是由栽培大蘋果品種與野生資源或地方品種雜交獲得。兩者基因的整合,獲得的蘋果資源既具有果實商品性又能夠適應黑龍江省的環境。但經過幾代雜交,近年黑龍江省培育的蘋果新品種存在果實品質提高幅度不大、抗寒能力下降明顯、適宜栽植區域小等問題,育種工作進展緩慢。地方品種是非常重要的種質資源,因此,研究分析其種質資源群體結構及遺傳多樣性對資源利用、種質鑒定及現代遺傳育種具有十分重要的意義。
特異性位點擴增片段測序(SLAF-seq)是一種基于高通量測序技術發展而來的簡化基因組測序技術,具有成本低、通量高、深度高、準確性高等突出優勢,已被廣泛用于作物遺傳圖譜構建、遺傳多樣性分析、進化關系分析和基因定位[2-4]。當前,基于SLAF-seq技術在紫蘇、甘薯和金花茶[5-7]等作物上已開發大量的SNP標記及遺傳進化分析,但在黑龍江省蘋果種質上進行遺傳多樣性分析及大量SNP分子標記開發等尚未見報道。本研究利用SLAF-seq技術對來自黑龍江省的31份蘋果種質資源進行遺傳進化分析,探討黑龍江省蘋果種質資源的遺傳背景及親緣關系,為黑龍江省蘋果品種的分類及鑒定奠定基礎,為蘋果種質資源的收集保存、開發利用及雜交組合選配提供科學的參考依據。
1 材料與方法
1.1 材料
試驗于2021年6月從黑龍江省不同地區采集31份蘋果種質資源嫩葉置于變色硅膠中保存備用,樣品詳細信息見表1。
1.2 DNA的提取和檢測
供試蘋果樣本基因組DNA提取采用CTAB法,利用分光光度計檢測DNA的純度和濃度,利用1%瓊脂糖凝膠電泳檢測DNA完整性。
1.3 酶切預測
根據蘋果基因組大小和GC含量等信息,本研究選用蘋果基因組作為參考基因組(https://iris.angers.inra.fr/gddh13/the-apple-genome-downloads.html)進行酶切預測。組裝獲得的基因組709.56 Mb,GC含量為38.03%。最終確定選擇 RsaⅠ+HaeⅢ為限制性內切酶切組合,最后選取目的片段回收,為確保酶切實驗準確性,本研究選取粳稻品種日本晴為對照進行測序。利用Illumina平臺對質量檢測合格后的文庫進行高通量測序,得到個體序列,最后對測序質量值 Q30和GC 含量進行評估和分析以保證測序質量。
1.4 SLAF 標簽的獲得及SNP 標記的開發
根據序列的相似性對31份蘋果種質資源進行聚類分析,一個 SLAF 標簽如果在不同蘋果種質間的序列有差異,即為多態性SLAF 標簽。依據 SLAF 標簽開發 SNP 位點,利用BWA[8]將測序結果和參考基因組序列比對,利用GATK[9]和SAM tools[10]對SNP標記進行開發,最終選擇2種方法獲得的交集作為最可信的SNP標記。根據缺失率<20%、次要基因型頻率(MAF)>5%的標準對所有的SNP位點進行過濾篩選。
1.5 遺傳多樣性分析
利用Admixture軟件[11]對群體進行群體結構分析,利用MEGA5.0軟件[12],通過Neighbor-joining[13]算法,對群體進行進化樹和親緣關系分析,利用Eigensoft軟件[14]進行主成分分析。
2 結果與分析
2.1 酶切方案與建庫評估
利用酶切預測軟件分析,選擇HaeⅢ+RsaⅠ為限制性內切酶,酶切片段大小在364~464 bp的序列定義為SLAF標簽,共預測到123 512個SLAF標簽。利用SOAP軟件[15],將水稻日本晴的讀長與參考基因組進行比對,結果(表2)表明,雙端比對效率為94.72%,測序數據酶切比例為83.40%,說明比對效率基本正常。根據獲得的SLAF標簽的實際長度,繪制插入片段長度分布圖,結果(圖1)表明,讀長插入片段在預期范圍(364~464 bp)之內,表明SLAF建庫正常,可用于下步試驗。
由測序堿基分布情況(圖2)可知,堿基A與T、C與G分布較一致,符合堿基配對的原則,提示測序未出現錯誤,因此獲得SLAF標簽可用于SNP標記的開發和遺傳多樣性分析。
2.2 簡化基因組序列的產出和質量評估
對31份蘋果種質的測序數據統計結果,由圖3可知,共計獲得58.21個百萬讀長序列(Mreads)數據,各樣品所獲得的讀長數為823 725~3 077 993,其中,來源黑龍江省哈爾濱市的品系“1962”樣品所獲得讀長數最大,為3 077 993個讀長,來源于黑龍江省雞西市的地方品種“一竄鈴”樣品所獲讀長數最小,為823 725個讀長(圖3-A)。測序質量值Q30為92.93%~94.67%,測序平均Q30為93.50%,其中,來源于黑龍江的地方品種“花紅”樣品Q30測序值最大,為94.67%,來源于內蒙古自治區的育成品種“塞外紅”樣品的Q30測序值最小,為92.93%。所有樣品Q30值均在90%以上,說明測序數據合格。測序獲得GC比例為40.09%~42.14%,其中,來源于黑龍江哈爾濱市的品系“245”樣品的GC比例最大,為42.14%,來源于黑龍江綏棱的地方品種“綏棱黃果”樣品的GC比例最小,為40.09%,平均GC含量為40.80%,GC比例普遍不高,說明達到測序要求(圖3-B)。
2.3 SLAF標簽和SNP分子標記的開發
通過序列分析,共開發獲得了136 282個SLAF標簽,其中多態性SLAF標簽109 966個。由圖4可知,樣品的平均測序深度為11.29%(圖4-A),從多態性SLAF標簽中開發獲得了2 039 575個SNP位點(圖4-B),對所有的SNP根據次要基因型頻率(MAF)>5%,缺失率<20%過濾,篩選高一致性的群體SNP。統計多態性SLAF標簽和SNP標記在蘋果不同染色體上的個數,根據數據繪制染色體分布圖,由圖5可知開發的多態性SLAF標簽和SNP位點在蘋果基因組17 條染色體上的分布情況,且在每條染色體上有比較均勻的分布,說明測序結果正常,可進行下一步分析。
2.4 群體遺傳結構分析
基于已開發的蘋果SNP位點,利用Admixture軟件分析了研究材料的群體結構。根據交叉驗證錯誤率的谷值確定最優分群數。由聚類分析結果(圖6)可知,K值為1時交叉驗證錯誤率最低,可見31份蘋果資源間遺傳結構不明顯,說明不同來源的個體來源于同一祖先。
基于已開發的蘋果SNP位點,利用MEGA5軟件繪制31份蘋果種質的遺傳關系聚類圖,由圖7可知,31份蘋果資源可劃分出3個差異性分支,第一個分支由17份蘋果資源組成,其中9份育成品種,4份地方品種,2份品系,2份其他。第二個分支由8份蘋果資源組成,其中2份育成品種,4份地方品種,1份品系,1份其他。第三個分支由6份蘋果資源組成,其中4份育成品種,2份品系。說明種質間存在較大變異,具有豐富的遺傳多樣性。聚類結果表明黑龍江省蘋果資源沒有明顯的區域特征。
基于已開發的蘋果SNP位點,利用Eigensoft軟件,對31個蘋果種質進行主成分分析(PCA),得到樣品的聚類情況。由圖8可知,31份蘋果種質聚為三維(PCA1、PCA2、PCA3),進一步提示黑龍江蘋果31份種質分化為3個亞群,黑龍江省蘋果資源品種之間存在遺傳多樣性。
3 討論與結論
蘋果是我國主要栽培果樹樹種之一,其面積和產量均居世界首位。目前,針對蘋果開展遺傳進化分析研究,主要集中在生理生化水平和表型鑒定等方面。SLAF-seq技術具有快速、低成本、高通量開發SNP標記的優勢[16],國內外研究者利用該技術已經在廣金錢草、山西省地方梨、白皮松等作物上成功應用[17-19],姜濤等運用SLAF-seq技術對39份連翹種質資源進行了SNP標記的開發和遺傳多樣性分析,共獲得262 297個多態性SLAF標簽,開發了1 809 741個SNP標記[20]。陶紅霞等運用SLAF標記,獲得125 497個多態性SLAF標簽,構建了蘋果遺傳連鎖圖譜[21]。李敏等通過SLAF-seq技術測序,獲得了99 526個多態性SLAF標簽,并開發了9 488個高質量的SNP標記[22]。
植物的生長環境對物種的種群結構和遺傳分化會產生直接的影響,通過蘋果樣品的系統進化樹發現,黑龍江蘋果種質遺傳多樣性較為豐富,育成品種中“大秋”和“秋露”親緣關系比較近,地方品種中“凍果”和“山丁子”親緣關系較近,而地方品種“紅鈴鐺”和育成品種“七月鮮”親緣關系較近,上述品種之間親緣關系較近,可能是雜交育種產生的。本研究利用特異性位點擴增片段測序技術,通過對31份蘋果種質資源進行SNP 位點開發和遺傳多樣性分析,共得到 107.52 Mb Clean Reads 數據,每個樣品的 SNP 標記數目介于 309 012~540 030 之間,樣本平均測序質量值 Q30 為93.78%,樣品平均 GC 含量為 40.90%。共得到 1 072 115 個 SLAF 標簽,其中275 389 個多態性 SLAF 標簽。通過序列分析,獲得 121 352 個有效的單核苷酸多態性標記(SNP),利用開發的SNP分子標記,將31份蘋果種質資源分為3個亞群。本研究平均測序深度較高,獲得的SNP位點數量多,為今后結合蘋果果實性狀、葉片性狀等數量性狀進行蘋果屬資源的評價利用,如親本選擇、關聯定位分析、雜種優勢利用及進化[23]等研究提供了重要的分子標記輔助育種標記,為蘋果種質資源保護和品種創制等研究提供了有力證據。
參考文獻:
[1]宋春暉,陳曉菲,王枚閣,等. 基于SLAF-seq技術鑒定蘋果砧木耐澇候選基因[J]. 中國農業科學,2021,54(18):3932-3944.
[2]Dong Z M,Chen L,Li Z,et al. Identification and molecular mapping of the semi-dwarf locus (sdf-1) in soybean by SLAF-seq method[J]. Euphytica,2020,216(6):103.
[3]Wei Q Z,Wang W H,Hu T H,et al. Construction of a SNP-based genetic map using SLAF-seq and QTL analysis of morphological traits in eggplant[J]. Frontiers in Genetics,2020,11:178.
[4]Zhang S Z,Hu X H,Miao H R,et al. QTL identification for seed weight and size based on a high-density SLAF-seq genetic map in peanut (Arachis hypogaea L.)[J]. BMC Plant Biology,2019,19(1):537.
[5]姜 濤,劉靈娣,田 偉,等. 紫蘇SNP分子標記開發及遺傳多樣性分析[J]. 分子植物育種,2021,19(4):1243-1249.
[6]蘇文瑾,趙 寧,雷 劍,等. 基于SLAF-seq技術的甘薯SNP位點開發[J]. 中國農業科學,2016,49(1):27-47.
[7]劉 凱,李開祥,韋曉娟,等. 基于SLAF-seq技術的金花茶SNP標記開發及遺傳分析[J]. 經濟林研究,2019,37(3):79-83.
[8]Li H,Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform[J]. Bioinformatics,2009,25(14):1754-1760.
[9]McKenna A,Hanna M,Banks E,et al. The Genome Analysis Toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data[J]. Genome Research,2010,20(9):1297-1303.
[10]Li H,Handsaker B,Wysoker A,et al. The sequence alignment/map format and SAMtools[J]. Bioinformatics,2009,25(16):2078-2079.
[11]Alexander D H,Novembre J,Lange K. Fast model-based estimation of ancestry in unrelated individuals[J]. Genome Research,2009,19(9):1655-1664.
[12]Tamura K,Peterson D,Peterson N,et al. MEGA5:molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods[J]. Molecular Biology and Evolution,2011,28(10):2731-2739.
[13]Saitou N,Nei M. The neighbor-joining method:a new method for reconstructing phylogenetic trees[J]. Molecular Biology and Evolution,1987,4(4):406-25.
[14]de Hoon M J L,Imoto S,Nolan J,et al. Open source clustering software[J]. Bioinformatics,2004,20(9):1453-1454.
[15]Li R Q,Yu C,Li Y R,et al. SOAP2:an improved ultrafast tool for short read alignment[J]. Bioinformatics,2009,25(15):1966-1967.
[16]段義忠,王建武,杜忠毓,等. 基于SLAF-seq簡化基因組技術的沙冬青SNP位點開發及遺傳分析[J]. 植物研究,2018,38(1):141-147.
[17]唐曉敏,張春榮,周良云,等. 基于SLAF-Seq技術的廣金錢草SNP位點開發及遺傳分析[J]. 分子植物育種,2020,18(18):6101-6107.
[18]白牡丹,郝國偉,張曉偉,等. 基于SLAF-seq技術的山西省地方梨品種的SNP分析[J]. 西北農業學報,2020,29(7):1020-1027.
[19]田 倩,劉雙委,鈕世輝,等. 基于SLAF-seq技術的白皮松SNP分子標記開發[J]. 北京林業大學學報,2021,43(8):1-8. [HJ2mm]
[20]姜 濤,溫春秀,田 偉,等. 基于SLAF-seq技術連翹SNP分子標記開發及遺傳多樣性分析[J]. 分子植物育種,2021,19(16):5405-5413.
[21]陶紅霞. 基于SLAF標記的蘋果遺傳連鎖圖譜構建[D]. 楊凌:西北農林科技大學,2015.
[22]李 敏,郭 聰,王 瑩,等. 基于SLAF-seq技術的喬木柳SNP位點開發[J]. 西南農業學報,2018,31(5):891-895.
[23]李曉穎,鄭少泉,徐紅霞,等. 基于SLAF-seq技術枇杷SNP位點開發[J]. 分子植物育種,2021,19(15):5038-5045.