季 群 李雙梅 朱紅蓮 柯衛東
(武漢市農業科學院蔬菜研究所,湖北武漢 430207)
豆瓣菜(Nasturtium officinaleR.Br.,2n=2x=32)為十字花科多年生雙子葉水生草本植物,在歐洲、亞洲及北美均有分布。豆瓣菜作為栽培蔬菜,在我國廣東、廣西、福建等地有較大面積種植,在長江中下游地區有少量種植;作為野生植物,在我國主要分布于黑龍江、山西、河北、山東、河南、四川、陜西、安徽、江蘇、廣東、廣西、貴州、云南和西藏等地(中國科學院中國植物志編輯委員會,1987)。
國內外對于豆瓣菜親緣關系的分類研究不多,主要是按照形態學特征和傳統分子標記方法對其進行分類。Jafari 和Hassandokht(2012)利用農藝性狀對伊朗的24 個野生豆瓣菜群體進行遺傳多樣性分析,結果將豆瓣菜分為4 組,每組具有不同的形態特征;趙博等(2007)利用79 個RAPD 引物和34 個ISSR 引物對國家種質武漢水生蔬菜資源圃的8 份豆瓣菜資源進行了親緣關系分析,2 種分子標記均可以將8 份資源劃分為3 個不同的類群。目前國家種質武漢水生蔬菜資源圃保存有19 份二倍體豆瓣菜資源,明確這19 份資源的遺傳多樣性和親緣關系是將其應用于豆瓣菜育種和種質改良的基礎。
基因組工具如分子標記,可以闡明種質的遺傳背景,最終用于育種。傳統的種質資源分類都是在形態學或農藝性狀水平上,通過具有多態性的外觀特征進行遺傳標記。但形態性狀數量少、多態性差、易受環境條件影響(Sharma et al.,2015)。RAPD分子標記最大的缺陷是不穩定、重復性差,自然可信度也較差(Gichuki et al.,2003)。盡管AFLP、SSR、ISSR 等分子標記較RAPD 具有穩定、重復性好等優點,但提供的數據量有限,不適用于大樣本量的群體分析,不能完全真實反映物種的遺傳多樣性(Zhang et al.,2004;Moulin et al.,2012;Yang et al.,2015)。隨著高通量測序技術的發展,即使沒有參考基因組,簡化基因組測序(specific length amplified fragment sequencing,SLAF-seq)可以獲得基因組中數以百萬計的單核苷酸多態性(single nucleotide polymorphism,SNP),并以此為遺傳標記對物種的遺傳多樣性進行分析,研究群體的遺傳結構及其變化規律,探討生物的進化過程(Chong et al.,2016;Su et al.,2017)。
本試驗擬利用表型性狀及SLAF-seq 技術對19份豆瓣菜群體的表型及基因組變異進行分析,初步確定豆瓣菜種質資源的遺傳多樣性和親緣關系,為豆瓣菜遺傳育種和種質保存提供理論基礎。
參試19 份豆瓣菜種質中,以色列豆瓣菜、江西大葉豆瓣菜、英國大葉豆瓣菜、美國豆瓣菜和廣西豆瓣菜均從當地市場購買種子獲得,其余種質均為從國內外不同地區野外收集所得,所有種質均種植于國家種質武漢水生蔬菜資源圃(表1)。

表1 參試豆瓣菜種質名稱及來源
采集樣品葉片,液氮速凍后于-80 ℃保存。采用CTAB 法提取葉片DNA,NanoDrop-2000 檢測DNA 濃度,DNA 稀釋終濃度為30 ng·μL-1,用1%瓊脂糖電泳檢測DNA 的完整性。
采用連續兩年定點調查的方法。參試材料分別于2016 年和2017 年定植于塑料大棚2 m×3 m 水泥池中,在產品器官采收期對所有豆瓣菜種質的表型性狀進行調查和統計,隨機選取5 株具有代表性的植株進行調查。調查性狀包括株高、莖粗、頂端小葉長、頂端小葉寬、葉柄長等5 個數量性狀和葉色、莖色、頂端小葉形狀3 個質量性狀。對質量性狀直接進行統計;利用Excel 軟件計算數量性狀的平均值(X)、標準差(σ)和變異系數(CV)。應用SPSS 軟件按離差平方和(Ward)法對表型性狀進行聚類分析。
由于豆瓣菜目前尚無參考基因組序列,但其近緣物種甘藍(Brassica oleraceaL.)、芥菜〔Brassica juncea(L.)Czemajew〕、白菜(Brassica rapaL.)已有參考基因組序列信息發布,因此根據豆瓣菜基因組大小以及GC 含量等信息,最終選取白菜基因組作為參考基因組進行酶切預測。白菜基因組(https://www.ncbi.nlm.nih.gov/genome/?term=Brassica+rapa)大小為284.13 Mb,GC 含量為35.83%。
采用限制性內切酶RsaⅠ和HaeⅢ進行酶切,以水稻日本晴DNA 作為對照來評估酶切的準確性和有效性。對得到的酶切片段進行3′端加A 處理、連接Dual-index 測序接頭、PCR 擴增、混樣、切膠選取目的片斷,酶切片段長度在364~464 bp 的序列定義為SLAF 標簽。文庫質檢合格后用Illumina HiSeqTM2500 進行測序。測序產生的reads 來源于相同限制性內切酶作用于樣品后產生的長度相同的酶切片斷,對各樣品的reads 按照序列相似性進行聚類,同一SLAF 標簽在不同樣品間的序列相似性高于不同SLAF 標簽間的相似性,因此聚類在一起的reads 來源于同一SLAF 標簽,同一SLAF 標簽在不同樣品間序列存在差異,即可定義為多態性SLAF 標簽。以每個SLAF 標簽中深度最高序列作為參考序列,并利用GATK(Mckenna et al.,2010)和SAMTOOLS(Li et al.,2009)兩種方法開發多態性SLAF 標簽中的SNP,兩種方法同時獲得的SNP 質量較高,作為最終可靠的SNP 標記。
對分析過濾后的高質量數據進一步進行數據挖掘和深入分析,將19 份豆瓣菜資源最終獲得的群體SNP 根據完整度>0.5、MAF >0.05 進行篩選,獲得高一致性的群體SNP。基于篩選得到的SNP 位點,運用數學統計學方法,對19 份豆瓣菜資源進行群體遺傳結構和親緣關系分析。基于最大似然法,利用admixture 軟件分析樣品的群體結構,分別假設樣品的分群數(K 值)為1~10,對每個K 值進行5 次模擬計算,并根據種質的最大隸屬概率將它們分配到相應的組(Alexander et al.,2009)。基于開發的SNP 位點,通過MEGA6(Saitou &Nei,1987;Tamura et al.,2011)軟件的鄰接算法和cluster(Dunteman,1989;de Hoon et al.,2004)軟件分別構建樣品的群體進化樹并進行主成分分析。
對19 份豆瓣菜資源的3 個質量性狀進行多樣性分析得出:豆瓣菜葉色有綠色和深綠色2 種(圖1),二者分別占73.7%和26.3%;莖色有綠色、深綠色和褐綠色3 種(圖2),綠色占89.4%,深綠色和褐綠色各占5.3%;89.5%的資源頂端小葉為卵圓形,10.5%為近圓形(圖1)。
豆瓣菜不同資源間變異系數較低且相差不大,介于7.69%~16.45%之間(表2)。

表2 豆瓣菜種質資源數量性狀的遺傳多樣性分析結果
頂端小葉長最短的2 份資源分別為濟南野生豆瓣菜(3.07 cm)和以色列豆瓣菜(3.35 cm),頂端小葉寬最窄的2 份資源分別為濟南野生豆瓣菜(2.88 cm)和以色列豆瓣菜(3.17 cm),說明濟南野生豆瓣菜葉片最小,以色列豆瓣菜次之;以色列豆瓣菜株高最矮(23.55 cm);莖粗最小的3 份資源分別為八里村野生豆瓣菜(0.47 cm)、江西大葉豆瓣菜(0.47 cm)和以色列豆瓣菜(0.49 cm);以色列豆瓣菜葉柄最短(6.23 cm),其次是江西大葉豆瓣菜(7.08 cm)。說明參試的19 份資源中以色列豆瓣菜植株最矮,葉柄最短,莖稈較細,葉片較小。
頂端小葉長最長的2 份豆瓣菜資源分別為仰光-2 豆瓣菜(4.98 cm)、英國大葉豆瓣菜(4.78 cm),頂端小葉寬最大的3 份資源分別為仰光-2 豆瓣菜(4.10 cm)、太原豆瓣菜(4.10 cm)和英國大葉豆瓣菜(4.00 cm),說明仰光-2 豆瓣菜葉片最大,英國大葉豆瓣菜次之;株高最高的2 份資源分別為河北邯鄲豆瓣菜(40.25 cm)和仰光-2 豆瓣菜(37.00 cm);莖粗最大的3 份資源分別為玉龍雪山豆瓣菜(0.62 cm)、河北邯鄲豆瓣菜(0.58 cm)和大廟場野生豆瓣菜(0.56 cm);葉柄最長的2 份資源分別為大廟場野生豆瓣菜(11.70 cm)和玉龍雪山豆瓣菜(10.92 cm)。說明仰光-2 豆瓣菜葉片最大,且植株較高,玉龍雪山豆瓣菜和大廟場野生豆瓣菜莖稈較粗、葉柄較長。
利用SPSS 21 軟件對豆瓣菜種質資源的8 個性狀進行聚類(圖3),可以將供試材料分為2 類。類群Ⅰ包括1(以色列豆瓣菜)、14(河北邯鄲豆瓣菜)、18(美國豆瓣菜)、19(廣西豆瓣菜)4 份資源,這類資源葉色均為深綠色,莖色為褐綠色、深綠色或綠色,頂端小葉形狀為卵圓形或近圓形,這些性狀與其他資源存在明顯差異。類群Ⅱ有15份資源,包括2(五馬河野生豆瓣菜)、3(大廟場野生豆瓣菜)、4(仰光-1 豆瓣菜)、5(倒天河野生豆瓣菜)、6(江西大葉豆瓣菜)、7(英國大葉豆瓣菜)、8(花溪河野生豆瓣菜)、9(仰光-2 豆瓣菜)、10(龍泉野生豆瓣菜)、11(濟南野生豆瓣菜)、12(烏慶河野生豆瓣菜)、13(云南豆瓣菜)、15(玉龍雪山豆瓣菜)、16(太原豆瓣菜)、17(八里村野生豆瓣菜),這一類型資源葉色和莖色均為綠色,頂端小葉形狀均為卵圓形。19 份豆瓣菜資源的表型性狀聚類結果與它們的收集地及資源類型(地方品種或野生資源)均不相關。
通過對白菜參考基因組進行電子酶切方案預測,確定用于豆瓣菜的限制性內切酶組合為RsaⅠ+HaeⅢ,酶切片段長度在364~464 bp 的序列定義為SLAF 標簽,共預測到104 107 個SLAF 標簽。為了確定酶切方案實施的有效性,本試驗同時將水稻日本晴的測序數據與其參考基因組進行比對,結果顯示水稻雙端比對效率為92.69%,酶切效率為86.83%,表明酶切反應正常,SLAF 建庫成功。
經Illumina HiSeqTM2500 測序平臺測序,共獲得49.21 Mb 的讀長數據,各樣品所獲得的讀長數目在186 719~3 119 305 范圍內。其中,江西大葉豆瓣菜獲得的數據量最大,為3 119 305 個讀長,對照水稻的數據量最小,為186 719 個讀長。測序質量值Q30 的范圍在88.69%~90.37%之間,仰光-1 豆瓣菜的Q30 值最高,對照水稻的Q30值最低,均值為89.81%,說明測序堿基錯誤率低,所獲數據合格。測序獲得的GC 含量范圍在39.69%~44.28%之間,對照水稻的GC 含量最高,濟南野生豆瓣菜GC 含量最低,均值為40.41%,豆瓣菜資源的GC 含量普遍不高,達到測序要求。
共開發355 141 個SLAF 標簽,樣品的平均測序深度為23.78×,對355 141 個SLAF 標簽進行分型,最終得到3 種類型的SLAF 標簽:多態性標簽、非多態性標簽、重復性標簽,其中多態性的SLAF 標簽有33 386 個,多態性的SLAF 標簽稱為Marker,利用得到的33 386 個多態性的SLAF 標簽進一步進行SNP 位點的開發,最終共獲得102 704個SNP 標記。
根據完整度>0.5、MAF >0.05,對上述所有的SNP 標記進行過濾,共得到37 827 個高一致性群體SNP。基于過濾后的SNP,采用admixture 軟件分析樣品的群體結構,分別假設樣品的分群數(K值)為1~10,進行聚類。并對聚類結果進行交叉驗證,根據交叉驗證錯誤率的谷值確定最優分群數為1,說明19 份豆瓣菜資源只能分為一組,很可能來源于同一個原始祖先。K 值為1~4 的聚類情況及各個K 值對應的交叉驗證錯誤率見圖4。
基于過濾后的SNP,采用MEGA6 軟件的neighbor-joining 算法,構建樣品的群體進化樹。聚類分析明顯地將19 份豆瓣菜資源分為一組,與用admixture 軟件分析的結果一致,所有資源的遺傳多樣性指數π 值為0.010 7。其中,11(濟南野生豆瓣菜)、14(河北邯鄲豆瓣菜)、1(以色列豆瓣菜)、18(美國豆瓣菜)、19(廣西豆瓣菜)等5 份豆瓣菜資源的親緣關系較近(亞組Ⅰ),2(五馬河野生豆瓣菜)、3(大廟場野生豆瓣菜)、4(仰光-1 豆瓣菜)、5(倒天河野生豆瓣菜)、6(江西大葉豆瓣菜)、7(英國大葉豆瓣菜)、8(花溪河野生豆瓣菜)、9(仰光-2 豆瓣菜)、10(龍泉野生豆瓣菜)、12(烏慶河野生豆瓣菜)、13(云南豆瓣菜)、15(玉龍雪山豆瓣菜)、16(太原豆瓣菜)、17(八里村野生豆瓣菜)等14 份豆瓣菜資源親緣關系較近(亞組Ⅱ),進化樹見圖5。19 份資源基于SNP 的聚類結果與收集地及資源類型(地方品種或野生資源)亦不相關,與表型性狀聚類結果相一致。PCA 分析結果顯示(圖6),參試豆瓣菜樣品均是一些零散的點,說明參試的19 份豆瓣菜資源均為一個組,其結果與群體結構和系統發育分析結果相一致。
以色列豆瓣菜、江西大葉豆瓣菜、英國大葉豆瓣菜、美國豆瓣菜和廣西豆瓣菜屬于地方品種,遺傳多樣性指數π 值為0.012 1;其余14 份資源屬于野生資源,π 值為0.012 2;地方品種和野生資源之間的遺傳分化指數Fst 為0.030 2。
通過對19 份豆瓣菜資源進行表型性狀分析,發現3 個質量性狀變異不明顯,豆瓣菜葉色和莖色主要為綠色,頂端小葉主要為卵圓形。5 個數量性狀的變異系數均較低(7.69%~16.45%),說明保存于國家種質武漢水生蔬菜資源圃中的豆瓣菜種質資源各數量性狀的變異范圍較窄,低于豌豆和甘藍型油菜種質資源數量性狀的變異范圍(萬述偉 等,2017;雷偉俠 等,2019)。但在較窄的變異范圍內仍存在具有優良性狀的資源,可對目標性狀進行改良。如仰光-2 豆瓣菜葉片最大,且植株較高;大廟場野生豆瓣菜和玉龍雪山豆瓣菜莖稈較粗、葉柄較長。
基于8 個表型性狀的聚類分析,將19 份豆瓣菜資源劃分為2 類,第Ⅰ類包括以色列豆瓣菜、河北邯鄲豆瓣菜、美國豆瓣菜和廣西豆瓣菜4 份資源,第Ⅱ類包括剩余的15 份資源。而基于SNP 的聚類分析結果與表型性狀分類結果類似,以色列豆瓣菜、濟南野生豆瓣菜、河北邯鄲豆瓣菜、美國豆瓣菜和廣西豆瓣菜等5 份資源親緣關系較近(亞組Ⅰ),剩余的14 份資源親緣關系較近(亞組Ⅱ),且群體結構分析以及PCA 分析均將19 份種質資源全部分為一組,說明19 份種質資源雖然表型上存在變異,但遺傳基礎狹窄,遺傳多樣性不高,群體內部分化較小。
本試驗利用37 827 個SNP 對不同豆瓣菜種質資源的遺傳結構進行了精確研究,群體結構、系統進化樹及PCA 分析均顯示19 份豆瓣菜資源屬于同一組。趙博等(2007)以本試驗中的6 個豆瓣菜品種以及河內小葉豆瓣菜和廣東小葉豆瓣菜為研究對象,利用79 個RAPD 引物和34 個ISSR 引物對這8 個品種的基因組DNA 進行擴增,并根據所得條帶進行聚類分析,2 種標記都可以較好地將8 個品種按親緣關系遠近劃分為3 個不同的類群。本試驗結果與之不一致,可能是因為本試驗采用的是SNP分子標記,標記數量遠高于趙博等(2007)利用的RAPD 和ISSR 標記數量,由于RAPD 和ISSR 標記數量有限,不能完全真實反映物種的遺傳多樣性。趙博等(2007)的試驗結果中,2 種分子標記雖然將8 個豆瓣菜品種分為3 個類群,但在同一個類群中同時存在國外豆瓣菜與國內豆瓣菜資源,二者不能很好地區分開,與本試驗結果一致。本試驗中19 份豆瓣菜資源的聚類結果與它們的地理位置并不相關,可能與不同地理位置種質資源之間的交換有關(Liu et al.,2012)。本試驗中地方品種的遺傳多樣性指數π 值為0.012 1,野生資源為0.012 2,兩組的π 值基本相同,且地方品種和野生資源之間的遺傳分化指數Fst 為0.030 2。前人研究表明,水稻、大豆等作物野生資源的遺傳多樣性高于栽培品種(Guo et al.,2010;Huang et al.,2012);Wright(1931)認為Fst 為0~0.05 時,群體間遺傳分化很小,可以不考慮。本試驗中豆瓣菜地方品種與野生資源聚為一組,不能很好地區分開,表明在我國云南、貴州、山西等地野外地區發現的大面積疑似野生豆瓣菜與栽培品種農藝性狀相似,堿基差異也較小,這些野外分布的豆瓣菜可能不是野生資源,而是由栽培品種逃逸形成。
豆瓣菜起源于地中海沿岸,14 世紀初英國和法國均有栽培,后傳入美國、南非、澳大利亞和新西蘭,1780 年前后傳入日本,20 世紀初由海道傳入中國(中國農業科學院蔬菜研究所,1982;孔慶東,2004)。本試驗中1 份材料來自以色列,2 份來自緬甸,1 份來自美國,1 份來自英國,剩余14份來自中國不同省份,雖然材料來自世界各地,但19 份豆瓣菜資源屬于同一組,所有材料之間親緣關系較近,遺傳背景差異不大,很可能來源于同一個栽培類型。