胡天華,魏慶鎮,汪精磊,王五宏,胡海嬌,嚴亞琴,包崇來
(浙江省農業科學院 蔬菜研究所,浙江 杭州 310021)
蘿卜(RaphanussativusL.)屬于十字花科蘿卜屬,是一種重要的根菜類蔬菜作物。蘿卜以膨大的肉質根為主要產品器官,可以熟食、加工腌制和生食,不僅營養豐富,而且富含糖、維生素和蘿卜硫素等物質,具有較高的藥用食療價值[1]。肉質根的大小和形狀直接影響蘿卜的產量與品質,是蘿卜育種的重要目標性狀。蘿卜的肉質根分為根頭部、根頸部和真根三個部分;根頭部為短縮莖,其上著生芽和葉,根頸部是幼苗下胚軸發育的無側根部分,真根一般著生兩列側根。
蘿卜肉質根的大小和形狀是復合性狀,一般可以用肉質根長度、橫徑、根形指數以及肉質根質量等性狀來衡量。蘿卜資源中,肉質根的直徑最小有1 cm,最大可以到30 cm,肉質根長最短有3 cm,最長可以達到200 cm[2];孫玉燕等[3]將蘿卜的肉質根分為圓柱、圓錐、卵圓、扁圓、梨形和圓臺等15種主要形狀。蘿卜肉質根大小和形狀為寡基因或多基因控制的數量性狀,關于蘿卜肉質根大小QTL定位研究較少。荊贊革[4]以肉質根大小差異顯著的親本配制雜交組合,研究了蘿卜肉質根質量的遺傳規律,發現蘿卜肉質根質量是由主基因和多基因控制的數量性狀,并分離獲得了與其相關的基因組片段。Tsuro等[5]利用F2分離群體構建了包含198個標記的遺傳圖譜,定位到3個與根形指數相關QTL位點,總共可解釋42.4%表型變異率,同時檢測到肉質根橫徑相關QTL位點2個,其中8號連鎖群上的QTL位點通過影響肉質根橫徑來影響根形;Hashida等[6]利用重組自交系群體,結合兩年的性狀數據,定位到3個與肉質根根重相關的QTL位點。目前,蘿卜肉質根大小性狀相關的基因定位研究較少,蘿卜肉質根大小研究處于QTL初定位階段,仍未發現有可用的有效的與肉質根大小緊密連鎖的分子標記,也未發掘調控肉質根大小相關的主效的基因。與蘿卜肉質根發育相關的研究多集中在不同發育時期轉錄組研究方面[1-2,7-9],相關研究發掘了大量蘿卜肉質根不同發育時期的差異基因,但直接調控蘿卜肉質根根形相關的基因仍有待發現和驗證,肉質根膨大的分子機制也尚未闡明。
數量性狀極端性狀混池測序技術(QTL-seq)能夠通過混池的方法排除復雜遺傳背景的干擾,可以在F2代實現主效QTL位點的快速定位[10],已在水稻、番茄和黃瓜等多種作物上得到廣泛應用[11-14];蘿卜中也利用該方法對蘿卜的肉質根皮色和肉質根的肉色進行了基因的定位挖掘[15-16]。隨著測序技術的發展和測序成本的降低,目前已公布了5個蘿卜的基因組序列[2,17-20],其中Moghe等[18]發表了野生蘿卜基因組,其余均為不同栽培蘿卜基因組,而且蘿卜基因組質量不斷提高,最新的基因組利用單分子實時測序技術,基因組contig N50達到了1.2 Mb[20],完整性和連續性均有較大提高,這為不同大小蘿卜肉質根形成的關鍵基因挖掘提供了便利,同時為蘿卜分子標記開發及分子育種等提供了重要基礎。
本研究以肉質根大小和形狀差異較大的親本配制了F2分離群體,并對根形指數性狀進行了QTL定位分析。結合最新的蘿卜參考基因組,利用QTL-seq方法,分析獲得了4個與肉質根根形指數相關的QTL位點,為蘿卜肉質根根形指數性狀進一步精細定位和候選基因挖掘克隆奠定了基礎。
利用肉質根根形差異較大親本LLYH與CLA雜交,獲得300株F2分離群體。母本LLYH為小型扁圓蘿卜,肉質根扁圓形,正常成熟期肉質根長約30.0 mm,最大橫徑約為35.0 mm;父本CLA為大型長白蘿卜,肉質根倒長圓錐形,正常成熟期長約500.0 mm,最大橫徑約為80.0 mm(圖1)。親本、F1及F2于2018年秋季種植在浙江省農業科學院蔬菜研究所試驗基地,9月28日播種,11月12日測量,然后對肉質根長(root length,RL)和肉質根最大橫徑(root diameter,RD)進行性狀數據統計,利用300.0 mm數顯游標卡尺進行測量,單位mm,統計標準參照文獻[21],同時計算獲得肉質根根形指數(RL/RD)。

圖1 生長期45 d時的母本、F1和父本的肉質根
選取親本及F2單株幼嫩葉片進行取樣,樣品用液氮速凍后,放在-80 ℃超低溫冰箱保存備用。根據計算的肉質根根形表型數據,選取10%左右的極端性狀個體單株,利用改良的CTAB法分別對每個選取的極端單株進行DNA提取;利用瓊脂糖凝膠電泳檢測DNA質量,同時用NanoDrop檢測DNA濃度,然后根據濃度進行樣品DNA等量混池,組成小根形池(S)和大根形池(L)。利用Illumina測序技術平臺對親本及DNA池進行雙端測序。
利用最新發表的蘿卜基因組作為參考基因組[20],使用BWA軟件獲得測序Clean Reads在參考基因組上的比對定位結果,然后使用Picard(http://sourceforge.net/projects/picard/)進行去重復,GATK進行局部重比對、堿基質量值校正等預處理,以保證檢測得到的單核苷酸多態性(single nucleotide polymorphism,SNP)準確性,再使用GATK進行SNP的檢測和過濾,并得到最終的SNP位點集。然后對SNP進行過濾,首先過濾掉有多個基因型的SNP位點,其次過濾掉read支持度小于4的SNP位點,再次過濾掉混池之間基因型一致的SNP位點以及隱性混池基因不是來自于隱性親本的SNP位點,最終得到高質量的可信SNP位點。根據QTL-seq方法計算SNP指數[10],以1 Mb為滑動窗口,以10 kb為步移,采用DISTANCE方法對ΔSNP-index進行擬合,計算每個滑動窗口內的平均指數。根據99%的置信區間篩選候選QTL位點區域。
一共統計了300株F2單株的肉質根長和橫徑表型數值,其中肉質根長度最小為55.44 mm,最大為275.17 mm,平均值為123.59 mm;肉質根橫徑最大為43.52 mm,最小為104.20 mm,平均為77.73 mm。肉質根長和橫徑均呈現連續性變化(圖2、圖3),是由多基因控制的數量性狀遺傳。母本LLYH正常商品肉質根(30 d)根形指數約為0.857,父本CLA正常商品肉質根(80 d)根形指數約為3.750,雜交F1肉質根根形指數約為1.764,F2群體中根形指數呈現連續性變化(圖4),最小為0.708,最大為3.761,平均值為1.626,暗示根形指數性狀是由多基因控制的數量性狀遺傳[5]。根據表型數值計算3個性狀之間的相關性,其中,肉質根長與根形指數相關系數為0.883,肉質根橫徑與根形指數相關系數為-0.448,肉質根長和橫徑的相關系數為-0.007(表1)。

圖2 F2群體蘿卜肉質根長度分布

圖3 F2群體蘿卜肉質根橫徑分布

圖4 F2群體蘿卜根形指數分布

表1 表型相關系數
根據肉質根根形指數值,各選取30株極端單株(圖5),提取DNA,進行后續的極端混池測序。其中,肉質根根形指數極端小的池根形指數在0.708~1.028,平均根形指數為0.908,肉質根根形指數極端大的池的根形指數在2.407~3.761,平均根形指數為2.838。

圖5 F2群體中部分極端混池單株圖
本研究經測序得到53.38 Gbp數據,平均Q30達到93.06%,GC含量在37.40%~37.50%之間(表2)。樣品與參考基因組平均比對效率為96.31%,親本測序平均深度為16X,極端池測序平均深度為22.5X,基因組覆蓋度為86.62%(至少一個堿基覆蓋),親本及極端池測序質量較好,數據量滿足QTL-seq分析要求。利用最新蘿卜參考基因組[20],經檢測和一系列過濾后,總共獲得2 159 693個SNP位點,其中高質量的可信SNP位點913 322個,用于后續QTL-seq分析中SNP-index的計算。

表2 親本及極端池測序數據統計
根據QTL-seq方法,計算獲得△(SNP-index)值,為進一步去除假陽性SNP,利用SNP在基因組上的物理位置信息,對相同染色體上Δ(SNP-index)值進行擬合,然后以1 Mb為滑動窗口,1 kb為步長進行作圖,分別劃定99%(紅色)、95%(藍色)和90%(綠色)的置信水平作為篩選閾值條件。通過圖6可以看出,在R2染色體有兩個峰值區域超過99%閾值線,在R6染色體有峰值區域超過95%閾值線,在R4染色體有一小段區域超過90%閾值線。一共獲得4個肉質根根形指數相關的QTL位點,根據閾值,其中R2號染色體有兩個主效QTL位點rs2.1和rs2.2,R4和R6號染色體分別有兩個微效QTL位點rs4.1和rs6.1。根據SNP位置信息和閾值線獲得QTL位置區域分別為:rs2.1,21.66~26.03 Mb;rs2.2,30.79~36.56 Mb;rs4.1,39.04~40.43 Mb;rs6.1,11.53~13.40 Mb(圖6,表3)。

表3 肉質根根形指數QTL位點信息匯總表

橫坐標為染色體名稱,彩色的點代表計算出來的Δ(SNP-index)值,黑色的線為擬合后的Δ(SNP-index)值。其中紅色、藍色和綠色的線分別代表置信度為0.99、0.95和0.90的閾值線。
蘿卜肉質根的根形指數除了受基因遺傳調控外,還受到環境與生理等多種復雜因素的影響,因此,開展肉質根根形指數的研究十分有必要,同時也面臨較多環境因素的影響,相關基因的QTL定位較為困難。外界因素像光照、溫度、水分、礦質營養、二氧化碳和土壤狀況等均能影響蘿卜肉質根的長度和橫徑,從而影響蘿卜肉質根的根形指數[22-23];同時蘿卜肉質根的形成過程中也受到激素的影響,如生長素、細胞分裂素、赤霉素和乙烯等均能影響蘿卜的長度和橫徑[24];此外,也有研究認為蘿卜肉質根大小受到光合同化物的影響,蔗糖由源(地上部)向庫(地下部)運輸的動力來源于蔗糖從葉片的韌皮部裝載,然后在肉質根中卸載并儲存的驅動[25]。由于蘿卜肉質根生長在地下,肉眼難以直接觀察,必須將蘿卜拔出進行性狀統計,這也增加了表型數據的統計誤差,使QTL定位準確度降低,增加了基因挖掘的難度。本研究利用肉質根根形指數差異較大的親本配制了分離群體,所有材料全部種植在土質疏松、透水性較好的砂質土地塊,種植過程中也保持水肥一致均衡,盡量減小了外界因素對肉質根生長的影響,以保證定位結果的準確性。因為親本生長周期差異也較大,小型扁圓蘿卜LLYH與大型長白蘿卜CLA相比,正常生長周期短近50 d,所以F2單株每個蘿卜的生長周期也不同,本研究采取了集中統一采收的方式,在生長期45 d時,全部進行肉質根長度和橫徑的表型數據測量;此時,有的蘿卜可能已經超過了正常的生長期,有的蘿卜可能剛完成正常生長周期,達到商品蘿卜要求,有的蘿卜可能還處于生長發育早期,這也可能對定位結果造成一定的影響,因此,定位結果中也有可能存在與肉質根生長發育相關的QTL位點。
前人研究多集中在不同發育時期蘿卜肉質根轉錄組、miRNA和蛋白質組方面。Zaki等[26]發現,有11個基因在兩個不同肉質根形狀的蘿卜中存在明顯差異;Wang等[7]發現,植物激素在肉質根的發育過程中起了重要作用;Mitsui等[2]對肉質根發育時期做了詳細生物學觀察和轉錄組分析,發現碳水化合物代謝相關基因在發育的肉質根中表現活躍,尤其是在細胞增殖的組織中,同時發現蔗糖合酶(SUS1)基因與肉質根發育相關;余如剛[1]分析了2個蘿卜蔗糖代謝基因RsSuSy1和RsSPS1基因,克隆分析了蘿卜肉質根形成相關RsCLE41和RsSAUR;杜雪玲等[9]發現,植物激素合成與激素信號轉導相關基因、蔗糖代謝相關基因和細胞壁代謝相關基因可能是調控蘿卜肉質根大小品種間差異的關鍵基因;Muvva等[27]在蘿卜中發現了48個保守miRNAs,并預測了16個潛在的基因;余如剛[1]預測了191個肉質根膨大過程中差異表達miRNA的靶基因,另外通過DGE和miRNAs關聯分析,鑒定到114對miRNA-mRNA。此外,姜立娜[28]在肉質根發育不同時期發現25個差異明顯蛋白點,并對差異蛋白基因情況進行了分析。以上研究發現的差異基因可以結合QTL定位結果,去挖掘定位區域內的差異基因,并驗證候選基因是否與肉質根的大小相關;通過基因組、轉錄組、蛋白組和代謝組等多組學聯合的方法系統分析蘿卜肉質根的膨大機理。不過,前期研究雖然發現了較多差異基因,但是這些差異基因相關序列信息難以查找匯總;各項研究可能參考了不同版本蘿卜基因組,不同版本蘿卜基因組存在的差異也使相關差異基因的序列難以進行匯總分析。
蔬菜變態根的發育受到外部環境和內部遺傳因素的綜合影響,涉及細胞周期、植物激素、轉錄因子等不同方面的調控,目前,對蔬菜變態根發育的研究還處于初步階段[3]。蘿卜是典型的變態根類蔬菜,肉質根大小和形狀相關研究較少,蘿卜肉質根大小和形狀QTL定位研究可以參考番茄、甜瓜和黃瓜等果實大小和形狀的相關研究[29-31],但相較于果實性狀的研究,長在地下的肉質根相關性狀明顯難度更大,相關的調控機理也存在較大差異。目前,關于蘿卜肉質根根形指數性狀的QTL定位研究較少,前期雖有利用連鎖群進行根形指數定位研究[5],但因為遺傳圖譜精度不夠,上圖標記較少,所用材料存在差異等因素,較難進行對比。蘿卜根形指數研究還需要開展更多的QTL定位研究,發現一些一致性的QTL位點,并結合特殊的群體和先進測序技術,進行后續的基因精細定位和功能驗證研究。