肖文芳 李 佐 陳和明 呂復兵
(廣東省農業科學院 環境園藝研究所/廣東省園林花卉種質創新綜合利用重點實驗室,廣州 510640)
蝴蝶蘭屬(Phalaenopsis)為蘭科商品化程度最高的屬,具極高的觀賞價值和商業價值,是全球最重要的觀賞花卉之一?;ㄉ怯^賞花卉最重要的性狀評價指標之一,直接影響其觀賞價值和商業價值[1]。有別于絕大多數觀賞花卉的單色花和少數復色花,蝴蝶蘭的花瓣和萼片具豐富的顏色分布類型,除勻色花外,絕大多數種質資源的花瓣和萼片為雙色,可分為底色和斑色,一般底色為整朵花的主色,斑色的顏色分布類型則包括陰影、鑲邊、條紋、線紋、網紋、斑點、斑塊、陰影和鑲邊、線紋和斑點、鑲邊和線紋、鑲邊與線紋和斑點[2]。植物花色屬于復雜的數量性狀,受多基因控制,遺傳基礎復雜[3]。蝴蝶蘭原生種眾多,商品品種經過一百多年的雜交選育,血統復雜,與原生種參考基因組的比對效率極低,且花色調控機制極為精細,通過轉錄組和簡化基因組測序挖掘性狀相關基因和關聯分子標記仍然是目前研究商品品種花色遺傳機制的重要手段[1,4],但尚未開發出花色相關分子標記。
特異位點擴增片段測序(Specific-locus amplified fragment sequencing,SLAF)是一種根據物種個性化設計方案的簡化基因組測序技術,能夠獲取全基因組范圍內的多態性標簽并快速準確篩選性狀關聯單核苷酸多態性(Single-nucleotide polymorphism,SNP)。群分法(Bulked segregant analysis,BSA)與SLAF的結合,能夠進一步加快對復雜性狀定位的速度,目前已在水稻黃葉轉綠基因定位[5]、玉米果皮纖維素含量相關基因定位[6]、大豆酸性磷酸酶活性候選基因挖掘及功能標記開發[7]、大豆半矮稈基因定位[8]、紅麻第一花節位置相關SNP篩選[9]、辣椒果實花青素積累相關基因定位[10]和紫薇矮化性狀相關SNP標記篩選[11]等研究得到成功運用。SLAF-BSA技術目前在蘭科植物上還沒有應用,但Lu等[12]單獨利用SLAF技術成功構建了一張包含了8 573個SLAF標簽的石斛蘭高密度遺傳圖譜,并篩選出5個與石斛多糖含量相關的數量性狀座位(Quantitative trait locus,QTL);Wang等[13]利用SLAF技術對文心蘭長期繼代培養中的體細胞無性系變異進行鑒定和篩選,證明SLAF技術在蘭科植物上適用。
蝴蝶蘭花底色直接決定整株花的主色調,且在傳統雜交育種過程中發現底色與斑色是互不干擾的2個獨立遺傳性狀。細化花色這一復雜性狀,針對性地篩選與底色相關的分子標記,去除斑色的干擾,能夠更精準獲取與單個性狀相關聯的分子標記,為輔助育種提供更精確有效的篩選依據。本研究基于SLAF-BSA技術,對2個親本和雜交F1代構建的2個極端性狀混池(黃色底色混池和白色底色混池)DNA文庫進行簡化基因組測序,與花底色性狀進行關聯分析篩選相關標記位點,并在F1代群體及其他種質資源中進行驗證,為蝴蝶蘭分子標記輔助育種及花色改良基因工程提供理論支持。
以‘黃金豹’蝴蝶蘭(Phal.Frigdaas Oxford)為母本,‘白天使’蝴蝶蘭(Phal.Join Angel)為父本構建雜交群體,共獲得505個雜交后代,黃色底色個體與白色底色個體的比例為273∶232。后代可根據底色和斑色分為11個組(圖1),性狀分離具體信息詳見李佐等的研究[14]。從Group 1、3、5、7和9這5個黃色底色群體中隨機選取33個單株加上Group 11中的2個單株組成黃色底色混池(ab),從Group 2、4、6、8和10這5個白色底色群體中隨機選取35個單株組成白色底色混池(aa),其中Group 11中的2個單株對應斑紋最少的Group 4。所有實驗材料均栽培保存于廣東省農業科學院環境園藝研究所白云基地蘭花資源圃中,于2018年采用統一孔徑打孔器分別等量采集樣品倒數第二片葉頂端中部的葉片組織,4 ℃保存備用。

圖1 雜交親本及F1代個體代表株系的花部Fig.1 Flower characters of 11 Phalaenopsis F1 offspring groups and the parents
1.2.1主要試劑及儀器
主要試劑:SNaPshot相關 PRISM?SNaPshotTM Multiplex Kit試劑盒購自Applied Biosystems公司;TaqHotStart DNA Polymerase購自Kapabiosystems公司;SAP酶購自Fermentas公司;ExoI酶、RsaI酶、HaeⅢ酶和CIP酶購自New England Biolabs(NEB)公司。
主要儀器:NanoDrop 2000(Thermo公司,美國);HiSeqTM 2500測序平臺(Illumina公司,美國);Beckman Allgre 21R高速冷凍離心機(Beckman公司,美國);BC-subMIDI電泳儀(北京六一儀器廠);JY300C電泳槽(北京君意東方電泳設備有限公司);BioSens SC 810B凝膠成像儀(上海山富科學儀器有限公司);PTC-100PCR儀(MJ Research公司,美國);3730XL測序儀(ABI公司,美國)。
采用改良的CTAB法[4]提取所有樣品DNA,利用1%瓊脂糖電泳和NanoDrop 2000檢測DNA的完整性和純度。經純度和完整性檢驗合格后將黃色底色單株和白色底色單株DNA分別等量混合成終濃度為40 ng/μL的黃色底色DNA混池和白色底色DNA混池,用于后續SLAF測序。
1.2.3文庫構建、測序及SLAF標簽開發
通過預實驗發現已有的小蘭嶼蝴蝶蘭(Phal.equestris)基因組和鐵皮石斛(Dendrobiumcatenatum)基因組等蘭科植物基因組對本研究采用的商品品種的參考性極低,因此采用無參考基因組的測序方法,以水稻基因組(Oryzasativa)為參考來評估實驗建庫的準確性,利用酶切反應預測軟件SLAF_Predict 進行系統分析,根據其重復序列、GC含量和基因特點等確定采用RsaI+HaeIII雙酶切對樣本基因組DNA分別進行酶切。得到的酶切片段進行3′端加A處理、連接Dual-index測序接頭、PCR擴增、純化、混樣和切膠選取目的片段,文庫質檢合格后用Illumina HiSeqTM2500測序平臺進行測序。對測序得到的各樣品的reads數據進行評估,通過reads間聚類的方法,在親本和混池中開發SLAF標簽。
1.2.4SNP_index關聯分析
SNP_index是通過尋找混池之間基因型頻率的顯著差異,用Δ(SNP_index)統計從而進行標記關聯分析的一種方法。Marker與性狀關聯度越強,Δ(SNP_index) 越接近于1。以大于99% Marker的Δ(SNP_index)的值作為閾值,大于該閾值的標記則為與性狀顯著關聯的標記。計算方法如下:
SNP_index(ab)=Mab/(Pab+Mab)
(1)
SNP_index(aa)=Maa/(Paa+Maa)
(2)
Δ(SNP_index)= SNP_index(aa)-SNP_index(ab)
(3)
式中:Maa和Paa分別表示白色底色混池(aa)來源于母本和父本的深度;Mab和Pab分別表示黃色底色混池(ab)來源于母本和父本的深度。
1.2.5SNaPshot技術篩選SNP分子標記
根據關聯分析獲得的標記,參照Hommais等[15]的方法設計引物,在父母本和后代11個組群中每組挑選1株未在建庫中使用的子代、2個白色底色種質資源和2個黃色底色種質資源驗證并篩選底色相關SNP標記。預擴增采用10 μL反應體系:2 μL (20 ng/μL)樣本基因組DNA、1 μL 10×Buffer I、0.8 μL dNTP、2 μL預擴增引物(F+R,5 μmol/L)、0.1 μL KAPATaqHotStart DNA 聚合酶 (5 U/μL)、4.1 μL ddH2O。反應程序:94 ℃預變性5 min;94 ℃變性30 s,退火(50~60 ℃)30 s,72 ℃延伸 30 s,共10個循環;94 ℃變性30 s,50 ℃退火30 s,72 ℃延伸30 s,共30個循環;72 ℃延伸10 min。取2 μL產物上2%瓊脂糖凝膠電泳檢測質量。每個樣本的預擴增產物等比例混合后取4 μL,加入SAP酶1.33 μL,ExoI酶(20 U/μL)0.27 μL 混合成5.6 μL體系37 ℃酶切1 h,75 ℃變性20 min。取酶切后產物1.2 μL,加2 μL延伸引物混合物、0.5 μL ABI Mix、0.4 μL 10×Buffer I和0.9 μL ddH2O,96 ℃變性10 s、50 ℃退火5 s、60 ℃延伸30 s,共進行30個循環的延伸反應。取延伸反應產物6 μL 加入1 μL CIP酶,37 ℃ 1 h、75 ℃ 15 min進行純化。96孔板中每孔加入分子量內標0.5 μL,甲酰胺8.5 μL,純化后延伸產物1 μL,95 ℃ 變性3 min,于3730XL測序儀檢測。
經Illumina HiSeq TM 2500測序平臺進行測序,對父本、母本、白色底色混池和黃色底色混池測序數據的reads數量、Q30和GC含量等進行統計,共獲得37.90 M reads數據,測序平均Q30為92.57%,平均GC含量為38.47%,具體結果見表1。測序質量值Q30是評估高通量測序單堿基錯誤率的重要指標,測序質量值越高對應的堿基測序錯誤率越低,本研究中4個樣本的測序質量值Q30均在90%以上,說明測序堿基錯誤率低,所獲數據合格。
第一,經由引導附近人們參與到營造林活動中的方式,有助于增加農村就業機會,促使廣大農民可以經由投入勞務的方式獲取相應的收入,對更好的維護和諧社會的穩定性具有積極意義。第二,經由項目建設,加大力度宣傳以及應用多種現代化的經濟林高產栽培技術等,有助于激發群眾的種植發展熱情,有助于推進產業發展進程。第三,對果樹林實施有效的一次性種植操作,其穩產收獲期超過二十年,有助于確保農民的收入穩定。

表1 樣品測序數據評估和SLAF標簽統計Table 1 Statistic results of sample sequencing data assessment and SLAF tag
剔除各組樣本間的重復SLAF標簽數,本研究在4組樣本中共開發出164 874個不同的SLAF標簽,SLAF標簽親本平均測序深度為42.05×,混池平均測序深度為46.00×。其中父本的測序深度為52.41×,母本的測序深度為31.68×,aa池的平均測序深度為54.17×,ab池的平均測序深度為37.82×。針對所有樣本開發得到的SLAF標簽,根據等位基因數和基因序列之間的差異進行多態性分析,共得到3種類型的SLAF標簽:包含SNP/Indel多態性位點的多態型SLAF標簽、沒有多態性位點的非多態性SLAF標簽和位于重復序列區的SLAF標簽。其中多態性SLAF標簽共有21 031個,多態性比例為12.76%。
根據親本基因型來源對得到的21 031個多態性SLAF標簽,進行標記篩選。過濾親本測序深度5×以下的標記,根據親本的測序信息確定每個標記等位基因的親本來源,選取一種基因型來源于父本,另一種基因型來源于母本的多態性SLAF標簽共1 451 個進行后續的關聯分析。通過Δ(SNP_index)的方法,以大于99% Marker的Δ(SNP_index)的值0.745 5作為閾值,篩選出15個與性狀關聯程度較顯著的候選標記,含27個SNP位點(表2)。根據15個候選標記的擴增序列比對及注釋分析,未能發現定位于功能基因上的SNP位點。

表2 與蝴蝶蘭花底色性狀關聯的SNP標記Table 2 SNP markers associated with the flower ground color in Phal.
根據關聯分析獲得的15個標記的序列信息和SNP所在位點,過于靠近序列5′端或3′端的SNP位點不能進行有效擴增和檢測,設計出來自于14個標記片段上21個SNP位點的引物,通過對父母本、11個子代代表株和4個不同底色種質資源的基因組DNA為模板進行擴增和檢測,篩選出2個引物Marker35886(SNP為擴增序列的第60位堿基)和Marker70907(SNP為擴增序列的第147位堿基)的SNP位點鑒定效果較好(引物序列信息見表3),在父母本中的SNP檢測結果與SLAF測序結果一致,而在其他種質資源中的檢測率分別達到 66.67% 和73.33%,2個引物聯合使用的檢測率達到93.33%,具體檢測結果見表4。

表3 SNaPshot測序中Marker35886和Marker70907的相關引物序列信息Table 3 Primer sequences of Marker35886 and Marker70907 used in the SNaPshot

表4 Marker35886和Marker70907在不同種質資源中的檢測結果Table 4 Detection results of Marker35886 and Marker70907 in different germplasm resources
SLAF-BSA技術能夠克服沒有參考基因組和基因組復雜等問題,高通量地開發與復雜性狀關聯的SNP標記[7]。Ye等[11]通過SLAF-BSA技術篩選出2個與紫薇矮化性狀高度關聯的標簽,組合檢測效率可達93%;Li等[9]利用SLAF-BSA技術篩選到與紅麻第一花節位緊密相關的一個SNP位點,檢測效率達到91.2%;Wang等[10]通過SLAF-BSA技術篩選定位到12個基因與辣椒果實花青素的積累相關。本研究基于雜交F1代分離群體,利用SLAF-BSA技術在全基因組范圍上篩選蝴蝶蘭花瓣黃白底色相關SNP,并在未參與構建混池的后代和4個其他種質資源中進行驗證,找到2個與蝴蝶蘭黃白底色相關性較高的SNP位點,聯合檢測效率達93.33%,說明SLAF-BSA技術適用于蘭科植物復雜性狀相關標記篩選。
花色主要由花朵中花青素、類胡蘿卜素及甜菜色素的含量及分布決定[16],并且還受到色素細胞的pH、金屬離子、輔助色素[17]及花瓣表皮細胞形態[18]等因素的影響。目前,蝴蝶蘭花朵中主要花色素的合成途徑已較為清楚,關鍵結構基因和調控轉錄因子陸續被克隆和研究,但對整體調控機制的解析仍然很淺。研究發現,絕大部分花青素合成途徑相關結構基因和轉錄因子的表達量在紅色蝴蝶蘭花瓣中都顯著高于白色蝴蝶蘭[19],UFGT基因與紅花的形成高度相關[20],PeMyb2、PeMyb11和PeMyb12的不同表達比例會造成紅色蝴蝶蘭花瓣的不同顏色分布類型,沉默PeMyb2、PeMyb11和PeMyb12會分別導致整體紅色、紅色斑紋和紅色脈絡的消失[21]。黃色蝴蝶蘭花瓣中F3’H、UF3GT、bHLH的表達量低于紅色蝴蝶蘭花瓣中的表達量,但PAL和PSY的表達量高于紅色蝴蝶蘭花瓣中的表達量[1]。紫色蝴蝶蘭(Phal.schilieriana)花瓣中DFR的表達水平高于白色蝴蝶蘭[22]。基于這些關鍵結構基因和調控轉錄因子的研究,Sudarsono等[23]
開發了一系列針對花色相關基因的SNP引物,并用于30份蝴蝶蘭種質資源的聚類分析。但蝴蝶蘭分子標記目前主要是用于種質資源的親緣關系鑒定和品種鑒別上[24-25],很少有能夠與性狀關聯的標記被開發出來[4,26]。在對蘭科植物短距手參(Gymnadeniarhellicani)的研究中發現,SNP多態性導致一個R2R3-Myb轉錄因子提早終止表達,使得其調控的ANS基因表達量降低,花中紅色花青素減少,從而出現了有別于野生型黑紅色花的淺紅色花和白色花[27]。但基于6個花色相關結構基因開發的SNP未能根據花色將不同顏色的蝴蝶蘭資源區分開[23],表明蘭科植物花色形成和調控機制極其復雜且具有特異性,花色相關SNP的篩選不能局限于個別已知相關基因,需擴大到全基因組范圍內進行。
本研究利用SLAF-BSA技術在全基因組范圍篩選到2個與蝴蝶蘭花瓣黃白底色相關的SNP標記,聯合檢測效率達93.33%,可作為有效的分子標記位點在蝴蝶蘭育種早期進行輔助選擇。這樣的檢測效率在蝴蝶蘭漫長的育種過程中,特別是旨在特定選擇黃色底色或白色底色后代的育種計劃中,是一個可接受的可靠水平。但是,本研究中鑒定出的是連鎖標記而不是關聯到了關鍵基因本身的標記,在實際育種過程中存在一定的局限性,且本研究采用的雜交群體母本及后代存在斑紋,盡管在構建2個不同底色混池的時候采用了斑紋對應分離的個體,盡量屏除了斑紋對后續建庫分析的影響,但仍會在一定程度上影響篩選出的SNP位點與底色的相關性高低。另外,2個標記在雜交后代和其他種質資源中的擴增結果并不完全與SLAF測序結果一致,表明測序結果也存在一定技術層面的錯誤率。針對本研究存在的局限性,也基于蝴蝶蘭花色這一復雜性狀涉及眾多基因和調控通路的現狀,在單一雜交群體中篩選的少量相關SNP位點不能完全代表大量種質資源中的多態性,因此后續還需引入更多的研究手段對更多的種質資源進行分析和驗證,進一步加強相關研究來完善蝴蝶蘭花部底色關聯分析。
通過對蝴蝶蘭不同花瓣底色的親本和雜交分離后代混池進行SLAF測序,共獲得21 031個多態性SLAF標簽,關聯分析篩選出27個與黃白花瓣底色關聯性較高的SNP位點,在未參與構建混池的后代和4個其他種質資源中進行驗證,最終篩選得到2個聯合檢測效率達93.33%的SNP標記,表明SLAF-BSA分析方法可以用于蘭科植物花色等復雜性狀相關SNP位點的篩選。