徐建霞 丁延慶 馮周,2 曹寧 程斌 高旭 鄒桂花 張立異
(1.貴州省農業科學院旱糧研究所,貴陽 550006;2.貴州大學農學院,貴陽 550025;3.浙江省農業科學院作物與核技術利用研究所,杭州310021)
高粱(Sorghum bicolorL.Moench)作為世界第五大糧食作物,廣泛分布于世界的熱帶干旱和半干旱地區,為全球約5億人口提供糧食[1]。高粱作為C4作物,具有光合能力強、高生物學產量和高抗逆性(抗澇、抗旱、耐鹽堿和耐貧瘠)及基因組相對較小等特點,已逐漸成為禾本科作物基因組研究的一個模式作物[2]。株型是高粱育種的重要組成部分,適宜的株高有益于養分及光合的有效利用、種植密度、抗倒伏,進而有利于提高產量[3]。而且隨著我國城鎮化推進,農村人口老齡化日益嚴重,農村發展規模化種植已呈必然趨勢,對適合機械化生產的高粱新品種需求不斷增加。因此,挖掘控制高粱株高相關QTL,開展遺傳機理研究,對利用分子標記輔助育種開展高產、易機化高粱新品種的選育提供理論依據。
目前,用于高粱數量性狀基因座(quantitative trait locus, QTL)定位的分子標記技術有SSR(simple sequence repeats)和SNP(single nucleotide polymorphism)等[4-5]。Reddy等[6]利用SSR標記,對籽粒高粱M35-1和B35構建的245份重組自交系群體(recombinant inbred lines, RIL)進行基因型掃描,構建含有237個標記的高粱遺傳圖譜,確定了10個與株高相關的QTL;蘇舒[7]利用83個SSR標記對218個家系的RIL群體(T70/P603)開展基因分型,鑒定了8個高粱株高QTL位點和4個節間數QTL位點;另有研究者利用飼草高粱構建的126個家系RIL群體(不育系Tx623A/蘇丹草恢復系Sa)為研究對象,定位到4個控制株高的QTL,對表型的貢獻率為24.75%-33.59%[8]。近年來,隨著高通量測序技術的發展,基于SNP標記的高密度遺傳圖譜構建以及重要農藝性狀的QTL定位越來越多被報道,這些遺傳圖譜的標記數量不斷增加,標記間的遺傳距離減小,連鎖群趨于完整,連鎖圖對全基因組的覆蓋率增加,更有利于QTL/基因的精細定位。Zou等[9]利用全基因組重測序技術,構建了包含244個RILs(籽粒高粱654/甜高粱LTR108)的SNP高密度遺傳圖譜,定位了57個影響高粱抽穗期、株高、節間數等性狀的QTL。通過簡化基因組測序技術(GBS)對460個RILs(籽粒高粱BTx623/籽粒高粱NOG)的基因分型,Kajiya-kanegae等[10]構建了包含有3 710個SNP標記的高粱遺傳圖譜,并定位了3個與株高相關性狀的QTL。Takanashi等[11]同樣利用GBS技術對272個甜高粱RILs(甜高粱Brandes/甜高粱Wray)的基因分型,挖掘到33個影響開花時間、株高和生物量等性狀的QTL。目前,在控制株高的4個主要位點中(Dw1-Dw4)[12-13],前3個已經被克隆。Dw1(Sobic.009G230800)編碼參與細胞增殖調控的高度保守蛋白[14],Dw2(Sobic.006G067700)編碼蛋白激酶[15],而Dw3(Sobic.007G163800)編碼ABCB1生長素轉運蛋白[16],這些蛋白通過調節莖間長度影響高粱株高。
由于國內外用于QTL定位的高粱遺傳圖譜主要是“甜高粱/甜高粱”,“甜高粱/籽粒高粱”或“飼草高粱”雜交構建的RILs,對籽粒高粱標記輔助育種的可利用價值具有一定的局限性。
本研究利用籽粒高粱BTx623和貴州茅臺酒專用高粱紅纓子雜交構建的RIL群體為研究材料,基于簡化基因組測序技術構建高粱的高密度遺傳連鎖圖譜,開展株高和節間數相關農藝性狀的QTL定位,并鑒定QTL區間內的候選基因,為后續的基因克隆提供依據。
以美國籽粒高粱品種BTx623為母本,貴州茅臺酒專用高粱品種紅纓子為父本,雜交得到F1代,經單粒傳法,構建包含205個家系的F2:7代RIL群體。親本之間在株型上存在顯著差異。BTx623株高較低(1.2-1.5 m),株型緊湊,而紅纓子株高較高(2.5-3.0 m),株型松散。親本與RIL群體分別于2020年在貴陽(2020GY)、安順(2020AS)和樂東(2020LD),以及2021年在貴陽(2021GY)和安順(2021AS)5個環境下進行田間種植。采用隨機區組設計,3次重復,行距60 cm,行長2 m,株距25 cm,人工點播,適時進行間苗定苗、追肥、除草和病蟲害防治等田間管理工作。
1.2.1 表型調查及數據分析 在高粱成熟期,每個株系隨機選擇5個單株調查株高(plant height, PH)和節間數(internode numbers, IN),調查方法參照《高粱種質資源描述規范和數據標準》中的相關規定[17]。利用Microsoft excel 2021和SPSS 21.0軟件對表型數據的平均值、標準差、變異系數、正態分布檢驗和相關性進行分析。多環境聯合方差分析參照曹永策等[18]方法,根據下面公式計算廣義遺傳率(h2B)。
式中,根2g為基因型方差,公2ge為基因型與環境互作方差,義2e為環境方差,n為環境數目,r為試驗重復數。
1.2.2 DNA提取和GBS重測序 2020年5月在貴陽采集親本和RIL群體植株嫩葉,采用CTAB法[19]提取DNA,0.8%瓊脂糖凝膠檢測DNA純度和完整性,同時用Qubit? 2.0熒光測定計檢測DNA濃度。參照Qi等[20]方法,利用上海歐易生物醫學科技有限公司建立的GBS技術對質檢合格的每個單株DNA樣品基因型進行鑒定。
1.2.3 QTL定位 基于已經構建的高密度連鎖遺傳圖譜(包含有1 910個SNP標記,標記間平均遺傳間距為0.47 cM)[21],利用QTL IciMapping4.2軟件中完備區間作圖法(ICIM)[22]對株高和節間數在5個環境下進行QTL檢測,步長設定為0.1 cM,隨機抽樣1 000次,QTL定位的閾值LOD設置為2.5,并計算出每個QTL的貢獻率和加性效應,采用“q+性狀名稱英文縮寫+染色體+“.”+QTL序號”的方式對QTL進行命名。
1.2.4 QTL區間內候選基因挖掘方法 在Sorghum QTL網站(http://aussorgm.org.au/sorghum-qtl-atlas/)查找已報道的QTL信息,結合BTx623參考基因組信息,確定候選區間的所有基因,利用植物基因組數據庫Phytozome中的高粱參考基因組功能注釋信息(https://phytozome-next.jgi.doe.gov/),綜合分析Gene Ontology數據庫(http://geneontology.org/)和KEGG數據庫(https://www.kegg.jp/)預測基因執行的生物學功能,對比水稻中已克隆基因的功能注釋來進一步確定候選基因。
對親本BTx623、紅纓子以及RIL群體在5個環境下株高和節間數表型數據調查結果可知(表1),2個性狀在親本之間差異顯著,紅纓子的株高和節間數顯著高于BTx623。RIL群體2個性狀平均值介于雙親之間,且均出現雙向超親現象,5個環境的變異系數介于12.02%-27.46%。此外,RIL群體的2個性狀在5個環境下的偏度和峰度絕對值均小于1,除2020LD的節間數峰度為1.6外,且數據分布表現為連續的近似正態分布,符合數量性狀遺傳特點,適合進行QTL定位分析(圖1)。

表1 RIL群體中株高和節間數在5個環境下的表型統計Table 1 Phenotypic statistics of plant height and internode numbers in the RIL population in five environments
為了解不同環境下性狀間的相關性,對2個性狀開展了Pearson相關性分析(表2)。相同性狀在不同環境間呈極顯著相關性(P<0.01),株高和節間數的平均相關系數R值分別達到0.83和0.68。株高與節間數在不同環境之間也呈顯著(P<0.01)正相關關系,R值的范圍為0.302-0.884,平均值為0.561。方差分析結果(表3)得出2個性狀的基因型、環境及基因型×環境均存在極顯著差異(P<0.01),株高和節間數廣義遺傳率分別為95.23%和85.78%,說明這兩個農藝性狀的表型差異主要由其本身的遺傳因素所決定,而受環境的影響較小。

表2 RIL群體中株高和節間數間的相關性分析Table 2 Correlation analysis of plant heighst and internode numbers in the RIL population

表3 株高和節間數間方差分析及廣義遺傳率Table 3 Variance analysis and broad heritability of plant height and internode numbers
利用ICIM方法,在5個環境下共定位到18個QTL與高粱的株高和節間數相關,分別位于高粱的5條染色體上。與株高和節間數相關QTL分別有7和11個,而2個及以上環境中重復檢測到的QTL有10個,涉及到9個染色體區段(表4和圖2)。

圖2 高密度遺傳圖譜及重要QTL所在染色體示意圖Fig.2 Schematic diagram of high-density genetic map and chromosomes with important QTL regions

表4 株高和節間數相關QTL定位結果Table 4 QTL mapping results of plant height and internode numbers
影響株高的7個QTL分別位于1、3、4和9染色體上。位于第4和9染色體上的2個重要QTL(qPH4.1和qPH9.1)能夠在3個環境下被檢測到,最大LOD值分別為5.83和24.84,可解釋的最大表型變異率分別為6.66%和34.34%。位于第1染色體的qPH1.2、位于第3染色體qPH3.1和qPH3.2在2個環境下被重復檢測到,其最大LOD值和表型貢獻率分別為10.14和15.19%。除qPH1.2外,其余6個QTL的增效等位基因均來源于親本紅纓子。
影響節間數的11個QTL分別位于第1、3、4、8和9染色體上。位于第9染色體上的2個重要QTL(qIN9.1和qIN9.3)在3個環境下都能被檢測到,它們的最大LOD值分別為4.45和7.92,可解釋的最大表型變異率分別為6.99%和10.05%。在11個與節間數相關的QTL中,3個QTL(qIN1.1、qIN8.1和qIN8.2)的增效等位基因來源于親本BTx623,其余8個QTL的增效等位基因均來源于親本紅纓子。
根據上述結果,對2個及以上環境都能定位到的10個重要QTL區段進行了候選基因分析,利用植物基因組數據庫Phytozome中的高粱參考基因組功能注釋信息(https://phytozome-next.jgi.doe.gov/),識別高粱基因ID、蛋白質注釋信息預測基因執行的生物學功能,對比水稻中已克隆基因的功能注釋并結合前人研究文獻,確定了5個候選基因(表5)。除了已經克隆的控制株高Dw1,還注釋到4個新的候選基因。其中,2個基因與水稻株高相關基因同源,包括編碼對映型柯巴基焦磷酸合酶的基因Sobic001G248600和編碼WRKY轉錄因子的Sobic003G227300,其水稻同源基因分別為OsCPS1(LOC_Os02g17780)和Dlf1(LOC_Os01g43650)。Sobic008G173300位于控制高粱節間數QTL區間內,蛋白注釋為節間伸長抑制因子,其水稻同源基因DEC1(LOC_Os12g42250)編碼一種鋅指轉錄因子。Sobic003G227000所在QTL同時控制高粱株高和節間數,該基因編碼卵形家族蛋白,在水稻中的同源基因OsOFP2(LOC_Os01g43610)與多個發育過程相關。

表5 重要QTL區間候選基因功能注釋Table 5 Functional annotation of candidate genes in important QTL intervals
高粱是釀造貴州茅臺酒等醬香型白酒的主要原料[23]。隨著醬香型白酒產業的快速發展,貴州酒用高粱種植面積急劇上升。據統計,2022年貴州高粱生產面積達到約18.7萬hm2,位居全國第一[24]。但是由于貴州酒用高粱品種普遍具有較高植株,不僅影響產量,也不適合機收[25],導致勞動力成本增加,影響農民種植積極性,從而影響酒用高粱供給。因此,開展貴州酒用高粱株高基礎研究,為品種遺傳改良提供依據,對白酒產業的可持續性發展意義重大。
作為多基因控制和易受環境影響的數量性狀,多年多點的表型鑒定和高密度遺傳圖譜的構建是準確挖掘影響株高相關性狀QTL的關鍵因素[26]。本研究對BTx623和紅纓子構建的RIL群體株高和節間數于2020年在貴陽、安順和樂東,以及2021年在貴陽和安順5個環境條件下進行表型鑒定。相關性分析顯示不同環境下相同性狀之間或不同性狀之間均存在極顯著的正相關關系,株高與莖節數顯著相關,這與Zhao等[27]和Zou等[9]研究結果一致。而利用GBS技術構建的連鎖圖譜,比SSR等分子標記圖譜有更高的密度,具有更好的基因挖掘能力[11]。
利用Super-GBS技術構建的高密度遺傳圖譜,本研究定位了10個重要QTL位點在多個環境中或不同性狀間都被重復檢測到,其中,8個QTL位點(qPH1.2、qIN3.1、qPH4.1/qIN4.1、qIN8.1、qPH9.1/qIN9.1和qIN9.3)與已報道株高相關性狀位點一致。位于第1染色體的株高QTL(qPH1.2,25.81-27.00 Mb)與前人利用2個RIL群體(M35-1/B35和BTx623/IS3620C)報道的株高QTL定位結果一致[6,28],在其置信區間的基因Sobic001G248600與水稻OsCPS1同源,編碼對映型柯巴基焦磷酸合酶,參與水稻赤霉素生物合成進而影響株高[29],而且其同源物也會對玉米株高產生較大影響[30]。位于第3染色體上與莖節數相關的QTL(qIN3.1,53.08-55.06 Mb)與來源于M71/SS79的RIL的株高QTL位置重疊[31]。在3個環境中,位于第4染色體的QTL(1.48-1.53 Mb)被檢測到與株高(qPH4.1)和節間數(qIN4.1)相關,與Liu等[32]利用RIL群體(Tx623/S.virgatum)定位的株高QTL位置一致。此外,在8號和9號染色體上檢測到與莖節數相關的3個QTL中,qIN8.1和qIN9.1與利用SAP群體的GWAS定位結果相近[27],qIN9.3與2個RIL群體(M35-1/B35和BTx3197/Rio)定位的株高QTL結果一致[6,33]。而位于qIN8.1置信區間上的Sobic008G173300,與水稻的DEC1同源,編碼C2H2鋅指轉錄因子,在水稻和大麥植株體內過表達該基因會強烈抑制株高和節間伸長[34]。然而,位于第3染色體上的一個重要染色體區段(56.08-57.95 Mb)包含2個相鄰的QTL位點(qPH3.1和qPH3.2/qIN3.2),在高粱中還未見報道與株高相關性狀有關。qPH3.1(56.08-56.14 Mb)和qPH3.2(56.41-56.90 Mb)與株高相關,qIN3.2(56.23-57.32 Mb)與節間數相關。qPH3.2/qIN3.2位點所在56.23-56.90 Mb區間包含了2個候選基因Sobic003G227000和Sobic003G227300。Sobic003G227000與水稻基因OsOFP2同源,編碼卵形家族,能夠介導KNOXBELL功能,參與多個生長發育過程(如維管束發育)[35];而Sobic003G227300與水稻基因Dlf1同源,負責編碼WRKY轉錄因子調節Ehd2/RID1/Osld1表達,從而參與控制水稻花期和株高[36]。上述2個QTL位點在其他高粱株高的QTL定位中未見報道的可能原因有2個:一是目前株高QTL定位群體的親本多來源于國外甜高粱品種,而本研究的定位群體親本之一——酒用糯高粱品種紅纓子中可能攜帶不一樣的株高基因;另一個原因是應用Sup-GBS標記技術構建高密度圖譜,能夠定位到更多的株高相關的QTL,而目前報道的高粱株高QTL定位多采用SSR標記[6,31-32,37]。
與水稻[38]、玉米[39]和小麥[40]等主要糧食作物相比,影響高粱株高的功能基因挖掘研究還存在較大差異[41]。截至目前,已報道控制高粱株高的主效基因有4個(Dw1-Dw4),除了位于第6染色體的Dw4以外,其余3個已被克隆[42]。本研究在3個環境中均檢測到位于第9染色體上的一個重要區段(54.55-58.47 Mb)與株高(qPH9.1)和莖節數(qIN9.2)相關,正好與Dw1(57.09-57.10 Mb)的位置一致[14]。但是Dw2、Dw3和Dw4沒有被檢測到,可能的原因是親本BTx623和紅纓子在這3個基因上沒有多態性。此外,對本研究發現的4個影響株高潛在的候選基因進一步開展克隆和功能分析,研究遺傳調控機制,開發功能標記,有望為高粱株高分子育種打下基礎。
構建了包含205個RILs(Bx623/紅纓子)的SNP高密度遺傳連鎖圖譜。在5個環境下共定位到7個影響株高和11個影響節間數的QTL。在多個環境或2個性狀中均檢測到10個重要QTL位點,分別位于第1、3、4、8和9染色體,包含了已經克隆的Dw1位點,同時鑒定出4個與株高和節間數相關的候選基因,與控制水稻株高相關基因同源。