賈曉昀,朱繼杰,趙紅霞,王士杰,李 妙,王國印
(河北省農林科學院 糧油作物研究所,河北省作物遺傳育種實驗室,河北 石家莊 050035)
棉花是世界上最重要的天然纖維作物,保證棉纖維的產量對紡織工業的穩定發展具有重要意義,高產穩產始終是棉花育種工作的重要目標[1]。陸地棉在棉纖維年產量中占比95%以上[2]。因此,研究陸地棉產量相關性狀的分子遺傳機制,有助于進一步培育高穩產棉花新品種。
單鈴質量(Boll weight,BW)、衣分(Lint percentage,LP)、子指(Seed index,SI)和果枝數(Fruit branch number,FBN)等是棉花產量的重要數量性狀,且性狀之間存在復雜的相互影響[3-4]。因此,QTL定位是進行產量性狀分子遺傳機制挖掘的重要手段。Shen等[5]以陸地棉重組自交系為試驗材料,基于一張包含110個SSR標記、總圖距為810.07 cM的遺傳圖譜,定位到11個產量相關QTL;隨后通過加密圖譜標記,構建了一張包含156個SSR標記、總圖距1 024.4 cM的遺傳圖譜,定位到26個QTL[6]。Wang等[7]以海島棉F2群體為試驗材料,構建一張包含337個位點、圖距2 108.34 cM的遺傳圖譜,定位到21個產量相關QTL位點。Yu等[8]以海陸種間回交自交系群體為試驗材料,構建一張包含392個SSR標記、總圖距2 895 cM的遺傳圖譜,定位到39個產量相關QTL。Ning等[9]以陸地棉重組自交系群體為試驗材料,構建一張包含279個SSR標記、總圖距1 576.25 cM的遺傳圖譜,定位到61個產量相關QTL。Liu等[10]以陸地棉重組自交系為試驗材料,通過構建一張包含2 051個位點、總圖距3 508.29 cM的遺傳圖譜,定位到37個產量相關QTL。由于缺乏參考基因組信息、SSR等傳統分子標記多態性較差、圖譜構建過程費時費力等原因,前期的研究存在定位區間較大、染色體及基因信息不完整等不足之處。隨著測序技術的進步,陸地棉參考基因組信息得以公布并不斷完善[11-14]。Zhang等[15]以陸地棉重組自交系群體為試驗材料,開發SLAF-SNP(Specific locus amplified fragment sequencing-Single nucleotide polymorphism)標記,構建一張包含5 521個SNP、總圖距3 259.37 cM的高密度遺傳圖譜,定位到18個多環境穩定存在的單鈴質量QTL位點,注釋到344個基因。Su等[16]通過SLAF-seq技術,對355份陸地棉材料的衣分性狀進行關聯分析,得到12個高度關聯的SNP標記,并推測基因Gh_A02G1268對衣分有重要影響。Ma等[17]對419份陸地棉材料進行重測序及關聯分析,結果表明Gh_D02G0025可能是影響衣分的關鍵基因。Sun等[3]以10 511個SNP對719份陸地棉材料的產量性狀進行關聯分析,得到62個顯著相關的SNP,并發現基因Gh_D03G1064和Gh_D12G2354可能對產量有重要作用。Song等[18]用CottonSNP63K芯片對276份陸地棉材料衣分性狀進行關聯分析,得到23個顯著關聯的SNP和15個QTL位點,并發現基因Gh_D05G0313和Gh_D05G1124在纖維發育階段高調表達。由此可知,基于高質量的SNP標記和高密度遺傳圖譜,棉花產量相關的基因信息逐漸得到挖掘。然而,由于產量相關性狀分子遺傳機制的復雜性,現有的研究成果仍然不夠充分,特別是對高穩產品種產量相關基因的挖掘較少。
冀豐914是由河北省農林科學院糧油作物研究所培育的高產、穩產棉花品種,于2015年通過國家黃河流域棉區審定(國審棉2015003),具有高產、穩產、豐產性好等突出特點[19]。為進一步探索高產、穩產棉花產量性狀的分子遺傳機制,本研究以冀豐914為母本、優質自交系冀豐817為父本構建F2和F3群體,基于GBS技術構建的包含11 488個SNP標記、總圖距4 202.12 cM的高密度遺傳圖譜,對單鈴質量、衣分、子指和果枝數等性狀進行QTL定位,并對重點區域進行基因注釋及候選基因篩選,以期獲得更多產量相關的分子遺傳信息,為新品種選育及基因功能研究提供基礎。
以自育國審品種冀豐914為母本,以優質自交系冀豐817(原系名:優系817)為父本,于2018年在河北石家莊組配雜交組合,收獲F1種子,同年冬天在海南加代自交,收獲F2種子。于2019年在河北石家莊播種F2,行長7.00 m,行距0.76 m,株距0.20 m,共15行、413個單株。于2020年在河北石家莊播種F3群體,行長5.00 m,行距0.76 m,株距0.20 m,3次重復。同當地大田管理。
9月底自然吐絮后,人工收獲F2群體單株全株棉鈴并計數,收獲F3群體株行20鈴,稱取籽棉質量、計算單鈴質量,軋花后稱取皮棉和子指質量;收獲前調查果枝數;F3群體性狀數據為3個重復平均值。
在F2群體中隨機選取200個單株,采用CTAB法提取幼葉DNA[20],經質檢后構建文庫[21-22],選擇MseⅠ和TaqαⅠ(Thermo scientific Fermentas)2種酶進行酶切,回收397~420 bp長度的酶切片段,通過Illumina HiSeqTM平臺進行測序。通過BWA (Burrows-Wheeler Aligner, version 0.7.17)軟件[23]對測序數據進行基因組比對,通過GATK (Genome Analysis Tool-kit, version 4.0.11.0)軟件[24]檢測SNP標記,通過MSTMap (Minimum spanning tree map, version update 2015)軟件[25]構建遺傳圖譜。最終構建一張包含11 488個SNP標記、總圖距4 202.12 cM的遺傳圖譜,標記間平均距離僅有0.37 cM。
通過Excel 2016分析數據的基本統計量,通過SPSS 21.0分析性狀相關性。
通過QTLIciMapping 4.0軟件分析加性QTL[26-27],分析參數為:Step=1 cM,PIN=0.001,LOD值由1 000次迭代計算確定。
基于陸地棉TM-1參考基因組[13],注釋QTL位點內的基因信息;通過KOBAS 3.0進行基因的KEGG通路分析和GO富集分析[28];根據陸地棉與海島棉的轉錄組信息[14]分析注釋基因表達量,篩選候選基因。
表1為群體性狀基本統計量。可以看出,冀豐914的各性狀值均大于冀豐817。分離群體中,除2020年BW外,其他性狀呈現雙向超親分布,峰度和偏度的絕對值小于1,說明性狀呈正態分布,適合進行QTL定位分析。由變異系數發現,子指的變異系數最大,果枝數的變異系數最小,F2群體性狀的變異系數大于F3群體。

表1 親本及群體產量性狀的基本統計量Tab.1 Basic statistics of the parents and population yield related traits
表2為4個性狀之間的簡單相關性分析結果。可以看出,子指與單鈴質量之間存在極顯著的正相關關系,與衣分之間存在極顯著的負相關關系。因此,實現棉花單鈴質量、衣分和子指3個性狀的同步提高存在較大困難。果枝數與單鈴質量、衣分、子指的相關性均不顯著,說明果枝的多少對單鈴質量、衣分、子指3個性狀的影響較小。

表2 產量性狀之間的簡單相關性分析Tab.2 Correlation analysis among the yield related traits
本研究共在22條染色體上定位到50個產量相關的QTL位點,包括8個單鈴質量QTL、20個衣分QTL、15個子指QTL和7個果枝數QTL(表3、圖1)。8個單鈴質量QTL分布于8條染色體,單個QTL對表型變異的貢獻率為4.24%~9.79%,其中4個QTL的增效基因來源于冀豐914,包括qBW-A4-1、qBW-A5-1、qBW-A11-1和qBW-D10-1;qBW-A11-1可以同時在F2和F3群體中檢測到;qBW-A12-1的貢獻率為9.79%,增效基因來源于冀豐817。定位到20個衣分相關QTL,分布于14條染色體,其中A6、A13、D6、D10各分布有2個QTL,A7分布有3個QTL;單個QTL對表型變異的貢獻率為2.82%~12.52%;冀豐914為其中15個QTL提供增效基因;qLP-A6-1能夠在2個群體中檢測到,貢獻率分別為8.66%,4.72%,增效基因來源于冀豐914;qLP-A13-1的貢獻率達到12.52%,增效基因來源于冀豐914。定位到15個子指相關QTL,分布于13條染色體,A5和D3各有2個QTL;單個QTL的貢獻率為3.21%~12.96%;7個QTL的增效基因來源于冀豐914,冀豐817為另外8個QTL提供增效基因;qSI-D3-1的貢獻率達到12.96%,增效基因來源于冀豐914。定位到7個果枝數QTL分布于5條染色體,D5分布有3個QTL;單個QTL的貢獻率為4.00%~9.31%;冀豐914為其中2個QTL提供增效基因,冀豐817為另外5個QTL提供增效基因;qFBN-D10-1的貢獻率為9.31%,增效基因來源于冀豐914。

表3 產量相關性狀QTL位點信息Tab.3 Detail information about yield related QTL
基于參考基因組的注釋信息,本研究對qBW-A11-1、qLP-A6-1、qLP-A13-1、qSI-D3-1和qSI-D3-2等5個穩定或主效QTL進行基因信息注釋。在qBW-A11-1內注釋到15個基因,在qSI-D3-1內注釋到26個基因,其他QTL未注釋到基因信息。KEGG通路分析發現,注釋基因主要參與植物細胞壁形成、纖維素生物合成、植物激素信號轉導、TCA循環、代謝及氨基酸生物合成等條目。GO功能富集分析發現,共有14個顯著富集的GO條目(P<0.01),包括細胞膜組分、細胞壁合成、細胞分裂素響應及多種酶活性等,共涉及10個基因;根據陸地棉TM-1和海島棉Hai 7124的轉錄組信息[14],選擇根、莖、葉、花、不同發育時期的纖維和胚珠等組織,對這10個基因進行表達量分析,結果發現,在所有組織中,Ghir_A11G006820.1、Ghir_D03G004880.1、Ghir_D03G004930.1和Ghir_D03G004970.1的表達量均較低,Ghir_D03G005350.1的表達量均較高,Ghir_D03G005440.1在TM-1中的表達量高于Hai 7124(圖2)。
產量是獲得效益的基礎,高產、穩產是棉花育種及生產的主要目標[1]。然而,由于植棉面積的減少,提高單產成為增加總產的重要保證,也是育種工作的重要挑戰。據研究,品種改良對棉花單產增加的貢獻率達到30%以上[29],而分子技術在育種方法中的應用將成為進一步提高單產的關鍵環節[1, 30]。因此,深入分析棉花產量及其構成因子的分子遺傳機制,挖掘有效的分子標記及功能基因,是改良育種技術、提高育種效率、加快新品種培育的重要支撐[30]。本研究以高穩產國審棉花品種冀豐914為母本,通過構建F2和F3群體,結合高密度SNP遺傳圖譜,對產量相關的單鈴質量、衣分、子指和果枝數等4個性狀進行QTL定位及候選基因篩選,為進一步改良棉花產量性狀奠定分子研究基礎。
QTL定位是挖掘數量性狀關鍵基因并進行綜合性狀分析的經典方法。Xie等[31]通過QTL定位,綜合分析了小麥灌漿過程決定粒質量大小的關鍵因素;Zikhali等[32]在QTL定位基礎上,精細定位了一個控制小麥開花的關鍵基因;Pan等[33]對10個玉米重組自交系的株型性狀進行QTL分析,為研究玉米株型的分子遺傳機制及理想株型育種奠定研究基礎。在棉花中,Zhu等[34-35]精細定位了棉花雞腳葉QTL,并得到關鍵候選基因GhOKRA;Xu等[36]通過經典的精細定位方法,將纖維長度QTLqFL-chr1縮小至0.9 cM區間內;Chen等[37-38]基于QTL定位結果,結合測序技術,成功得到了棉花零式果枝性狀的關鍵基因;Ma等[39]在棉花株高相關QTL位點內得到了一個GhPIN3基因;Feng等[40]通過回交,將纖維強度QTLqFS-Chr.D02精細定位于550.66 kb范圍內,得到2個候選基因。在棉花產量方面,Su等[16]在A02染色體上關聯到一個衣分相關的候選基因Gh_A02G1268;Ma等[17]通過重測序技術,對產量相關的單鈴質量、衣分、子指和衣指進行全基因組關聯分析,得到Gh_D02G0025等候選基因;Sun等[3]分別在D03和D12染色體上關聯到一個產量相關的候選基因Gh_D03G1064和Gh_D12G2354;Song等[18]在D05染色體上關聯到2個衣分相關的候選基因Gh_D05G0313和Gh_D05G1124。本研究通過開展產量相關QTL定位,得到2個穩定性較好的QTL(qBW-A11-1和qLP-A6-1)和3個貢獻率大于10%的QTL(qLP-A13-1、qSI-D3-1和qSI-D3-2);基于參考基因組注釋信息,通過KEGG和GO分析,在qBW-A11-1和qSI-D3-12個QTL內共注釋到41個參與植物激素信號轉導、細胞壁生物合成、氧化還原酶活性等功能的基因,其中,編碼肉桂酰輔酶A還原酶2類蛋白的Ghir_D03G005440.1基因位于qSI-D3-1區段內,該基因在陸地棉TM-1多個組織中的表達量均高于Hai 7124。研究發現,肉桂酰輔酶A還原酶是木質素合成的關鍵酶[41-42],木質素是細胞壁形成的關鍵物質,在種子發育過程中有重要作用[43-44]。因此,Ghir_D03G005440.1基因可能對棉花種子發育及大小有重要影響。
本研究定位到的50個棉花產量性狀QTL中,56%(28/50)位點的增效基因來源于冀豐914,其中,75%衣分相關QTL(15/20)、2個穩定QTL和3個主效QTL的增效基因均來源于冀豐914。由此說明,冀豐914對產量性狀有較強的遺傳控制,高衣分是其實現高穩產的重要因素。然而,由于本研究所用試驗材料為F2和F3群體,研究結果需要通過高代穩定群體結合多年多點試驗進行驗證。
本研究通過對陸地棉產量性狀進行QTL定位,獲得一個在陸地棉標準系TM-1中表達量較高的Ghir_D03G005440.1基因,該基因位于子指相關的QTL區段內,可能參與棉花種子發育調控,為深入挖掘高穩產棉花品種產量性狀的分子遺傳機制及關鍵基因提供了基礎;初步表明高衣分是冀豐914實現高穩產的重要因素。