王艷殊,田 雨,張佳楠,許世超,董全中,李文濱,李文霞,寧海龍
(1.東北農業大學 農學院,大豆生物學教育部重點實驗室,農業部東北大豆生物學與遺傳育種重點實驗室,黑龍江 哈爾濱 150030;2.黑龍江省農業科學院 克山分院,黑龍江 克山 161606)
大豆(Glycinemax(L.) Merr.)是重要食用植物蛋白質和油脂的主要來源,是我國最重要的經濟作物之一,然而國內大豆生產明顯不足,截至2000年我國由大豆出口國變為最大進口國,主要原因是產量偏低,因此,提高產量是大豆育種中最重要的目標之一。產量性狀是受多個基因控制的數量性狀,且易受環境條件的影響,定位大豆產量QTL對于改良產量相關性狀具有理論與實踐意義。近年來,隨著分子遺傳學和分子標記技術的迅速發展,構建遺傳連鎖圖譜的分子標記密度逐漸增加,推動了大豆產量相關性狀QTL定位的研究。
自1990年Keim等[1]最開始大豆數量性狀QTL分析以來,已經在大豆形態與產量等性狀方面展開了大量研究。在大豆的產量相關性狀中,百粒質量(SW)[2-8]、株高(PH)[9-12]、主莖節數(NN)[13-15]、單株粒數(NS)[16-18]等已有大量的研究和報道。Mansur等[19]利用PI27890 ×PI290136產生的后代重組自交系群體,檢測到4個株高QTL,位于連鎖群M、J、C2上。Wang等[20]利用IA2008×PI468916 產生的BC后代群體,檢測到6個株高QTL,位于連鎖群O、K、C2、E、M上,可解釋表型變異率在0.74%~0.84%。Guzman等[21]利用Kenwood×LG94-1713產生的BC群體,檢測到6個株高QTL,位于連鎖群C2、M、J、G上,可解釋表型變異率在0.81%~0.92%。Zhang等[12]利用CSSL3228×NN113822產生的F2后代群體,檢測到2個株高QTL,位于連鎖群F上。Mansur等[22]利用Noir 1×Minsoy 產生的后代重組自交群體,檢測到2個單株粒數QTL,位于連鎖群C2、M上。Funatsuki等[18]利用Toyomusume×Hayahikan雜交衍生F7后代群體,檢測到2個單株粒數QTL,位于連鎖群L上,可解釋表型變異率為0.83%,Liang等[16]利用BD2×BX10產生的后代重組自交系群體,檢測到4個單株粒數QTLs,位于連鎖群B1、G、C1上,可解釋表型變異率在0.64%~0.79%。Palomeque等[23]利用OAC Millennium ×黑農38產生的后代重組自交群體,檢測到3個單株莢數QTL,位于連鎖群C2、K上,可解釋表型變異率在0.89%~0.96%。Yang等[24]利用Charleston×東農594產生的F2∶14-19后代重組自交群體,檢測到1個單株粒數QTL,位于連鎖群L上。Li等[17]利用合豐25×Maple Arrow產生的后代重組自交群體,檢測到4個單株莢數QTL,位于連鎖群D2、I、C2、C1上。Chen等[25]利用Charleston×東農594產生的后代重組自交群體,檢測到7個主莖節數QTL,位于連鎖群A1、B1、D1a上,可解釋表型變異在7.93%~28.46%,Li等[17]利用合豐25×Maple Arrow為親本雜交得到的F5∶6RIL群體,定位到2個株高QTL,分布在連鎖群H上,可解釋表型變異率為8.09%,9.82%,4個單株莢數QTL,分布在連鎖群D2、I、C2、C1上,可解釋表型變異率在6.54%~11.00%,2個主莖節數QTL,分布在連鎖群C2、I上,可解釋表型變異率為6.79%,17.03%,3個百粒質量QTLs,分布在連鎖群M、D2、C1上,可解釋表型變異率在7.08%~20.29%。Liu等[9]利用Jinpumkong 2×SS2-2產生的后代重組自交群體,檢測到2個主莖節數QTL,位于連鎖群D1b、C2上。Hoeck等[26]利用A96-492058×A97-775026產生的后代群體,檢測到11個百粒質量QTL,位于連鎖群A2、D2、B2、C1、F1、H、L、M上,可解釋表型變異在8.6%~28.8%,Kato等[27]利用Ohsuzu×PI595926產生的后代重組自交群體,檢測到17個百粒質量QTL,位于連鎖群D2、C1、G、K、E、F、O、D1b、I、H、A1上。Hu等[28]利用墾豐1×南農1138-2產生的后代重組自交群體,檢測到2個百粒質量QTL,位于連鎖群D1b、D1a上。Kulkarni等[29]利用Wiliams 82×PI366121產生的后代重組自交群體,檢測到9個百粒質量QTL,位于連鎖群D1a、D1b、C2、A2、B2、D2上。
查詢SoyBase大豆數據庫(https://www.soybase.org/)最新公布的數據發現定位到的大豆產量及相關性狀的QTL數量已經超過655個,其中百粒質量229個、株高229個、單株莢數48個、主莖節數37個、單株粒數23個,幾乎覆蓋所有的連鎖群。以往研究中利用2個親本雜交產生重組自交系,檢測產量相關性狀的QTL,如親本遺傳差異不大,基因位點無差異,許多QTL不能被檢測到。而本試驗利用4個親本雜交產生的后代群體,能克服這個難題。本試驗利用四向重組自交系群體多等位基因的優勢,探尋有利于產量改良的優異等位基因,為大豆產量性狀的改良提供理論依據與技術支撐。
用大豆產量相關性狀差異較大的4個大豆親本墾豐14、墾豐15、黑農48和墾豐19,配制雙交組合(墾豐14×墾豐15)×(黑農48×墾豐19),F1進行雜交,采用單粒傳方法獲得RIL群體160個株系的四向重組自交系群體(FW-RIL)。
將4個親本和FW-RIL分別于2013年種植在哈爾濱(E1)和克山(E2)、2014年種植于哈爾濱(E3)、2015年種于克山(E4)和哈爾濱(E5),其中4個親本各種植一行,田間試驗采取隨機區組試驗設計,小區行長5 m,寬2 m,壟距6 cm,株距5 cm,3行區,3次重復,田間管理同一般大田栽培。
在成熟后,于每個小區隨機收獲家系10株用于考種,以10株平均值作為小區的代表。調查株高(Plant height,PH)、主莖節數(Main stem node number,NN)、單株莢數(Pod number per plant,NP)、單株粒數(Seed number per plant,NS)、百粒質量 (100-seed weight,SW)等產量相關性。
用該FW-RIL群體構建用于數量性狀QTL定位的遺傳連鎖圖譜。圖譜包含275個SSR引物和20個連鎖群,在大豆基因組上覆蓋的長度范圍是3 636.26 cM,標記間平均長度為15.47 cM。每個連鎖群包含遺傳標記6~20個,長度在49.36~319.02 cM。
對每個小區10株的數據的平均值進行分析,采用SAS (Statistics Analysis System)9.2的Proc ANOVA對各性狀進行方差分析,Proc Varcomp估計的遺傳方差、環境方差和基因型與環境互作方差,進而估計廣義遺傳率。估算公示如下:

基于前文已經構建的遺傳圖譜[30],應用完備區間作圖法(Inclusive Composite Interval Mapping,ICIM)進行QTL定位[31]。首先利用逐步回歸的方法在所有標記中篩選重要的標記并估算其效應值,然后利用得出的線性模型調整性狀表型值,最后以一維掃描的方法定位 QTL,掃描步長為 1 cM,LOD 值≥2.5。利用軟件 GAPL V1.0實現上述運算,得出 QTL定位結果。
對5個環境下各產量相關性狀的描述性分析(表1)可看出,FW-RIL的5個產量相關性狀在不同環境下都存在較大的變異,各性狀存在超親遺傳,說明該群體中各性狀有較大分離,該群體對該性狀的研究可以有較大的統計推斷空間。

表1 在5個環境下產量相關性狀的描述性分析Tab.1 Descript analysis of yield related traits in FW-RIL under five environments
不同基因型間及環境間效應達到極顯著水平(表2),說明群體內這些性狀在遺傳上有較大差異,并且不同環境下遺傳基礎亦可能存在較大差異,在不同環境下應用該群體進行基因定位,可能定位到不同的QTL;各性狀的遺傳力有較大差異,其順序為株高(0.80)>主莖節數(0.55)>單株粒數(0.42)>百粒質量(0.37)>單株莢數(0.33),表明這些性狀的遺傳基礎不同,受到環境的影響程度不同,檢測到QTL的數量也不相同。

表2 產量相關性狀的方差分析和遺傳率估計Tab.2 Variance analysis and heritability estimation of morphological and yield-related traits
注:**表示效應在P<0.01水平顯著。
Note:**represents the effect significant at the level ofP<0.01.
共有28個產量相關性狀的QTL在2個以上環境重復檢測到(表3、圖1),其中10個株高QTL,分布在連鎖群B1、B2、C1、C2、D1b、F、G、H、N、O上。qPH-G-2具有最大的可解釋表型變異率(Phenotypic variation explained,PVE)和LOD值, 分別為11.72%和8.36,增效基因來自于墾豐14、墾豐15;其他株高QTL為qPH-B1-1、qPH-B2-1、qPH-C1-1、qPH-C2-1、qPH-D1b-3、qPH-F-3、qPH-H-1、qPH-N-1、qPH-O-1。3個主莖節數QTLqNN-G-2、qNN-H-2、qNN-L-1,分別位于連鎖群G、H、L上,可解釋表型變異率分別為6.55%,5.70%,3.77%,LOD分別為值5.26,3.29,3.23,qNN-G-2、qNN-H-2增效基因來于墾豐14、墾豐15,qNN-L-1增效基因來于墾豐14、墾豐19。9個單株莢數QTLs,分布在連鎖群A2、C2、D1a、E、L、M、N、O上,位于連鎖群M上的qNP-M-2具有最大的可解釋表型變異率和LOD值,分別為11.25%和4.54,增效基因來于墾豐15、墾豐19;其他的單株莢數QTL為qNP-A2-3、qNP-C2-1、qNP-C2-2、qNP-D1a-1、qNP-E-1、qNP-L-1、qNP-N-1、qNP-O-1。2個單株粒數QTLqNS-D2-1和qNS-E-1,分布在連鎖群D2、E上,可解釋表型變異率分別為8.58%和7.52%,LOD值分別為4.25和4.46。4個百粒質量QTLqSW-A2-3、qSW-D2-3、qSW-F-2、qSW-M-2,分布在連鎖群A2、D1、F、M上,可解釋表型變異率分別為6.13%,3.83%,5.58%,9.35%,qSW-M-2位于連鎖群M上Satt245~Satt677區間內,具有最大的可解釋表型變異率9.35%,增效基因來于墾豐14、黑農48,qSW-F-2位于連鎖群F上Sat_240~Satt595區間內,具有最大LOD值4.34,增效基因來于墾豐15、黑農48。

表3 5個產量性狀QTLTab.3 Five yield-traits for QTLs

圖1 定位到的產量相關性狀QTL在圖譜上的位置Fig.1 Location of yield-related traits QTL on the map
國內外關于產量及產量相關性狀QTL的研究日益增多,研究方法也有所不同。以往研究多是單環境下定位QTL,無法確定該QTL定位結果的準確性,基于目前多種QTL定位的方法只是將定位結果簡單比較,在多個環境下定位QTL是非常必要, 采用多環境數據分別進行定位,尋找在多環境下重復定位的QTL,互相驗證真實性,提高QTL定位的準確性,另外,綜合多個環境的分析結果,能增大QTL的檢測強度,準確估計QTL的位置和效應。因此,應用多年多點試驗進行QTL研究已經成為一種趨勢。本研究利用WinQTL Car完備區間作圖法(ICIM)對同一研究材料在5個環境下大豆產量相關性狀表型數據進行分析,定位到28個產量相關QTLs,這些QTL經過多環境下被重復定位,可認為是真實的。
本研究中,試驗群體是穩定的重組自交系群體,RIL是通過單粒傳法(Single seed descent method,SSD)在F2開始分離單株經多代自交構建而成,大大提高了親本間遺傳多樣性的保存,群體內個體基因型純合,是可以長期使用的永久性分離群體,適合用于圖譜的構建和QTL的定位,RIL既可以進行連續性累積,又能方便不同課題間合作。因其永久性群體的特點,還能用來多年多點種植進行基因型和環境互作研究。QTL定位的準確性與群體大小息息相關,群體過小準確性不高,群體過大,準確性提高,但試驗工作量太大,費用過高,所以確定合適的群體至關重要,所以本試驗選用160個家系作為群體,大小適宜,精確定位到QTL,也減少工作量。本試驗不但采用重組自交系群體而且利用四向雜交設計,四向雜交設計群體在每個位點有2個以上的等位基因,與兩向雜交設計相比,有3個優勢可以提高QTL檢測能力。①四向重組自交系群體比雙親本衍生的群體具有更多的多態性遺傳標記;②遺傳標記具有更高的密度和多態性,增大了統計推斷的遺傳空間;③連鎖群同一位點涉及4個復等位基因,大大提高了QTL檢測效率。
本研究在利用前期研究中已經構建的四向重組自交系群體(FW-RIL),用于產量相關性狀QTL定位,原始數據來自于3 a 5個環境的田間記錄調查和實驗室分析,從而定位在多年多點條件下穩定表達的主效QTL位點??梢詫Χㄎ坏降目刂飘a量性狀的QTL加以利用來提高大豆的產量。
為驗證定位QTL的真實性,將本研究中的定位QTL所在的公共圖譜基因組區域與前人研究結果進行比較。本研究共定位到多個環境下穩定檢測到的株高QTL 10個,其中,位于連鎖群C2上Satt643~Satt363區間內的株高QTLqPH-C2-1在公共圖譜上的位置與Mian 等[32]曾報道的株高QTL重疊,位于連鎖群D1b上Sat_183~Sat_096區間內的株高QTLqPH-D1b-3在公共圖譜上的位置與Sun等[33]曾報道的株高QTL重疊,位于連鎖群H上Satt293~Sat_180區間內的株高QTLqPH-H-1在公共圖譜上的位置與Lee等[34]曾報道的株高QTL重疊,位于連鎖群N上Satt125~Satt62區間內的株高QTLqPH-N-1在公共圖譜上的位置與Sun等[33]、Kabelka等[35]、Kim 等[36]曾報道的株高QTL重疊;共定位到單株莢數QTL 9個,其中,位于連鎖群A2上Sat_181~Satt228區間內的單株莢數QTLqNP-A2-3在公共圖譜上的位置與Zhang等[37]曾報道的單株莢數QTL重疊,位于連鎖群C2上Satt291~Satt281區間內單株莢數QTLqNP-C2-1在公共圖譜上的位置與Sun等[33]曾報道的單株莢數QTL重疊,位于連鎖群D1a上Satt580~AZ302047區間內的單株莢數QTLqNP-D1a-1在公共圖譜上的位置與Kuroda等[8]曾報道的單株莢數QTL重疊,位于連鎖群L上Sat_405~Satt398區間內的單株莢數QTLqNP-L-1在公共圖譜上的位置與Zhang等[37]曾報道的單株莢數QTL重疊,位于連鎖群A2上Sct_067~Sat _ 181區間內的百粒質量QTLqSW-A2-3在公共圖譜上的位置與Han等[2]、Teng等[38]曾報道的百粒質量QTL重疊,位于連鎖群D2上的Satt582~Satt002區間內的百粒質量QTLqSW-D2-3在公共圖譜上的位置與Gai等[14]、Zhang等[39]、Li等[17]、Chapman等[40]、Wang等[4]曾報道的百粒質量QTL重疊,位于連鎖群F上Sat_240~Satt595區間內的百粒質量QTLqSW-F-2在公共圖譜上的位置與Yang等[24]、Mian等[41]曾報道的百粒質量QTL重疊,位于連鎖群 M Satt245~Satt677區間內的百粒質量QTLqSW-M-2在公共圖譜上的位置與Teng等[38]曾報道的百粒質量QTL重疊。
上述12個產量相關性狀QTL位點與國內外報道過的均一致,說明QTL檢測準確率較高。利用分子標記遺傳圖譜,定位控制產量相關性狀的QTL,為利用分子標記改良大豆產量潛力提供了有力手段。
本研究利用5個環境的數據構建遺傳連鎖圖譜,對大豆5個主要產量性狀(株高、主莖節數、單株莢數、單株粒數、百粒質量)進行QTL分析,檢測到10個株高QTL、3 個主莖節數QTL、9個單株莢數QTL、2個單株粒數QTL、4個百粒質量QTL,但是這些QTL不均勻地分布在連鎖群上,一些連鎖群上成簇存在,然而其他連鎖群包含少量或不包含QTL,大多產量相關性狀的QTL集中在染色體的相同區域,即一個基因組區域同時控制多個產量性狀,前人也曾報道過,在B1連鎖群上的基因組區域Satt426~Satt509內定位到同時控制株高、單株莢數、主莖節數、百粒質量等性狀的QTL[25,33,38],Satt197~Satt251內定位到同時控制株高、單株莢數、主莖節數等性狀的QTL[25,33,37],Satt251~Satt509內定位到同時控制株高、單株莢數等性狀的QTL[25],Satt197~Satt509內定位到同時控制主莖節數、百粒質量等性狀的QTL[33],在連鎖群C1上的基因組區域Satt565~Satt180內定位到同時控制單株莢數、百粒質量等性狀的QTL[17],在連鎖群C2上的基因組區域A397_1~A748_1內定位到同時控制株高、主莖節數、單株莢數等性狀的QTL[14],在連鎖群D2上的基因組區域Satt256~Satt458內定位到同時控制單株莢數、百粒質量等性狀的QTL[17],在連鎖群H上的基因組區域Satt317~Satt302內定位到同時控制株高、百粒質量等性狀的QTL[3],在連鎖群L上的基因組區域Sat_286~Satt664內定位到同時控制單株莢數、單株粒數、百粒質量等性狀的QTL[8,41],在連鎖群M上的基因組區域A343_2~R079_1內定位到同時控制株高、單株粒數等性狀的QTL[22,42],本研究共定位到3個控制多個產量相關性狀的基因組區域,Satt288~Sct_199同時控制株高、主莖節數等產量性狀,Satt204~Satt263和Satt245~Satt677同時控制單株莢數、百粒質量等產量性狀??烧J為位于這些區間的QTL是多效的。對QTL分布密集的連鎖區域進行深入研究,揭示相互間促使遺傳信息穩定有序的協調和表達機制,對分子育種具有重要意義。