劉坤,張雪海,孫高陽,閆鵬帥,郭海平,陳思遠,薛亞東,郭戰勇,謝惠玲,湯繼華,李衛華
?
玉米株型相關性狀的全基因組關聯分析
劉坤1,張雪海1,孫高陽1,閆鵬帥1,郭海平1,陳思遠2,薛亞東1,郭戰勇1,謝惠玲1,湯繼華1,李衛華1
(1河南農業大學農學院/省部共建小麥玉米作物學國家重點實驗室,鄭州 450002;2鄭州市第一中學,鄭州 450002)
【目的】玉米株型性狀與植株產量、光合效率、抗倒性等密切相關,是理想株型設計育種的基礎,通過對玉米多個株型相關性狀進行全基因組關聯分析,構建玉米理想株型,為抗倒伏、耐密性的玉米新品種選育提供理論基礎。【方法】以284份溫帶、亞熱帶和熱帶材料組成的關聯群體為研究對象,在鄭州與??h2個環境下對玉米總葉片數(LN)、穗上葉片數(LNAN)、穗上葉片數與總葉片數比值(LNAN/LN)、株高(PH)、穗位高(EH)、穗位高與株高的比值(EH/PH)等6個玉米株型相關性狀進行調查,借助覆蓋玉米全基因組約56萬個SNP標記,進行全基因組關聯分析,以期為玉米新品種的選育提供理論依據?!窘Y果】2個環境下,6個性狀均表現為正態分布;大多數性狀之間均存在高度正相關或負相關;方差分析表明這6個株型相關性狀的基因型與環境以及基因型×環境的互作均達到顯著水平。在選擇最優關聯分析模型時,發現Q模型假陽性較高,Q+K模型對假陽性的控制過于嚴格,而K模型的表現最好;在2個環境下,全基因組關聯分析(K模型)共檢測到56個顯著SNP-性狀關聯(≤3.99E-6),這些SNPs共涉及5個性狀的17個位點,每個位點解釋的表型變異從7.97%—10.56%不等。同時發現有4個位點能夠在2個環境中同時被檢測到,表明這4個位點受環境影響較小,在不同環境下可以穩定存在。通過對顯著關聯的SNP上下游各50 kb范圍內候選基因進行搜索,共發現80個候選基因,其中42個具有功能注釋。例如,與株高和穗位高顯著相關的基因GRMZM2G161293編碼一個具有乙酰葡糖轉移酶活性的蛋白,該酶催化UDP-N-乙酰氨基葡萄糖生成糖過程中的N-乙酰葡糖氨基殘基的轉移,可能通過影響玉米籽??扇苄蕴呛窟M而影響產量,推測其為最可能的候選基因。【結論】K模型對假陽性的控制效果最好,基于K模型的GWAS結果,一共檢測到17個株型性狀相關的位點。
玉米(L.);全基因組關聯分析(GWAS);株型性狀;理想株型
【研究意義】玉米的理想株型[1]具有較高的光能利用效率,具備制造更多干物質的生理潛力。實現生育期內源、流和庫的協調發展,合理分配光合產物,可使植株間的競爭達到最小狀態,從而提高產量。株型相關性狀如株高、穗位高、葉片數等與植株產量、光合效率、抗倒性等密切相關,是理想株型設計育種的基礎。因此,對其遺傳基礎進行研究,不但可以了解玉米理想株型建成的遺傳機制,而且還可幫助在育種實踐中有效降低植株高度與穗位高度、合理調控葉片數目及分布,從而提高作物產量?!厩叭搜芯窟M展】玉米株型性狀是典型的數量性狀,由多基因控制并受多種因素尤其是環境的影響十分顯著。因此,科研工作者常利用數量性狀位點(quantitative trait locus,QTL)定位的方法分析玉米株型性狀的遺傳機制,解析基因的遺傳效應、基因之間的互作及基因與環境之間的互作關系。近年來,隨著測序技術和統計方法的發展,研究者借助高密度標記分別對株高、穗位高、葉夾角、葉長、葉寬、節間數等玉米株型性狀的遺傳規律進行解析。玉米株高與穗位高是株型的重要構成因子,并且是玉米數量遺傳學研究的模式性狀,前人分別利用不同的分離群體(如重組自交系群體)和關聯群體等[2-8],對玉米株高和穗位高的遺傳機制進行了大量研究,檢測到多個與株高和穗位高相關的QTL,分布在玉米的10條染色體上[9-10]。其中位于玉米第1染色體的所在的玉米株高效應位點,可以解釋20%的表型變異。Teng等[11]克隆的株高基因,被認為是調控玉米株高的主效QTL即的候選基因。Yang等[12]對玉米株高進行了關聯分析,在混合線性模型下僅找到一個位于第3染色體的SNP(chr.3:162709488),該SNP可解釋9.61%的表型變異;Pan等[13]利用3種不同的定位方法(SLM、JLM和GWAS)對10個重組自交系群體組成的ROAM群體的株型性狀進行定位,在SLM、JLM和GWAS下分別鑒定到83、86和38個株高QTL,并精細定位了一個位于第3染色體的株高主效QTL到600 kb(165.73—166.37 Mb)。國內外許多學者對玉米葉片數與產量之間的關系也進行了大量研究[14-16],發現雖然多葉品種可以增加穗上部分的葉片面積,增加了受光面積指數,使得植株生物量增高,但是多葉品種并沒有增加籽粒產量。而玉米品種最終產量的提高是在種植密度不變的條件下增加了玉米的葉面積指數,進而增加受光面積,加速灌漿速率[17-20],其中穗上葉片數對單產有較大的正向直接效應[21]?!颈狙芯壳腥朦c】盡管前人利用不同的分離群體定位并克隆了一些與株高、穗位高、葉片數等株型性狀相關的QTL或基因,但由于這些性狀屬于復雜的數量性狀,人們對其遺傳機理還知之甚少。【擬解決的關鍵問題】本研究以284份遺傳多樣性豐富的溫帶、亞熱帶和熱帶材料組成的關聯群體為研究對象,借助覆蓋玉米全基因組的約56萬個SNP標記,對玉米多個株型相關性狀進行全基因組關聯分析,旨在為玉米理想株型的構建,為抗倒伏、耐密植的玉米新品種選育提供理論基礎。
所用材料為華中農業大學嚴建兵教授提供,是從關聯群體(n=513)中選擇的在鄭州及鶴壁適應性較好的284份玉米自交系構成,主要來源為熱帶(104份)、亞熱帶(42份)及溫帶材料(138份)。
關聯群體于2012年分別種植在鄭州河南農業大學試驗站(鄭州試驗站)與鶴壁浚縣的鶴壁農科院試驗站(浚縣試驗站)。田間設計采用完全隨機區組設計,3次重復,每個材料單行區種植,行長4 m,行距0.67 m,株距0.25 m,密度63 000株/hm2,田間管理采用常規管理。為了葉片數目調查的準確性,在小喇叭口和大喇叭口時期分別對玉米第5和第10片葉進行標記,并在玉米灌漿末期,每一行挑選10株長勢均勻的植株對4個株型相關性狀株高(plant height,PH)、穗位高(ear height,EH)、總葉片數(leaf number,LN)和穗上葉片數(leaf number above ear,LNAN)進行調查。
1.3.1 一般統計分析 采用Excel、SPSS19.0統計軟件對2個環境下關聯群體的株高(PH)、穗位高(EH)、總葉片數(LN)、穗上葉片數(LNAN)以及由此衍生的穗位高/株高(EH/PH)和穗上葉片數/總葉片數(LNAN/LN)等6個性狀進行統計分析,并分別計算各性狀的平均值、標準差、標準誤、頻率分布等,并進行相關性分析。
同時根據R語言的lme4包[22]的混合線性模型進行最佳線性無偏預測(best linear unbiased prediction,Blup),評估2個環境下每一個材料每一個性狀的育種值,最終Blup值也用于后續的全基因組關聯分析。
1.3.2 全基因組關聯分析 所使用的基因型為華中農業大學嚴建兵教授提供的覆蓋玉米全基因組的最小等位基因頻率大于0.05的558 629個SNPs組成[12],基因型數據可在網站http://www.Maizego.org/Resources.html下載??紤]到很多標記間可能存在高度連鎖不平衡,因此,采用GEC軟件[23]計算了有效標記數(effective number,Ne),并根據軟件給出的建議值(1/Ne)作為確定各性狀-SNP間是否顯著關聯的依據。
在全基因組關聯分析(GWAS)中,由于不同性狀對GWAS不同模型控制假陽性和假陰性的敏感程度不同,因此統計功效是首先要考慮的因素。為了選擇最優的GWAS模型,使用了3種常用的模型,即只控制群體結構的Q模型(Q)、只控制親緣關系的K模型(K)及同時控制群體結構和親緣關系的Q+K模型(Q+K),對每一個性狀進行了GWAS分析。通過對3種模型的QQ Plot的比較來選擇最優模型并對最優模型的GWAS結果進行進一步解析,以上GWAS分析均在TASSEL3.0(http://www.maizegenetics.net/)軟件中完成。先前研究表明,該群體的連鎖不平衡(linkage disequilibrium,LD)衰減距離為50 kb[24-25],利用558 629個SNP標記對所用材料的LD進行了重新評價,發現平均LD為50—100 kb(2=0.1),簡便起見,選擇50 kb作為LD衰減距離。因此定義峰值SNP上下游各50 kb的區間范圍(即共100 kb)為一個位點;同時定義不同位點間,若存在重疊部分,則這些位點構成一個非重復的QTL。另外,基于B73參考基因組(B73 RefGen_v2),從玉米數據庫MaizeGDB(http://www.maizegdb.org)下載玉米基因組的基因列表搜索每一個位點內的所有可能的候選基因。根據InterProScan數據庫(http: //www. ebi.ac.uk/ interpro/scan.html)并結合美國國立生物技術信息中心數據庫(https://www.ncbi.nlm.nih.gov/)對每一個候選基因進行功能注釋。最后根據每一個位點內所有基因的功能注釋及其在B73的各組織的表達情況,選擇一個最可能的候選基因。
對此關聯群體在不同環境下的6個株型相關性狀LN、LNAN、LNAN/LN、PH、EH、EH/PH的表型進行統計分析(表1),得知玉米株型相關性狀存在廣泛變異。同時,也發現??h試驗站的株高、穗位高、總葉片數及穗上葉片數均高于鄭州試驗站(圖1),主要是由于浚縣位于更高緯度,日照長度要高于鄭州,導致營養生產期延長所致,同時發現2個環境中株型相關性狀的峰度和偏度的絕對值均小于1(表1),暗示這些性狀均遵從正態分布,表明這些性狀均為典型的數量性狀,由微效多基因控制。
通過對2個環境的6個玉米株型性狀進行相關性分析,發現除了浚縣試驗站穗位高與穗上葉片數及2個環境下株高與穗位高/株高的比值不存在顯著相關之外。其余各性狀之間均表現出顯著正相關或顯著負相關(表2)。2個環境中的穗上葉片數與總葉片數的比值和穗上葉片數之間、以及穗位高與株高比值和穗位高之間、株高和穗位高之間的相關系數較大,并處于極顯著水平。說明各性狀的發育存在著相互協同促進的作用。

a:葉片數相關性狀;b:株高相關性狀;XX表示浚縣試驗站;ZZ表示鄭州試驗站;LN:總葉片數;LNAN:穗上葉片數;LNAN/LN表示穗上葉片數與總葉片數比值;EH:穗位高;PH:株高;EH/PH:穗位高與株高的比值。下同

表1 玉米不同環境下株型相關性狀描述統計分析

表2 關聯群體株型性狀的相關性分析
**:在0.01水平上顯著相關;*:在0.05水平上顯著相關。下同。對角線右上角表示??h點,對角線左下角表示鄭州點
* *: Correlation is significant at the 0.01 level; *: Correlation is significant at the 0.05 level. The same as below. Correlation coefficients in Xunxian are above the diagonal, in Zhengzhou are below the diagonal
方差分析結果表明,關聯群體所有6個株型性狀的基因型效應都達到極顯著水平,說明關聯群體各材料間的株型性狀存在顯著的遺傳變異(表3)。同時,環境間、基因型與環境互作的差異也達到極顯著水平,說明玉米株型不同性狀受環境影響較大,同時也存在著基因型與環境之間的互作關系。
2.3.1 閾值確定 通過GEC軟件[23]計算了558 629個SNPs的有效標記數,結果表明,有效標記數Ne為250 345,軟件給出的建議值為3.99E-6(1/Ne),因此,該值將作為后續GWAS分析的標記-性狀間顯著關聯的閾值。
2.3.2 模型選擇 以2個環境下6個性狀的Blup值(作為一個新的環境)為例,用3種模型(Q、K和Q+K)分別進行了GWAS分析,通過不同性狀3種模型的比較,從QQ圖中不難看出(圖2),對這6個性狀來說,Q模型(圖中紅色點)對假陽性的控制效果最差,而K(圖中黑色點)和Q+K模型(圖中藍色點)對假陽性的控制較好,但是Q+K模型控制的過于嚴格,綜合考慮,在后續分析中,對這6個性狀,均選擇K模型的結果進行進一步闡述。
2.3.3 關聯分析結果解析 利用覆蓋全基因組的558 629個SNP標記對關聯群體在2個環境下的6個株型性狀進行關聯分析,基于K模型,在≤3.99E-6下,6個株型性狀一共檢測到56個SNPs-性狀關聯。2個環境聯合分析條件下(Blup),6個株型相關性狀的曼哈頓圖見圖3。
用55萬SNPs標記對該群體LD的評估表明,該群體的衰減距離為50 kb[24],基于此衰減距離,56個SNPs-性狀關聯涉及到的SNP一共分布于17個位點內,該結果與數量性狀位點的本質相一致,即由微效多基因控制;其中在鄭州試驗站、??h實驗站及Blup下分別檢測到8個、5個和9個位點。具體來說(表4和圖4),鄭州環境下一共檢測到10個SNP-性狀關聯,涉及到8個位點,分別是位于第5和第8染色體與株高有關的2個位點,分別解釋8.73%和9.54%的株高表型變異;位于玉米第3、5、6、8染色體與穗位高有關的4個位點,每個位點解釋的表型變異在8.19%—10.10%不等,平均為8.83%;及位于第4和第8染色體與穗位高與株高比值相關的2個位點,分別解釋8.83%和10.42%的表型變異。并沒有檢測到與葉片數相關性狀的顯著位點。而在??h環境下,一共檢測到5個顯著位點,分別為與株高有關的位于第1和第7染色體的2個位點,分別可解釋9.69%和9.66%的表型變異;及與穗位高,穗位高與株高比值及總葉片數有關的分別位于第8、7、10染色體的3個位點,這3個位點分別能解釋10.31%、9.34%和10.46%表型變異。2個環境聯合分析(Blup)下,在第9染色體共檢測到與穗位高相關的8個顯著位點(涉及到16個顯著的SNP),每個位點平均可解釋8.76%的表型變異;同時發現位于第5、8、9染色體的3個與株高有關的位點,分別解釋8.12%、9.20%和8.58%的表型變異,其中位于第9染色體的位點里有11個顯著的SNPs,并且該位點與穗位高的位點為同一個位點。還發現1個位于第8染色體的與穗位高與株高比值的位點,可解釋10.12%的表型變異;2個與總葉片數有關的位點,位于第7和第10染色體,分別解釋8.12%和8.22%的表型變異;另外還發現2個分別位于第3和第5與穗上葉片數有關的位點,分別可解釋8.06%和8.88%的表型變異。

表3 玉米不同環境下株型相關性狀的方差分析
E:環境;G:基因型;G×E:基因與環境互作
E: environment; G: genotype; G×E: genotype-by-environment interaction
同時發現有4個位點,分別為表4中的第7、13、14和17位點可同時在2個以上環境中被檢測到,表明這些位點受環境影響較小,可在不同環境下穩定遺傳,這些信息為將來繼續深入分析這些位點提供了有價值的信息。值得注意的是,在2個環境及Blup下均沒檢測到與穗上葉片數與總葉片數比值相關的位點(圖3、圖4和表4),表明這一性狀受環境影響較大或在該群體中不存在控制這一性狀的主效位點。

a:株高_2012;b:穗位高_2012;c:穗位高/株高_2012;d:穗上葉片數_2012;e:總葉片數_2012;f:穗上葉片數/總葉片數_2012。下同
基于該群體的LD衰減距離,在峰值SNP上下游各50 kb范圍內搜索候選基因。6個株型性狀的17個顯著關聯位點上下游各50 kb范圍內一共搜到80個候選基因,其中有功能注釋的基因有42個。根據每一個位點內所有候選基因的功能注釋及其在B73的各組織的表達情況,選擇一個最可能的候選基因及其注釋列于表4。
由于不同性狀對GWAS不同模型在控制Ⅰ型錯誤(假陽性)的敏感性不同,即存在性狀依賴性,因此,在進行GWAS分析前首要考慮的是GWAS的統計功效,即最大可能的降低假陽性。先前研究表明,對于玉米的開花期、穗位高和穗粗性狀來說,K模型和Q+K模型均能很好的控制假陽性,但是Q+K模型比K模型更好[26]。本研究發現Q+K模型對假陽性的控制較嚴格(圖2),若采用Q+K模型則會產生更多的假陰性結果,而K模型對假陽性的控制效果最好,因此,最終選擇表現較好的K模型對GWAS結果進行進一步解析。
玉米的農藝及產量相關性狀的研究近年來報道較多,陳榮江等[27]通過研究玉米的穗長、穗行數、行粒數、百粒重、株高、穗位高、穗重及穗粗在內的8個性狀與產量之間的關系,發現這8個性狀與產量存在正相關;湯繼華等[2]以豫玉22構建的260多個F2:3家系為材料,研究了不同環境條件下的穗位高、雄穗分枝數、莖粗與產量之間的關系,發現與產量之間也存在顯著正相關。本研究以284份遺傳性豐富的溫帶、熱帶、亞熱帶材料為研究對象,在鄭州和浚縣2個環境下對玉米株高、穗位高、總葉片數和穗上葉片數以及株高/穗位高、總葉片數/穗上葉片數等6個株型性狀進行分析,發現在2個環境下的不同性狀之間均存在顯著正相關或者負相關,說明各性狀的發育存在著相互協同促進作用。通過對鄭州和??h這6個株型性狀的全基因組關聯分析,在K模型下,一共檢測到56個SNP-性狀關聯(株高、穗位高、穗位高與株高比值、總葉片數、穗上葉片數),這些SNP涉及到17個位點。而穗上葉片數與總葉片數比值這一性狀沒有檢測到顯著的SNPs,表明該性狀受環境影響較大或者在該關聯群體中不存在控制這一性狀的主效位點。在這17個位點里,同時發現有4個位點能夠在2個環境中被檢測到,表明這4個位點受環境影響較小,在不同環境下可以穩定存在。同時也發現,有的性狀和多個位點顯著關聯,表明這些性狀受微效多基因控制,符合數量性狀的本質[28]。

圖3 ??h與鄭州2個環境結合分析(Blup)下株型相關性狀的曼哈頓圖

圖4 各個環境下株型相關性狀顯著位點的分布

表4 全基因組關聯分析鑒定到的顯著位點及有關信息以及每個位點里的最可能的候選基因及其功能注釋
a所有有重疊區間的QTL被歸為一個非重復的QTL或位點,位點的ID根據染色體及物理位置升序排序命名;b每個SNP的物理位置是基于B73參考基因組v2版本得到;c相應性狀的值是通過K模型計算得到;d相應位點解釋的表型變異;e位點內一個可能的生物學候選基因或離峰值SNP最近的候選基因。ZZ表示鄭州,XX表示浚縣,Blup表示2個環境的綜合
aAll QTLs with overlapping QTL regions were categorized as a non-redundant QTL or loci, ID of loci was numbered according to chromosome and position by a ascending order method;bPhysical position of each SNP based on B73 RefGen_v2.cP value of the corresponding trait calculated by K model.dThe phenotypic variance explained by the corresponding locus.eA plausible biological candidate gene in the locus or the nearest annotated gene to the lead SNP. ZZ: Zhengzhou; XX: Xunxian
基于B73參考基因組及每一個顯著位點的LD衰減距離,在這17個位點里一共發現80個候選基因,其中42個基因有功能注釋,其余38個基因的功能未知;42個已知功能的基因涉及到轉導蛋白、還原蛋白、金屬離子轉運蛋白、脂類蛋白、纖維素合酶等,功能涉及能量代謝、物質運輸、生物調控、信號傳導等生化代謝途徑。
17個位點里,發現多個位點里存在多個顯著的SNP,比如位點16里含有17個顯著SNP,表明這些SNP間可能存在很強的連鎖不平衡關系,這些成簇SNP所在區域,是控制株型性狀的熱點區域,有必要對其加以深入挖掘,為培育理想株型品種的選育提供重要研究價值。鄭克志等[25, 29]以玉米自交系T319與9406為親本構建的242個重組自交系(F8)對玉米株高和穗位高進行QTL分析,結果發現6個株高相關的QTL,其中有2個QTL同時控制穗位高。本研究也發現了4個位點(位點7、13、14和17)可同時在2個以上環境中被檢測到(表4),表明這些位點受環境影響較小,可在不同環境下穩定遺傳,同時也發現有些位點同時控制多個性狀,比如位點16同時控制株高和穗位高,這些信息為將來繼續深入利用和克隆這些位點提供了有價值的信息。
本研究通過玉米株型性狀顯著關聯的SNP所在位點對可能的候選基因進行預測。6個性狀,有5個性狀均能檢測到顯著位點,隨后對每一個性狀的顯著位點的候選基因及其功能進行了預測(表4),值得注意的是,在鄭州和??h2個環境的綜合條件下,位于第9染色體的位點16(chr.9:139516295—chr.9:139517032)同時與株高和穗位高顯著關聯,并且該位點在先前的兩個研究中也被報道與株高相關(假定2個研究定位的顯著SNP物理位置小于5 Mb被認為同一個位點)。比如,Yang等[12]通過A—D test共檢測到株高相關的107個顯著SNP,其中第9染色體的4個SNP(chr9..S_140356597、chr.9.S_140435314、chr.9.S_142397931和chr.9.S_142495942)與該位點共定位;Samayoa等[30]通過關聯分析檢測到18個株高顯著SNP,其中第9染色體的一個SNP, S9_142752809,與該位點共定位;該位點(位點16)內一共存在4個候選基因(GRMZM5G872568、GRMZM2G063875、GRMZM2G161293和GRMZM2G366532),除GRMZM2G161293外,其余基因的功能未知。而GRMZM2G161293編碼一個BGGP Beta-1-3-半乳糖-O-糖基-糖蛋白,具有乙酰葡糖轉移酶活性,該酶催化UDP-N-乙酰氨基葡萄糖生成糖過程中的N-乙酰葡糖氨基殘基的轉移,猜測可能通過影響玉米籽粒可溶性糖含量進而影響產量,推測其為最可能的候選基因;另外發現在2個環境下能同時檢測到的4個位點(位點7、13、14和17),其中基因GRMZM2G005082、GRMZM5G897342、GRMZM2G440125和GRMZM2G074689分別位于位點7、13、14和17中,這4個基因分別編碼水解酶,常溫蛋白,鋅離子結合蛋白及鈣離子結合蛋白;這些同時控制多個性狀的SNP或位點及其在2個環境中同時被檢測到的SNP或位點可能與株型相關性狀的候選基因緊密連鎖,可以作為下一步研究的重點區域。
本研究借助覆蓋玉米全基因組的約56萬個SNP標記,利用3種模型(Q、K和Q+K)對玉米總葉片數(LN)、穗上葉片數(LNAN)、穗上葉片數與總葉片數比值(LNAN/LN)、株高(PH)、穗位高(EH)、穗位高與株高的比值(EH/PH)等6個玉米株型相關性狀進行全基因組關聯分析,發現K模型對假陽性的控制效果最好。基于K模型的GWAS結果,一共檢測到56個SNP-性狀關聯,涉及17個位點,對顯著關聯的SNP上下游各50 kb范圍內候選基因進行搜索,共發現80個候選基因,其中42個具有功能注釋。
致謝:華中農業大學作物遺傳改良國家重點實驗室嚴建兵教授為本試驗提供關聯群體材料及基因型,在此表示感謝。
[1] Donald M. Breeding of crop ideotypes., 1968, 17(3): 385-403.
[2] 湯繼華, 謝惠玲, 黃紹敏, 胡彥民, 劉宗華, 季洪強, 寇志安. 缺氮條件下玉米自交系葉綠素含量與光合效率的變化. 華北農學報, 2005, 20(5): 10-12.
TANG J H, XIE H L, HUANG S M, HU Y M, LIU Z H, JI H Q, KOU Z A. The changes of the content for chlorophyll and photosynthetic productivity in maize inbred lines under the low-nitrogen stress., 2005, 20(5): 10-12. (in Chinese)
[3] 何坤輝, 常立國, 崔婷婷, 渠建洲, 郭東偉, 徐淑兔, 張興華, 張仁和, 薛吉全, 劉建超. 多環境下玉米株高和穗位高的QTL定位. 中國農業科學, 2016, 49(8): 1443-1452.
HE K H, CHANG L G, CUI T T, QU J Z, GUO D W, XU S T, ZHANG X H, ZHANG R H, XUE J Q, LIU J C. Mapping QTL for plant height and ear height in maize under multi-environments., 2016, 49(8): 1443-1452. (in Chinese)
[4] 殷鵬程. 玉米株高和穗位高的QTL定位[D]. 武漢: 華中農業大學, 2015.
YIN P C.QTL mapping of plant height and ear height in maize[D]. Wuhan: Huazhong Agricultural University, 2015. (in Chinese)
[5] 楊俊品, 榮廷昭, 向道權, 唐海濤, 黃烈建, 戴景瑞. 玉米數量性狀基因定位. 作物學報, 2005, 31(2): 188-196.
YANG J P, RONG T Z, XIANG D Q, TANG H T, HUANG L J, DAI J R. QTL mapping of quantitative traits in maize., 2005, 31(2): 188-196. (in Chinese)
[6] 曹永國, 王國英, 王守才, 魏艷玲, 盧江, 謝友菊, 戴景瑞. 玉米RFLP遺傳圖譜的構建及矮生基因定位. 科學通報, 1999, 44(20): 2178-2182.
CAO Y G, WANG G Y, WANG S C, WEI Y L, LU J, XIE Y J, DAI J R. Construction and localization of dwarf gene RFLP genetic map of maize., 1999, 44(20): 2178-2182. (in Chinese)
[7] 蘭進好, 李新海, 高樹仁, 張寶石, 張世煌. 不同生態環境下玉米產量性狀QTL分析. 作物學報, 2005, 31(10): 1253-1259.
LAN J H, LI X H, GAO S R, ZHANG B S, ZHANG S H. QTL analysis of yield components in maize under different environments., 2005, 31(10): 1253-1259. (in Chinese)
[8] 許誠, 王彬, 毛克舉, 胡彥民, 謝惠玲, 湯繼華. 利用單片段代換系群體定位玉米株型性狀QTL. 玉米科學, 2014, 22(2): 28-34.
XU C, WANG B, MAO K J, HU Y M, XIE H L, TANG J H. QTL mapping for plant-type related traits using single segment substitution lines in maize., 2014, 22(2):28-34. (in Chinese)
[9] 張志明, 趙茂俊, 榮廷昭, 潘光堂. 玉米SSR連鎖圖譜構建與株高及穗位高QTL定位. 作物學報, 2007, 33(2): 341-344.
ZHANG Z M, ZHAO M J, RONG T Z, PAN G T. SSR linkage map construction and qtl identification for plant height and ear height in maize (L)., 2007, 33(2): 341-344. (in Chinese)
[10] Xing A, Gao Y, Ye L F,CAI L CHING A, LLACA V, JOHNSON B, LIU L, YANG X H, KANG D M, YAN J B, LI J S. A rare SNP mutation in brachytic2 moderately reduces plant height and increases yield potential in maize., 2015, 66(13): 3791-3802.
[11] Teng F, Zhai L, Liu R, BAI W, WANG L, HUO D, TAO Y, ZHENG Y, ZHANG Z. ZmGA3ox2, a candidate gene for a major QTL, qPH3.1, for plant height in maize., 2013, 73(3): 405-416.
[12] YANG N, LU Y, YANG X, HUANG J, ZHOU Y, ALI F, WEN W, LIU J, LI J, YAN J.Genome wide association studies using a new nonparametric model reveal the genetic architecture of 17 agronomic traits in an enlarged maize association panel., 2014, 10(9): e1004573.
[13] PAN Q, XU Y, LI K, PENG Y, ZHAN W, LI W, LI L, YAN J. The genetic basis of plant architecture in 10 maize recombinant inbred line populations., 2017, 175(2): 858-873.
[14] SHAVER G R. Mineral nutrition and leaf longevity inthe role of individual nutrients and the timing of leaf mortality., 1983, 56(2): 160-165.
[15] Dwyer L M, Andrews C J, Stewart D W, MA B L, DUGAS J A. Carbohydrate levels in field-grown leafy and normal maize genotypes., 1995, 35(4): 1020-1027.
[16] Andrews C J, Dwyer L M, Stewart D W, DUGS J A, BONN P, DEYER L M. Distribution of carbohydrate during grainfill in leafy and normal maize hybrids., 2000, 80(1): 87-95.
[17] Stewart D W, Dwyer L M. Mathematical characterization of maize canopies., 1993, 66(3): 247-265.
[18] Modarres A M, Hamilton R I, Dwyer L M, STEWART D W, DIJAK M, SMITH D L. Leafy reduced-stature maize for short-season environments: yield and yield components of inbred lines., 1997, 97(2): 129-138.
[19] Begna S H, Hamilton R I, Dwyer L M, STEWART D W, SMITH D L. Effects of population density on the yield and yield components of leafy reduced-stature maize in short-season areas., 2010, 178(2): 103-110.
[20] DIJAK M, MODARRES A M, HAMILTON R I, DWYER L M, STEWART D W, MATHER D E, SMITH D L. Leafy reduced-stature maize hybrids for short-season environments., 1999, 39(39): 1106-1110.
[21] 曹靖生. 幾個玉米株型性狀的遺傳規律研究. 黑龍江農業科學, 1995(3): 16-19.
CAO J S. Genetic studies on some plant type traits in maize., 1995(3): 16-19. (in Chinese)
[22] CORETEAM R. R: a language and environment for statistical computing.,2015, 14: 12-21.
[23] LI M X, YEUNG J M, CHERNY S S, SHAM P C. Evaluating the effective numbers of independent tests and significant-value thresholds in commercial genotyping arrays and public imputation reference datasets., 2012, 131(5): 747-756.
[24] LI H, PENG Z, YANG X, WANG W, FU J, WANG J H, HAN Y G, CHAI Y C, GUO T T, YANG N, LIU J, WARBURTON M L, CHENG Y B, HAO X M, ZHANG P, ZHAO J Y, LIU Y J, WANG G Y, LI J S, YAN J B. Genome-wide association study dissects the genetic architecture of oil biosynthesis in maize kernels., 2013, 45(1): 43-50.
[25] Feng Y, Zheng Q, Song H, WANG Y, WANG A, JIANG L, YAN J, ZHENG Y, YUE B. Multiple loci not only Rf3 involved in the restoration ability of pollen fertility, anther exsertion and pollen shedding to S type cytoplasmic male sterile in maize., 2015, 128(11): 2341-2350.
[26] Yang X, Gao S, Xu S, Zhang Z, Prasanna BM, Li L, Li J, Yan J. Characterization of a global germplasm collection and its potential utilization for analysis of complex quantitative traits in maize., 2011, 28: 511-526
[27] 陳榮江, 劉永錄. 玉米若干農藝性狀的遺傳相關分析. 河南科技學院學報(自然科學版), 1997(2): 19-24.
CHEN R J, LIU Y L. Genetic relation analysis of agronomic characters maize.(), 1997(2): 19-24. (in Chinese)
[28] Xiao Y, Tong H, Yang X, XU S, PAN Q, QIAO F, RAIHAN M S, LUO Y, LIU H, ZHANG X, YANG N, WANG X, DENG M, JIN M, ZHAO L, LUO X, ZHOU Y, LI X, LIU J, ZHAN W, LIU N, WANG H, CHEN G, CAI Y, XU G, WANG W, ZHANG D, YAN J. Genome-wide dissection of the maize ear genetic architecture using multiple populations., 2015, 210(3): 1095-1106.
[29] 鄭克志, 李元, 瞿會, 閆偉, 張曠野, 宋茂興, 呂香玲, 李鳳海, 史振聲. 玉米株高和穗位高的QTL定位. 江蘇農業科學, 2015, 43(5): 61-63.
ZHENG K Z, LI Y, QU H, YAN W, ZHANG K Y, SONG M X, LüX L, LI F H, SHI Z S. QTL mapping of plant height and ear height in maize., 2015, 43(5): 61-63. (in Chinese)
[30] SAMAYOA L F, MALVAR R A, OLUKOLU B A, HOLLAND J B, BUTRON A. Genome-wide association study reveals a set of genes associated with resistance to the mediterranean corn borer (L.) in a maize diversity panel., 2015, 15: 35.
(責任編輯 李莉)
Genome-wide AssociationStudies of Plant Type Traitsin Maize
LIU Kun1, ZHANG XueHai1, SUN GaoYang1, YAN PengShuai1, GUOHaiPing1, CHEN SiYuan2, XUE YaDong1,GUO ZhanYong1, XIEHuiLing1,TANG JiHua1,LI WeiHua1
(1College of Agronomy, HenanAgriculturalUniversity/KeyLaboratory of Wheat and Maize Crops Science,Zhengzhou450002;2No.1 Middle School of Zhengzhou, Zhengzhou450002)
【Objective】Plant morphological traits arethebasis of ideotype-based maize breeding which are closely related to photosyntheticefficiency, lodgingresistance and grain yields. Genome-wide association studies (GWAS) of 558 629 SNPs with genome-wide coverage was used to elucidate the genetic basis of six plant morphological traits, including totalnumber of leaves (LN), leafnumber above ear (LNAN), the ratio of LNAN to LN (LNAN/LN), plantheight (PH), earheight (EH) and the ratio of EHtoPH (EH/PH), which could provide theoretical basis in enhancing ideotype-based maize breeding and facilitating the genetic improvement of new maize varieties with high plant density and lodging resistance. 【Method】Inthisstudy, a representative panel of 284 inbred lines plantedinZhengzhouandXunxian, including temperate,subtropicalandtropicalmaterials, were used for association mapping.【Result】 All traits measured in the two locations exhibited an approximately normal distribution. Highly positive or negative correlations between paired traits were observed. Variance analysis of these traits indicated that significant variations were observed across environment, genotype and the genotype × environment interaction. When test with the optimal GWAS model, we found that Q model showed high type I errors (false positive), while Q+K model were too strict in reducing false positive. K model is the best in reducing false positive. Totally, 56 significant SNP-trait associations involving in 17 loci were identified for five traits (≤3.99E-6), each locus can explain phenotypic variation ranging from 7.97% to 10.56%. Moreover, four loci were detected in both environments, indicating that these 4 loci were less affected by environment effects and could be stable in different environments. All potential candidate genes and their annotations within 100 kb (50 kb upstream and downstream of the lead SNP) of the loci were identified, in total, 80 candidate genes were found, including 42 genes that have functional annotation. For example,the gene GRMZM2G161293 encoding a protein that has acetylgluco-saminyl transferase is associated with plant height and ear height. It catalyzes the transfer of the amino group from N-acetyl glucosamine to glucose, which may improve yield by influencing the content of soluble sugars in maize kernels.【Conclusion】The results indicated that K model having the best result in reducing the type I errors (false positive). Based on K model, a total of 17 loci associated with plant morphological traits were identified.
maize (L.); genome-wide association study; plant type traits; ideotype
2017-09-26;
2017-11-26
國家自然科學基金(U1604231)、河南省重大科技專項(161100110500)、河南省科技攻關項目(152102110060)
劉坤,E-mail:lkun2017@163.com。張雪海,E-mail:xuehai85@126.com。劉坤和張雪海為同等貢獻作者。
李衛華,Tel:0371-63558122;E-mail:liwh416@163.com