司二靜,楊淑蓮,孟亞雄,李葆春,馬小樂, 汪軍成, 任盼榮,姚立蓉,張 宇,王化俊
(1.甘肅省干旱生境作物學重點實驗室/甘肅省作物遺傳改良與種質創(chuàng)新重點實驗室,甘肅蘭州 730070; 2.甘肅農(nóng)業(yè)大學農(nóng)院,甘肅蘭州 730070;3.甘肅農(nóng)業(yè)大學檔案館,甘肅蘭州 730070; 4.甘肅農(nóng)業(yè)大學生命科學技術學院,甘肅蘭州 730070;5.甘肅省種子管理局,甘肅蘭州 730020)
大麥作為全球第四大禾谷類作物,因其較強的抗旱、耐貧瘠和耐鹽性被廣范種植,且具有良好的飼用、食用和啤用價值。籽粒蛋白質含量是決定大麥用途的重要性狀之一,飼用、食用和啤用大麥對籽粒蛋白質含量要求不盡相同,如啤用大麥蛋白質含量一般要求在9.0%~12.0%之間,而飼用和食用大麥則蛋白質含量越高越好,優(yōu)質飼用和食用大麥的籽粒蛋白質含量一般要求大于13.0%[1]。大麥籽粒蛋白質含量受環(huán)境條件影響,但主要由遺傳因素控制[2],且由主效基因和若干微效基因共同控制[3]。Marquez-Cedillo等[4]利用雙單倍體群體對麥芽質量相關性狀進行QTL定位,分別在2H、4H和5H上檢測到與大麥蛋白質含量相關的QTL,標記區(qū)間依次為vrs1-MWG503、INT-C-HVM40和MWG635d-ABC302a。
關聯(lián)分析通過對關聯(lián)群體的候選基因檢測或者分子標記掃描,得到豐富的基因位點及其等位基因信息,進一步與相關性狀關聯(lián),分析鑒定出對其目標性狀有正向貢獻的優(yōu)異等位基因[5]。在小麥[6-7]、玉米[8-9]、水稻[10-11]和大麥[12-16]等作物中均有關聯(lián)分析應用的報道,已有對大麥性狀的關聯(lián)分析主要涉及耐脅迫[12-13]、抗病[14-16]、農(nóng)藝性狀[17-20]等,而關于以大麥籽粒蛋白質含量為目標性狀進行關聯(lián)分析的研究還未見報道。
本研究擬運用SSR標記對大麥材料進行群體結構分析,并通過SSR標記與目標性狀的關聯(lián)分析,探討與大麥蛋白質含量相關聯(lián)的SSR標記,為大麥的分子輔助選擇育種提供參考依據(jù)。
供試的93份大麥材料由甘肅農(nóng)業(yè)大學甘肅省干旱生境作物學重點實驗室/甘肅省作物遺傳改良與種質創(chuàng)新重點實驗室麥類種質創(chuàng)新課題組和甘肅省農(nóng)業(yè)科學院大麥研究所提供,來源及編號見表1。2015年3月將93份大麥材料點播種植于甘肅農(nóng)業(yè)大學黃羊鎮(zhèn)實驗田。采用常規(guī)田間管理,成熟期收獲并測定蛋白質含量。

表1 供試材料來源Table 1 Origin of materials used in the study
用近紅外線分析儀(Foss NIR system)測定大麥籽粒蛋白質含量。
在直徑9 cm培養(yǎng)皿中進行不同大麥品種萌發(fā),22 ℃黑暗培養(yǎng)2周后采集大麥葉片,在研缽中添加液氮后進行樣品研磨,運用CTAB法[21-22]提取基因組DNA,-20 ℃保存?zhèn)溆谩⒖糋rain Genes 2.0網(wǎng)站、Korff等[23]構建的遺傳圖譜、司二靜等[20]研究結果,按遺傳距離選取93個均勻分布于大麥1H~7H染色體的SSR標記(表2)對93份大麥材料的DNA進行PCR擴增 。擴增體系為10 μL,包括5 μL 2×MasterMix (BIOTEKE,PR1701),上下游引物各1 μL(10 μmol),1 μL模板(60 ng·μL-1),加ddH2O至10 μL。擴增程序為95 ℃ 3 min;94 ℃ 50 s,64~55 ℃(touch-down PCR)50 s,72 ℃ 50 s,10個循環(huán);94 ℃ 50 s,55 ℃ 50 s,72 ℃ 50 s,30個循環(huán);72 ℃ 10 min,4 ℃ 保存。PCR擴增產(chǎn)物用8%的聚丙烯酰胺凝膠電泳分離,銀染顯色。
每對SSR引物擴增的每一條帶記為1個位點,基因型以大寫字母A、B、C等表示。運用Power marker V3.25對93個標記進行多態(tài)性統(tǒng)計;以Structure 2.3.1軟件進行群體結構分析,估計最佳群體數(shù)K,其取值范圍為1~10,將參數(shù)iterations設為10 000,burn-in period 設為100 000,每個K值重復運行5次,依據(jù)似然值最大原則選取合適的K值為群體數(shù)目[24]。當K值持續(xù)增大時,參照Evanno等[25]方法計算ΔK,選擇合適的K值,計算Q參數(shù),將其作為協(xié)變量,運用Tassel 2.1軟件一般線性模型(general linear model,GLM),將Q作為協(xié)變量進行回歸分析,混合線性模型(mixed linear model,MLM)采用Q+K方法,分析方法選擇EM,運用蛋白質含量與分子標記數(shù)據(jù),并結合群體結構數(shù)據(jù)進行SSR-蛋白質含量關聯(lián)分析,確定與蛋白質含量相關聯(lián)的位點。
供試的93份大麥材料中,蛋白質含量變化范圍為8.4%~15.8%,西安91-2含量最高(15.8%),其次為EMPRESS(15.4%),而法爾非特的蛋白質含量最低(8.4%);蛋白質含量平均為11.7%,標準差為1.7,變異系數(shù)是14.6%。不同來源大麥材料的蛋白質含量差異程度不同,來源于匈牙利的大麥(5)蛋白質含量較高,平均為12.9%;來源于德國(19)、美國(25)、日本(4)、中國(34)的大麥平均蛋白質含量依次為11.5%、11.7%、11.9%和11.9%,而來源于敘利亞(2)的大麥平均蛋白質含量最低,為10.8%。來源于澳大利亞、波蘭、丹麥和法國的大麥材料均為一份,蛋白質含量依次為12.2%、10.0%、10.4%和12.8%。國內不同省份大麥材料蛋白質含量差異較大,來源于山東的大麥平均蛋白質含量最高,為12.9%,來源于福建、浙江、甘肅和內蒙古的平均蛋白質含量依次為12.6%、12.3%、11.3%和10.6%,來源于北京、湖北、江蘇、山西、陜西和西藏均為1份材料,蛋白質含量依次為13.7%、13.4%、9.0%、11.9%、15.8%和14.3%,來源于國家?guī)斓膬煞萦谰帽4娲篼湶牧掀骄鞍踪|含量為11.2%。
利用93個SSR標記對93份大麥材料進行多態(tài)性分析,共檢測出等位變異406個,變化范圍為2~9,其中,標記Bmac40和Bmag0225的等位變異最多,均為9個,其次是Bmag0872、Bmag603和Bmag0812,均為8個,有8個標記(HVABAIP、HVM54、MGB334、MGB384、Bmac0163、HVM31、GBM1140和GBM1456)的等位變異較少,均為2個。基因多樣性變化范圍為0.021 3~0.862 0,平均為0.575 6;PIC變化范圍為0.021 0~0.648 5,平均為0.521 4,基因多樣性和PIC均以標記Bmac40最高,GBM1140最低(表2)。以PIC≥0.5為高多態(tài)性位點,0.25 表2 93對SSR多態(tài)性統(tǒng)計Table 2 Polymorphic statistics of 93 SSR markers (續(xù)表2 Continued table 2) (續(xù)表2 Continued table 2) 運用多態(tài)性較好的引物對93份大麥材料進行群體結構分析。由圖1A可以看出,隨著K值增大,LnP(D)持續(xù)增大,無明顯拐點,故不能判斷亞群數(shù),需要通過ΔK來進一步確定該群體的亞群數(shù)[25]。由圖1B可以看出,在K=5時出現(xiàn)明顯峰值,供試材料被劃分為5個亞群,分別包含18、23、15、22和15份材料(圖1C)。當某個品種在某亞群中的Q≥0.6時,認為該品種來源較為單一,若小于0.6則認為有混合來源[26]。93材料中,Q<0.6的材料有34份,占總數(shù)的36.56%,表明這34份材料來源背景復雜,而Q>0.6的材料有59份,占總數(shù)的63.44%,表明這些材料來源較為單一。 A:LnP(D)值隨K值變化折線圖;B:ΔK 值隨K值變化折線圖; C:93 份材料分為5個亞群。 運用不同大麥材料的蛋白質含量與93個SSR標記進行關聯(lián)分析,GLM模型檢測結果顯示,所檢測的93個SSR標記中,共檢測到9個與大麥蛋白質含量顯著相關的標記(P<0.05),對表型變異的解釋率在7.49%~14.13%間,分布于染色體3H、4H、5H、6H和7H上,其中,位于染色體5H上的標記GMS061與蛋白質含量極顯著相關(P<0.01),表型變異解釋率為13.98%。MLM模型所檢測到的SSR標記相關性與GLM結果一致,但MLM中關聯(lián)標記的變異解釋率較GLM低,對表型變異的解釋率為7.30%~13.97%,標記GMS061與蛋白質含量的相關也達到極顯著水平,對表型變異的解釋率為13.84%。 表3 與蛋白質含量相關的標記P值及其對表型變異的解釋率Table 3 Significance and explained phenotypic variation of the marker associated with barley protein content 籽粒蛋白質含量是衡量大麥品質的一個重要指標,如優(yōu)級啤麥、一級啤麥和二級啤麥對籽粒蛋白質含量的要求分別是≤12.0%、12.0%~12.5%以及12.5%~13.5%[27]。本研究中,蛋白質含量在9.0%~12.0%之間的材料共51份,占總材料的54.8%,而蛋白質含量在12.0%~12.5%和12.5%~13.5%的分別包含7份和15份,分別占總材料的7.5%和16.1%,其蛋白質含量均符合啤用大麥要求;蛋白質含量大于13.5%的材料共17份,占總材料的18.3%,可食用和飼用。供試大麥蛋白質含量為8.4%~15.8%,平均為11.7%,與許如根等[28]和馬得泉等[29]研究結果不同,這可能與供試大麥材料來源和數(shù)量有關,許如根等[28]僅選用國內7個大麥品種,而本研究大麥材料來源更廣泛;馬得泉等[29]選用的是西藏野生大麥,而西藏野生大麥蛋白質含量較高[30]。大麥籽粒蛋白質含量不僅受基因型控制,還受其他因素影響,如氣象因子、栽培措施和環(huán)境條件等[31],這些因素影響程度的確定還需進行多年多點試驗。 因群體結構能增加染色體間的連鎖不平衡,致使目的性狀與不相關位點表現(xiàn)出關聯(lián),即造成了偽關聯(lián),因此關聯(lián)分析前需要進行群體結構分析,進而減少群體結構對關聯(lián)分析結果的影響,避免人為因素對亞群劃分的影響,通過降低偽關聯(lián)概率提高關聯(lián)分析結果準確性[32-33]。本研究中,經(jīng)群體結構分析,供試材料被劃分為5個亞群,并將Q值作為協(xié)變量納入計算,在一定程度上降低了亞群混合造成的偽關聯(lián)概率[34]。蛋白質含量相關QTL報道較少,只在2H、4H和5H上鑒定到,本研究經(jīng)GLM和MLM模型分析均將9個與蛋白質含量相關的SSR標記定位在3H、4H、5H、6H和7H上,只有標記HVM40與Marquez-Cedillo等[4]結果一致,而其他8個標記與前人研究結果差異較大,需進一步驗證標記的可靠性。本研究中,MLM模型檢測到的關聯(lián)標記對表型變異的解釋率較GLM中檢測到的關聯(lián)標記對表型變異的解釋率低,主要原因可能是MLM模型不僅考慮群體結構Q的影響,還考慮了親緣關系K對關聯(lián)分析的影響,結果比較準確可靠。


2.3 群體結構分析

2.4 SSR標記與蛋白質含量關聯(lián)分析

3 討 論