周慶紅,周燦,鄭偉,付東輝
(1江西農業大學農學院/作物生理生態與遺傳育種教育部重點實驗室,南昌 330045;2江西省紅壤研究所,江西進賢 331717)
甘藍型油菜角果長度全基因組關聯分析
周慶紅1,周燦1,鄭偉2,付東輝1
(1江西農業大學農學院/作物生理生態與遺傳育種教育部重點實驗室,南昌 330045;2江西省紅壤研究所,江西進賢 331717)
【目的】挖掘與油菜角果長度性狀顯著相關的 SNP位點及候選基因,為揭示油菜角果長度性狀的遺傳基礎和分子機制提供理論依據,為油菜產量分子標記輔助選擇育種奠定基礎。【方法】在江西農業大學試驗地和江西省紅壤研究所試驗地 2個環境下考察 300份甘藍型油菜自交系的角果長度性狀,利用簡化基因組測序技術(specific locus amplified fragment sequencing,SLAF-seq)對300份甘藍型油菜自交系基因組DNA進行測序并分析,利用獲得的均勻分布于甘藍型油菜基因組上的201 817個群體SNP(single nucleotide polymorphism,SNP)對角果長度性狀進行全基因組關聯分析(genome-wide association study,GWAS),探測與油菜角果長度顯著相關的SNP位點,并基于群體連鎖不平衡分析結果搜尋顯著SNP位點兩側100 kb范圍內的基因,通過BLAST獲得關聯區域內基因的注釋信息,根據注釋信息找出與性狀相關的候選基因?!窘Y果】農大試驗地角果長度表型變異幅度為46.35—107.07 mm;紅壤所試驗地角果長度表型變異幅度為39.41—101.35 mm,兩性狀在2個環境下均表現出廣泛表型變異。通過一般線性模型(general linear model,GLM)關聯分析,農大環境下共檢測到121個角果長度顯著關聯的SNP位點,分布在A04、A06、A08、A09、C02、C03、C06和C09等8條染色體上,其中,A09染色體上分布最多(83個SNP),紅壤所環境下檢測到22個角果長度顯著關聯的SNP位點,其中,1個在C09染色體上,其余21個均分布于A09染色體,在兩地探測到20個一致性SNP位點;通過混合線性模型(mixed linear model,MLM)分析,農大環境下共檢測到5個角果長度顯著關聯的SNP位點,其中,3個SNP位點與紅壤所環境下檢測到3個SNP位點一致,所有位點均位于A09染色體上。對MLM關聯分析得到的顯著SNP位點兩側100 kb區域內基因進行搜尋并進行功能注釋,發現多個候選基因參與調節碳水化合物的運輸與合成、花器官和種子的發育、信號轉導等, 它們可能通過上述功能影響油菜角果的生長,導致角果長度的差異?!窘Y論】通過GLM和MLM兩種分析方法探測到多個與油菜角果長度性狀顯著關聯的基因位點,并在顯著性位點附近搜尋到相關候選基因。
甘藍型油菜;全基因組關聯分析;角果長度;SNP位點;候選基因
【研究意義】油菜(主要指甘藍型油菜)是中國重要的油料作物。目前,菜籽油消費約占中國食用植物油總消費量的35%,但中國食用植物油60%以上卻依賴進口[1],油菜產量的高低直接影響中國食用植物油的供給,因此,如何提高油菜產量一直是油菜育種和栽培最重要的目標。角果長度是油菜籽粒產量的重要決定因素和育種目標性狀,明確其遺傳基礎對油菜產量提升具有重要意義?!厩叭搜芯窟M展】角果對油菜產量形成起重要決定作用,它不僅是油菜吸收和積累葉片制造的光合產物的庫器官,而且還是為種子發育提供營養的源器官[2]。在種子發育后期,油菜功能葉面積快速減少,綠色角果的光合作用成為種子發育所需營養的主要來源[3]。另外,角果細胞壁還會傳送信號來調節油菜籽粒的填充速率及營養物質的再分配[4]。一般來說,較長角果相對較短角果來說,會產生更多和更大的種子[5],通過特長角果油菜品種培育可以提高油菜的產量潛力[6]。在油菜高產育種中角果長度常被作為產量相關性狀進行考察[7]。油菜的角果長度是受多基因控制的數量性狀,前人采用雙親作圖群體對角果長度性狀進行了QTL定位研究,鑒定出多個控制角果長度性狀變異的QTL,目前已在甘藍型油菜 15條染色體上探測到 30個以上角果長度QTL,解釋的表型貢獻率從5.5%—53.4%不等[8-10]。但由于傳統QTL定位方法需要構建專門的作圖群體,檢測到的等位基因位點僅來源于雙親材料,檢測到的基因位點數目偏少,因此應用較為有限?!颈狙芯壳腥朦c】全基因組關聯分析(genome-wide association study,GWAS)是利用自然群體探測物種的遺傳變異,進而挖掘與復雜農藝性狀相關的遺傳位點的研究方法,具有不需構建作圖群體和一次性可同時檢測多個等位基因位點的優勢,近年來已在水稻、玉米、小麥、大麥、擬南芥等作物中均有廣泛研究[11]。近幾年許多學者利用新開發的蕓薹屬60K SNP(single nucleotide polymorphism)芯片技術,對油菜籽粒產量及品質相關性狀開展了全基因組關聯分析研究,獲得了較多新的控制油菜相關性狀的基因位點[12-15]。而隨著甘藍型油菜基因組測序的完成[16],利用高通量數據對油菜復雜性狀開展 GWAS研究越來越便利,SLAF-seq(specific-locus amplified fragment sequencing)技術作為一種新發展的簡化基因組測序技術,通過限制性內切酶消化基因組 DNA,選取一定長度的片段進行測序,降低了基因組的復雜度,并且不依賴基因組序列,一次測序可以獲得數以百萬計的SNP[17],另外,與芯片相比,高通量測序可以檢測基因組上未知變異位點中新的SNP,因而,采用SLAF-seq技術開發SNP并用于全基因組關聯分析有望探測到較多 SNP位點和候選基因。【擬解決的關鍵問題】本研究以來源廣泛的300份甘藍型油菜自交系為關聯分析研究群體,并采用前期基于SLAF-seq技術開發的201 817個SNP標記對甘藍型油菜角果長度性狀進行全基因組關聯分析,旨在挖掘與之顯著相關的SNP位點及候選基因,為油菜產量分子標記輔助選擇育種和油菜產量性狀遺傳調控提供理論依據。
1.1 試驗材料
以300份具有獨立來源的甘藍型油菜自交系為材料,所有材料均由江西農業大學作物生理生態與遺傳育種教育部重點實驗室提供。
1.2 田間試驗和數據統計
2014年9月28日,將300份甘藍型油菜自交系分別同時播種于江西農業大學農學試驗田(簡稱JXAU)和江西省紅壤研究所油菜試驗田(簡稱JXIRS),隨機區組設計,每份材料種植一個小區,每個小區種植3行,行距40 cm,株距20 cm,條播,于5—7葉期定苗,兩地各2個重復。田間管理同常規生產,確保同一地區所有材料的生長環境一致。待成熟時,每小區取十株長勢一致的植株,每株選取主花序中部的20個角果進行角果長度測量[18]。利用Excel和 DPS統計分析軟件對所得性狀的測定值進行統計分析,包括計算每個表型性狀的平均值、標準差、變異系數等。
1.3 基因型測序分型
利用簡化基因組測序技術(specific locus amplified fragment sequencing,SLAF-seq)對300份甘藍型油菜自交系基因組DNA進行測序并分析。具體做法是以公開的甘藍型油菜品種“Darmor-Bzh”的基因組測序信息為參考[16],進行電子酶切預測,根據酶切方案選擇原則確定以RsaⅠ+HaeⅢ進行酶切,篩選酶切片段長度在 314—414 bp的序列并定義為SLAF標簽,結合通過生物信息學分析,共獲得529 080個SLAF標簽,其中多態性的SLAF標簽共有238 711個,由此得到1 197 282個群體SNP。再根據次等位基因頻率(minor allele frequency,MAF)>0.05和完整度(即非N的SNP位點數占總SNP位點的比例)>0.8對SNP進行篩選,最終得到均勻分布于甘藍型油菜19條染色體上的201 817個高質量且位置唯一的群體SNP用于后續分析(數據在另文中待發表)。
1.4 連鎖不平衡分析
通過在同一個染色體的SNP組合,分析SNP在所有樣品中的連鎖情況和LD衰退距離,其連鎖強度以D′或r2表示,采用PLINK2軟件(http://www.coggenomics.org/plink2/)分析所有材料的連鎖不平衡和LD衰退情況。依據PURCELL等[19]報道,參數設定為:MAF>0.05,r2,ld-window 999999,ld-window-r20。本研究選用r2等于0.1的數據作為連鎖不平衡的衰減(LD decay)的數值[20]。
1.5 角果長度性狀全基因組關聯分析
基于前期DNA測序開發的201 817個群體SNP,利用TASSEL軟件[21]的GLM模型和MLM模型得到與2個性狀的關聯值,通過SPAGeDi[22]軟件計算樣品間親緣關系K,通過 admixture軟件[23]計算樣品群體結構Q,一般線性模型使用Q群體結構信息,而混合線性模型使用Q+K即群體結構和親緣關系的信息。基于公式(Y=Xα+Qβ+Kμ+e)(X為基因型,Y為表型),計算最終每個 SNP位點所對應的關聯值 P。利用GGplot2軟件[24]做出 Quantile-Quantile散點圖(Q-Q plot),利用QQman繪制曼哈頓(Manhattan)圖[25],用Manhattan圖來顯示關聯分析后每個位點的顯著性,其中,Manhattan圖顯著關聯SNP閾值取為0.1/SNP總數目的負對數,本試驗計算結果約等于6.2,極顯著位點閾值為多重假設檢驗(FDR檢驗)的顯著性閾值。
1.6 候選基因預測
將與角果長度性狀緊密連鎖的SNP位點,根據序列位置將其定位到油菜基因組參考物理圖譜上[16]?;谌后w連鎖不平衡分析結果確定搜尋每個 SNP位點兩側100 kb范圍內的基因,利用BLAST軟件將關聯區域內基因分別與NR、SwissProt、GO、COG、KEGG數據庫比對,獲得關聯區域內基因的注釋信息,根據注釋信息找出與性狀相關的候選基因。
2.1 甘藍型油菜角果長度性狀表型統計及方差分析
從表1中可以看出,農大試驗地中所有材料的平均角果長度為70.72 mm,變異幅度在46.35—107.07 mm,變異系數為 16.47%,正態性檢驗結果為W=0.946329,P=0.000001,所有材料的表型值在農大試驗地表現出極顯著差異。紅壤所試驗地中平均角果長度為67.60 mm,變異幅度在39.41—101.35 mm,變異系數為17.41%,正態性檢驗結果為W=0.987718,P=0.011974,材料表型值在紅壤所試驗地差異顯著,頻次分布圖具有顯著的正態分布特征(圖 1),表明角果長度性狀為典型的數量性狀,采用GWAS分析方法可有效進行該性狀的基因定位。
兩地試驗的方差分析結果顯示(表 2),角果長度性狀在300份基因型材料中表現出極顯著差異,基因型方差所占總表型方差比例為13.70%,角果長度性狀在兩地的平均遺傳力為0.6057,材料間的遺傳差異較大;角果長度性狀在2個試驗地環境下表現出極顯著差異,環境效應方差占總表型方差比例為83.92%,說明環境因素對甘藍型油菜角果長度性狀具有重要影響。另外,該性狀基因型與環境互作方差同樣達到極顯著差異,但角果長度性狀在區組(重復)間差異未達到顯著水平。

表1 油菜角果長度性狀統計分析Table 1 Statistical analysis of silique length traits of rapeseed

圖1 油菜角果長度性狀頻次分布Fig. 1 Frequency distribution of silique length of B. napus

表2 兩地試驗角果長度性狀的方差分析Table 2 Variance analysis of silique length in two places
2.2 甘藍型油菜角果長度性狀全基因組關聯分析

圖2 GLM和MLM兩種模型下角果長度性狀GWAS Q-Q Plot圖Fig. 2 Quantile-quantile plots of estimated-lg (P) from association analysis of silique length using two models with GLM and MLM
通過GLM模型對角果長度性狀進行全基因組關聯分析(圖2、圖3,表3和表4),在農大試驗地中共探測到121個顯著相關的SNP位點,其中,包括66個為極顯著相關SNP位點(P<4.96E-08)和55個顯著相關 SNP位點(P<4.96E-07),在 A04、A06、A08、A09、C02、C03、C06和C09等8條染色體均有分布,其中A09染色體上分布最多(83個)。在紅壤所試驗地共探測到22個顯著相關的SNP位點,包括12個極顯著和10個顯著相關的SNP位點,其中,1個在C09染色體上,其余21個SNP均分布于A09染色體,通過 GLM方法在兩試驗地探測到 20個一致性SNP位點。
從表圖3和5可以看出,通過MLM模型在農大試驗地中共找到5個顯著相關的SNP位點,其中包括4個極顯著(P<4.96E-08)和1個顯著(P<4.96E-07)相關的SNP位點,單個SNP解釋的表型貢獻率(R2)的變異為 0.1153—0.1377,最小等位基因頻率變異范圍為0.2266—0.2992。紅壤所試驗地中共找到3個顯著相關的SNP位點(P<4.96E-07),這三個位點與農大試驗地試驗結果一致,單個SNP解釋的表型貢獻率(R2)的變異為0.1020—0.1037。且所有位點均都位于A09染色體上。
通過GLM和MLM兩種模型對甘藍型油菜角果長度性狀進行全基因組關聯分析比較結果表明,GLM關聯分析模型在多條染色體上探測到顯著性 SNP位點,且多數分布在A09染色體上;而MLM關聯分析模型由于綜合考慮了群體結構和親緣關系2個方面,因此檢測到的位點較少,且全部分布在 A09染色體上,說明 A09染色體上很有可能主要分布有控制油菜角果長度的等位基因位點及候選基因。
2.3 LD分析及候選基因挖掘
利用全基因組獲得的201 817個SNP標記對300份甘藍型油菜自交系品種的 LD進行分析,得到LD-decay衰減曲線(圖4),從A和C亞基因組各條染色體LD衰退曲線可以看出(圖4-a和圖4-b),在r2=0.1時,A05染色體衰退最快,衰退距離為1.5 kb,而A01、A04、A06衰退也較快,衰退距離均小于50 kb。在C亞基因組中,C09衰退最快,r2=0.1時衰退距離為4.5 kb,其余染色體衰退較慢。

圖3 角果長度性狀全基因組關聯分析Manhattan圖Fig. 3 Manhattan of GWAS for silique length of B. napus

表3 農大試驗地角果長度顯著關聯SNP位點(GLM)Table 3 SNPs associated with silique length in JXAU (GLM)

續表3 Continued table 3

表4 紅壤所試驗地角果長度顯著關聯SNP位點(MLM)Table 4 SNPs associated with silique length in JXIRS (MLM)

表5 角果長度顯著關聯SNP位點(MLM)Table 5 SNPs associated with silique length (MLM)

圖4 甘藍型油菜A和C基因組不同染色體的LD衰減Fig. 4 LD decay of different chromosomes for A and C subgenomes in B. napus
采用GLM和MLM兩種方法均在A09染色體上找到與油菜角果長度顯著關聯的SNP位點,因此,對A09位點兩側進行角果長度候選基因預測較為可靠,通過LD分析表明,A09染色體的LD衰退距離為95.02 kb,所以本試驗確定對顯著關聯SNP位點兩側100 kb進行基因搜尋并進行功能注釋。
在甘藍型油菜A09染色體的Bn-A09-p27767046、Bn-A09-p27948857和Bn-A09-p28156822 3個SNP標記位點附近共搜尋到125個基因,Bn-A09-p27767046位點附近有搜尋到41個基因,在Bn-A09-p27948857位點附近搜尋到28個基因,在Bn-A09-p28156822位點附近搜尋到56個候選基因(具體數據未列出)。對上述基因進行基于油菜候選基因序列及擬南芥同源基因的功能預測,結果表明,在上述候選基因中存在40個與碳水化合物的運輸及合成、細胞伸長與分裂、花粉管伸長、花器官發育、種子發育、信號轉導、脅迫響應等重要的生理過程相關的基因(部分結果見表6)。它們可能通過上述功能影響油菜花序或角果的發育,導致角果長度的差異。
油菜籽粒直接由種子數目、大小和重量構成,這些種子構成要素都和角果長度直接相關。甘藍型油菜角果長度與每角果粒數和粒重顯著相關[26-27],LIU等[28]研究表明角果長度主要通過調控光合產物的積累來影響油菜粒重。隨著DNA分子標記技術的發展,自20世紀90年代以來,已有眾多研究人員陸續開展油菜角果長度的QTL定位研究,如CHEN等[29]利用甘藍型油菜雜交組合Quantum×No.2717-17的DH和F2群體進行產量及其構成因子QTL定位,共在A01、A09、A10、C01、C02、C05和C07染色體上找到11個與角果長度性狀顯著關聯的QTL。袁澤俊等[30]對油菜角果長度進行了QTL定位和遺傳分析,結果在A09染色體上檢測到4個與角果長度相關的QTL。ZHANG等[31]利用甘藍型油菜品系Y106與HZ396為親本構建了DH群體,通過QTL元分析共檢測到6個QTL與角果長度有關,但在A09染色體上未發現與角果長度有關的QTL。而YANG等[9]通過兩年的田間試驗在186個油菜重組自交系(RIL)的作圖群體中A09染色體上探測到10個角果長度QTL,其中一個主效QTL解釋表型變異率為53.4%,另外在A01、C02、C03和C04染色體上也發現存在角果長度QTL。漆麗萍[10]檢測到11個與角果長度性狀相關的QTL,分別分布在A01、A07、A09和A10染色體上。本研究對300份甘藍型油菜的角果長度性狀進行全基因組關聯分析,通過GLM 模型在農大環境下挖掘了與油菜角果長度顯著關聯的SNP位點121個,在紅壤所試驗地環境下找到22個,在 A04、A06、A08、A09、C02、C03、C06和C09等8條染色體均有分布,其中A09染色體上分布較為集中,與上述研究比較,本研究找到的角果長度性狀關聯的SNP位點數較多。而通過MLM模型在2個環境下都僅在A09染色體上找到與角果長度顯著關聯的SNP位點,以往研究也多在A09染色體上有類似發現,這表明A09染色體上確實存在控制油菜角果長度的基因位點。

表6 角果長度顯著關聯SNP標記區間候選基因Table 6 candidate genes related with silique length in the intervals of significant association SNP markers
關于調控角果長度的候選基因方面的研究較少,LIU等[28]在A09染色體的p33066395位點附近發現控制角果長度的Auxin-response factor 18(ARF18),并進一步通過轉錄組分析發現該基因可以在角果壁中通過調控植物激素合成來控制角果細胞壁的生長。本研究通過對A09染色體上角果長度顯著關聯的SNP位點兩側的基因進行搜尋,通過位置比較分析,檢測到多個與ARF18不同的新的角果長度相關的候選基因。如候選基因GSBRNA2T00049485001,其擬南芥的同源基因為 CP12-2,與碳水化合物合成代謝有關[32]。而GSBRNA2T00092005001候選基因與花粉管伸長有關,其擬南芥同源基因為SYP73(Syntaxin of plants 73)[33]。而候選基因GSBRNA2T00006774001通過與玉米基因組比對發現為一類伸展蛋白相關的基因,它是細胞壁中的主要結構蛋白,對植物的形態及正常生長發育都具有重要作用[34]。GSBRNA2T00049416001是與器官發育有關的基因,屬于F-box蛋白家族,是植物泛素酶體的重要組成部分,通過泛素化途徑參與到多種細胞通路,比如花器官發育、信號轉導、脅迫響應等重要的生理過程[35]。GSBRNA2T00049503001候選基因的同源基因為ARR20,能夠促進植物種子的發育[36]。上述基因是否對角果長度起作用還有待于進一步功能驗證。
采用GLM模型分析在南昌和進賢兩環境下分別探測到121和22個與油菜角果長度顯著關聯的SNP位點,兩地檢測到的相同SNP位點為20個。采用MLM模型分析在兩地分別探測到5個和3個SNP位點,其中3個SNP位點兩地一致。所有兩地一致性SNP位點均都位于A09染色體上,基于LD分析結果對A09染色體上顯著性SNP位點兩側100 kb區域內基因進行搜尋并進行功能注釋,發現多個候選基因參與調節碳水化合物的運輸與合成、花器官和種子的發育、信號轉導等過程, 它們可能通過上述功能影響油菜角果的生長,導致角果長度的差異。
[1] 張永霞, 趙鋒, 張紅玲. 中國油菜產業發展現狀、問題及對策分析.世界農業, 2015, 4: 96-99, 203-204. ZHANG Y X, ZHAO F, ZHANG H L. The current situation, problem and solutions of China’s rape industry. World Agriculture, 2015, 4: 96-99, 203-204. (in Chinese)
[2] BENNETT E J, ROBERTSs J A, WAGSTAFF C. The role of the pod in seed development: Strategies for manipulating yield. New Phytologist, 2011, 190(4): 838-853.
[3] KING S P, LUNN J E, FURBANK R T. Carbohydrate content and enzyme metabolism in developing canola siliques. Plant Physiology, 1997, 114(1): 153-160.
[4] 丁秀琦. 白菜型春油菜角果和種子性狀研究. 中國油料, 1996, 18(4): 28-30. DING X Q. Study on characters of silique and seed in spring rape (Brassica campestris). Oil Crops of China, 1996, 18(4): 28-30. (in Chinese)
[5] ?ZER H, ORAL E. Relationships between yield and yield components on currently improved spring rapeseed cultivars. Turkish Journal of Agriculture and Forestry, 1999, 23(6): 603-608.
[6] 國審長角果大粒型高產雙低油菜華雙 4號. 農村實用技術與信息, 2006(4): 37. National registered long-pod, large-grain, high-yield rape cultivar‘Huashuang 4’ with double low content. Rural Practical Technology and Information, 2006(4): 37. (in Chinese)
[7] AYTAC Z, KINACI G. Genetic variability and association studies of some quantitative characters in winter rapeseed (Brassica napus L.). African Journal of Biotechnology, 2009, 8(15): 3547-3554.
[8] ZHANG L, YANG G, LIU P, HONG D, LI S, HE Q. Genetic and correlation analysis of silique-traits in Brassica napus L. by quantitative trait locus mapping. Theoretical and Applied Genetics, 2011, 122(1): 21-31.
[9] YANG P, SHU C, CHEN L, XU J, WU J, LIU K. Identification of a major QTL for silique length and seed weight in oilseed rape (Brassica napus L.). Theoretical and Applied Genetics, 2012, 125(2): 285-296.
[10] 漆麗萍. 甘藍型油菜株型與角果相關性狀的 QTL分析[D]. 武漢:華中農業大學, 2014. QI L P. QTL analysis for the traits associated with plant architecture and silique in Brassica napus L.[D]. Wuhan: Huazhong Agricultural University, 2014. (in Chinese)
[11] HUANG X, HAN B. Natural variations and genome-wide association studies in crop plants. Annual Review of Plant Biology, 2014, 65: 531-551.
[12] LI F, CHEN B, XU K, GAO G, YAN G, QIAO J, LI J, LI H, LI L, XIAO X. A genome-wide association study of plant height and primary branch number in rapeseed (Brassica napus). Plant Science, 2016, 242: 169-177.
[13] LUO X, MA C, YUE Y, HU K, LI Y, DUAN Z, WU M, TU J, SHEN J, YI B, FU T. Unravelling the complex trait of harvest index in rapeseed (Brassica napus L.) with association mapping. BMC Genomics, 2015, 16: 379-388.
[14] LI F, CHEN B, XU K, WU J, SONG W, BANCROFT I, HARPER A L, TRICK M, LIU S, GAO G, WANG N, YAN G, QIAO J, LI J, LI H, XIAO X, ZHANG T, WU X. Genome-wide association study dissects the genetic architecture of seed weight and seed quality in rapeseed (Brassica napus L.). DNA Research, 2014, 21(4): 355-367.
[15] HATZIG S V, FRISCH M, BREUER F, NESI N, DUCOURNAU S, WAGNER M H, LECKBAND G, ABBADI A, SNOWDON R J. Genome-wide association mapping unravels the genetic control of seed germination and vigor in Brassica napus. Front Plant Science, 2015, 6: 221-233.
[16] CHALHOUB B, DENOEUD F, LIU S, PARKIN I A, TANG H, WANG X, CHIQUET J, BELCRAM H, TONG C, SAMANS B, CORREA M, DA SILVA C, JUST J, FALENTIA C, KOH C S, LE CLAINCHE I, BERNARD M, BENTO P, NOEL B, LABADIE K, ALBERTI A, CHARLES M, ARNAUD D, GUO H, DAVIAUD C, ALANERY S, JABBARI K, ZHAO M, EDGER P P, CHELAIFA H, TACK D, LASSLLE G, MESTIRI I, SCHNEL N, LE PASLIER M C, FAN G, RENAULT V, BAYER P E, GOLICZ A A, MANOLI S, LEE T H, THI V H, CHALABI S, HU Q, FAN C, TOLLENAERE R, LU Y, BATTAIL C, SHEN J, SIDEBOTTOM C H, WANG X, CANAGUIER A, CHAUVEAU A, BERARD A, DENIOT G, GUAN M, LIU Z, SUN F, LIM Y P, LYONS E, TOWN D, BANCROFT I, WANG X, MENG J L, MA J, PIRES J C, KING G J, BRUNEL D, DELOURME R, RENARD M, AURY J M, AADAMS K L, BATLEY J, SNOWDON R J, TOST J, EDWARDS D, ZHOU Y, HUA W, SHARP A G, PATERSON A H, GUAN C, WINCKER P. Early allopolyploid evolution in the post-Neolithic Brassica napusoilseed genome. Science, 2014, 345(6199): 950-953.
[17] SUN X, LIU D, ZHANG X F, LI W B, LIU H, HONG W G, JIANG C B, GUAN N, MA C X, ZENG H P, XU C H, SONG J, HUANG L, ZHENG H K. SLAF-seq: An efficient method of large-scale De novo SNP discovery and genotyping using high-throughput sequencing. PloS ONE, 2013, 8(3): e58700.
[18] 陸光遠, 伍曉明, 陳碧云. 油菜種質資源描述規范和數據標準. 北京: 中國農業出版社, 2007. LU G Y, WU X M, CHEN B Y. Descriptors and Data Standard for Rapeseed (Brassica spp.). Beijing: China Agriculture Press, 2007. (in Chinese)
[19] PURCELL S, NEALE B, TODD-BROWN K, THOMAS L, FERREIRA M, BENDER D, MALLER J, SKLAR P, de BAKKER P, DALY M J, SHAM P C. PLINK: A tool set for wholegenome association and population-based linkage analyses. The American Journal of Human Genetics, 2007, 81(3): 559-575.
[20] ZONDERVAN K T, CARDON L R. The complex interplay among factors that influence allelic association. Nature Reviews Genetics, 2004(2): 89-100.
[21] BRADBURY P J, ZHANG Z, KROON D E, CASSTEVENS T M, RAMDOSS Y, BUCKLER E S. TASSEL: Software for association mapping of complex traits in diverse samples. Bioinformatics, 2007, 23(19): 2633-2635.
[22] HARDY O J, VEKEMANS X. SPAGeDi: A versatile computer program to analyze spatial genetic structure at the individual or population levels. Molecular Ecology Notes, 2002, 2(4): 618-620.
[23] ALEXANDER D H, NOVEMBRE J, LANGE K. Fast model-based estimation of ancestry in unrelated individuals. Genome Research, 2009, 19(9): 1655-1664.
[24] GINESTET C. ggplot2: Elegant graphics for data analysis. Journal of the Royal Statistical Society: Series A, 2011, 174(1): 245-246.
[25] TURNER S D. qqman: An R package for visualizing GWAS results using QQ and manhattan plots. BioRxiv, 2014: 005165.
[26] CHAY P, THURLING N. Identification of genes controlling pod length in spring rapeseed, Brassica napus L., and their utilization for yield improvement. Plant Breeding, 1989, 103(1): 54-62.
[27] DIEPENBROCK W. Yield analysis of winter oilseed rape (Brassica napus L.): A review. Field Crops Research, 2000, 67(1): 35-49.
[28] LIU J, HUA W, HU Z, YANG H L, ZHANG L, LI R J, DENG L B, SUN X C, WANG X F, WANG H Z. Natural variation in ARF18 gene simultaneously affects seed weight and silique length in polyploid rapeseed. Proceedings of the National Academy of Sciences of the USA, 2015, 112(37): E5123-E5132.
[29] CHEN W, ZHANG Y, LIU X, CHEN B, TU J X, FU T D. Detection of QTL for six yield-related traits in oilseed rape (Brassica napus) using DH and immortalized F2populations. Theoretical and Applied Genetics, 2007, 115(6): 849-858.
[30] 袁澤俊. 油菜A9染色體角果長和千粒重主效QTL的驗證[D]. 武漢: 華中農業大學, 2013. YUAN Z J. Confirmation of the major QTL for silique length and seed weight on chromosome A9 of Brassica napus [D]. Wuhan: Huazhong Agricultural University, 2013. (in Chinese)
[31] ZHANG L, LI S, CHEN L, YANG G. Identification and mapping of a major dominant quantitative trait locus controlling seeds per silique as a single Mendelian factor in Brassica napus L.. Theoretical and Applied Genetics, 2012, 125(4): 695-705.
[32] FERMANI S, TRIVELLI X, SPARLA F, THUMIGER A, CALVARESI M, MARRI L, TROST P. Conformational selection and folding-upon-binding of intrinsically disordered protein CP12 regulate photosynthetic enzymes assembly. Journal of Biological Chemistry, 2012, 287(25): 21372-21383.
[33] WANG Y, ZHANG W Z, SONG L F, ZOU J J, SU Z, Wu W H. Transcriptome analyses show changes in gene expression to accompany pollen germination and tube growth in Arabidopsis. Plant Physiology, 2008, 148(3): 1201-1211.
[34] STIEFEL V, RUIE-AVILA L, RAZ R, VALLES M P, GOMEZ J, PAGES M, NELSON T. Expression of a maize cell wall hydroxyprolinerich glycoprotein gene in early leaf and root vascular differentiation. The Plant Cell, 1990, 2(8): 785-793.
[35] GONZALEZ, Z H, ROMPA U, PETERS J L, BHATT A M, WAGSTAFF C, STEAD A D, ROBERTS J A. HAWAIIAN SKIRT: An F-box gene that regulates organ fusion and growth in Arabidopsis. Plant Physiology, 2007, 144(3): 1370-1382.
[36] LI H, XU T, LIN D, WEN M, XIE M, DUCLERCQ J, BENKOVA E. Cytokinin signaling regulates pavement cell morphogenesis in Arabidopsis. Cell Research, 2013, 23(2): 290-299.
(責任編輯 李莉)
Genome Wide Association Analysis of Silique Length in Brassica napus L.
ZHOU QingHong1, ZHOU Can1, ZHENG Wei2, FU DongHui1
(1College of Agronomy, Jiangxi Agricultural University/The Key Laboratory of Crop Physiology, Ecology and Genetic Breeding, Ministry of Education, Nanchang 330045;2Jiangxi Institute of Red Soil, Jinxian 331717, Jiangxi)
【Objective】The objective of this study is to detect the SNP loci and determine related candidate genes affecting the silique length of B. napus significantly to reveal its genetic basis and molecular mechanism, and lay a foundation for the marker assisted selection in high yield breeding of B. napus. 【Method】In this study, the phenotype of silique length was investigated at two environments (JXAU of Nanchang and JXIRS of Jinxian) with 300 accessions of B. napus, combining with the 201,817 SNPs developed from specific locus amplified fragment sequencing (SLAF-seq) technology, the genome-wide association analysis wasproceeded to detect the SNP loci affecting the silique length significantly, and the regions were scanned with 100 kb apart from the loci of SNP associated dramatically with silique length based on linkage disequilibrium analysis, and finally the candidate genes were predicted with relation to silique length by BLAST analysis.【Result】The variation ranges of silique length in the two places were 46.35-107.07 mm and 39.41-101.35 mm, respectively, which both showed extensive phenotypic variation in two environments. In addition, a total of 121 SNP loci in JXAU correlatively with silique length were excavated by general linear model (GLM), which distributed on A04, A06, A08, A09, C02, C03, C06 and C09 chromosomes, and the largest number of SNPs (83) was on A09 chromosome. Otherwise, 22 SNPs in JXIRS with 1 on C09 and 21 on A09 were detected, and there were 20 consensus SNPs under two environments. Besides, 5 SNPs in JXAU and 3 SNPs (P<4.96E-07) in JXIRS all distributed on A09 chromosome were detected respectively using the mixed linear model (MLM), three of which were consistent in two environments. There were 40 candidate genes screened in the candidate regions with 100 kb apart from the positions of SNPs associated significantly with silique length, functional analyses showed that these genes involved in regulation of carbohydrate transportation and synthesis, flower and seed development, signal transduction and etc., which might result in the variation of silique length through affecting the growth and development of silique in B. napus. 【Conclusion】The SNP loci and candidate genes related closely with silique length of B. napus were detected in this study, thus providing a theoretical basis for the seed yield regulatory network of B. napus and molecular assisted selection of high-yield breeding of rapeseed.
Brassica napus; Genome-wide association study; silique length; SNP locus; candidate gene
2016-07-19;接受日期:2016-10-17
國家自然科學基金(31360342)
聯系方式:周慶紅,E-mail:qinghongzhou@126.com。通信作者付東輝,E-mail:fudhui@163.com