王竹林 劉曙東 奚亞軍
摘要 以分子標記技術為基礎的作物數量性狀基因(QTL)的研究成為目前作物遺傳育種研究的熱點。QTL定位的基本原理是分析標記基因型和數量性狀值之間的連鎖關系。進行QTL定位通常需要適當的分離群體,群體的表型數據,群體的基于分子標記的基因型數據,然后統計分析所有的標記基因型和表型的關系,從而在全基因組上確定所有可能的數量性狀在染色體上的位置及效應。QTL分析軟件winQTLCart2.0使用程序包括:數據準備、軟件運行、基因(QTL)定位和分析、制圖。QTL定位分析的新方法關聯分析利用不同基因座等位變異(基因)間的連鎖不平衡關系,進行標記與性狀的相關性分析,以達到鑒定特定目標性狀基因(或染色體區段)的目的,關聯分析大大提高了目標性狀基因或者相關QTL的挖掘和定位。
關鍵詞 QTL;定位;winQTLCart2.0;關聯分析
中圖分類號 S188;Q-31 文獻標識碼 A 文章編號 0517-6611(2014)31-10858-03
Program of winQTLCart2.0 and New Method of QTL Analysis—Correlation Analysis
WANG Zhulin, LIU Shudong, XI Yajun
(Agronomy College, Northwest A&F University, Yangling, Shaanxi 712100)
Abstract The research of crop quantitative trait locus(QTL) based on molecular markers become a hot topic in the study of genetic breeding of crops. The principle of QTL location is analysis of chain relation between marker genotypes and value of quantitative traits. QTL positioning usually needs appropriate separation populations, phenotypic data of group, and genotype data based on the molecular markers of group. As to confirm the position and effect of all possible QTL on chromosomes in the genome, statistical analysis of genotype and phenotype will be done. Software winQTLCart2.0 always be used in QTL analysis. The program includes data preparation and the software running, gene(QTL) positioning and analysis, drawing. Association analysis which is a new method of QTL location can be used to identification of QTL or chromosome segments of specific traits using correlation analysis based on different loci alleles (genes) linkage disequilibrium between the marker and the trait. Association analysis can greatly improve the mining and locate the target character gene or QTL.
Key words QTL; Positioning; winQTLCart2.0; Correlation analysis
作物的許多農藝性狀如產量、品質、抗逆性等都是數量性狀,由微效多基因控制,這些基因稱為數量性狀基因(Quantitative Trait Locus,QTL)。傳統的數量遺傳學把這些微效多基因作為一個整體,用統計學方法分析其總的遺傳效應,無法把微效多基因分解為一個個孟德爾因子[1]。分子標記技術的出現和發展為高密度的遺傳連鎖圖譜的構建提供了基礎,成為作物各種農藝性狀基因分析和定位的重要手段,以分子標記為基礎的QTL研究是目前作物遺傳育種研究的熱點[2]。自PATERSON等[3]首次應用RFLP連鎖圖在番茄中定位QTL之后,國際和國內已有大量的關于QTL研究的報道。QTL研究在分子標記、作圖群體和統計分析方法等方面都取得了極大的進展。QTL 定位工作現已成為數量性狀遺傳研究的一種標準程序。QTL研究從一個生育階段的靜態定位發展到全生育期的動態定位,從常規可見的表型發展到生理指標甚至基因的表達水平[1]。利用分子標記進行遺傳連鎖分析,可將QTL定位,并借助與QTL連鎖的分子標記,提高作物育種中對數量性狀優良基因型選擇的準確性。更為重要的是越來越多的作物包括番茄、水稻、小麥等許多重要性狀QTL被分離克隆。筆者介紹QTL分析的原理、軟件和最新進展。
1 QTL分析原理、方法和軟件
QTL定位的基本原理是分析整個染色體組的標記基因型和數量性狀值之間的連鎖[4]。QTL定位工作的基本要素包括合適的分離群體,分子標記連鎖圖以及合適的統計模型與分析方法。QTL定位的一般步驟包括:選擇具有目標相對性狀的純系雜交獲得作圖群體;用大量分子標記檢測分離群體,獲得分離群體中每一個體的標記基因型;分析群體標記基因型,構建該群體的遺傳連鎖圖;檢測分離世代群體中每一個體的數量性狀值;在獲得了遺傳連鎖圖和分離世代群體中每一個體的數量性狀值之后,需要分析標記基因型和數量性狀值的關系,確定QTL在染色體上的相對位置。QTL定位的分析方法有方差分析法、區間作圖法、復合區間作圖、基于最小二乘的復合區間作圖和基于混合線形模型的復合區間作圖等[2,4]。由于對大量數據進行分析和處理的復雜性,所以必須借助計算機軟件才能完成。QTL分析常見軟件有QTLnetwork、PLABQTL、MAPMAKER /QTL1.1 、QGene 2.29、QTLMapper2.0和winQTLCart2.0等[1]。
2 QTL分析方法winQTLCart2.0使用程序
2.1 數據準備
準備6個文本數據文件:Chromosome label(連鎖群的名稱),mark number(每個連鎖群上的標記的數目),Mark labels(標記名稱),Mark positions(標記之間的距離),Mark genetype(標記基因型),Trait value(性狀值),標記基因型從原來的橫排轉置成豎排,標記順序按照染色體的順序。
2.2 運行軟件
winQTLCart2.0軟件運行時間較長,在運算時不可運行其他大型程序,否則可能引起死機。
打開winQTLCart2.0,點擊“new”,出現Step 1 of 2對話框,在里面填上相應數據,如該試驗連鎖群(Cromosome number)為“20”,性狀(Trait)為“1”,單株數(Individual number)為“218”,群體(Crossing type)為“SF2”。單株的標記帶型記錄:“AA”記為“A”,表示該單株包含親本A的純合等位基因。“aa”記為“B”,表示該單株包含來自親本a的純合等位基因。“Aa”記為“H”,表示該單株是同時攜帶A和a 2個等位基因的雜合體。“a_”記為“C” 表示該單株是A的等位基因的非純合體(要么是aa基因型,要么是Aa基因型)。“A_”記為“D” 表示該單株是a的等位基因的非純合體(要么是AA基因型,要么是Aa基因型)。“—”表示某單株的數據在該位點缺失(圖1)。
3 QTL分析新方法—關聯分析
3.1 關聯分析在QTL分析中的應用
關聯分析(Association analysis)又稱連鎖不平衡作圖(LD mapping)或關聯作圖(Association mapping),是利用不同基因座等位變異(基因)間的連鎖不平衡關系,進行標記與性狀的相關性分析,以達到鑒定特定目標性狀基因(或染色體區段)的目的[5]。與傳統的連鎖分析相比,關聯分析具有如下優勢:①作圖定位更精確。關聯分析利用的是自然群體在長期進化中所積累的重組信息,具有較高的解析率,可實現數量性狀基因(位點)的精細定位,甚至直接定位到基因本身;②可同時考察一個基因座的多個等位基因。關聯分析可實現對其作圖群體(自然群體)一個基因座上所有等位基因的考察;③不需構建作圖群體。關聯分析利用的群體是自然群體,不需再人工構建,省時省力,并有較多的群體可供利用。④可發現較連鎖分析更多的QTL位點。鑒于關聯分析本身存在的優勢,目前已廣泛應用于多種作物不同生物特性的研究,如玉米籽粒油分的生物合成[6]、水稻的開花時間和籽粒產量[7]和小麥的籽粒大小和研磨品質[8]等。MACCAFERRI等[9]利用225個分布于21條染色體上的SSR標記對164個硬粒小麥品種的苗期和成株抗葉銹性進行關聯分析,鑒定出3個具有較大效應的QTL位點,分別位于7BL末端(Lr14附近)、2A和2B染色體上,其中位于7BL的末端的QTL位點為硬粒小麥中重要的抗病基因,15%的供試品種中都攜帶該抗病基因位點。張學勇等[10]發現關聯分析定位的QTL比以往作圖結果豐富,發現了Xgwn1491534BL和Xgwm130132 7AS與粒重顯著相關。CROSSA等[11]進一步證明了關聯分析能有效地定位和挖掘小麥產量性狀基因,在實際育種和種質資源研究中具有重要應用價值。HAO等[12]對266個小麥微核心種質抗赤霉病表型性狀和3B染色體3.1Mb區段42個標記的關聯分析結果表明,cfb6059與小麥赤霉病Type II抗性顯著相關,且與已廣泛應用于抗赤霉病育種的選擇標記umn10非常接近。可見關聯分析大大提高了目標性狀基因或者相關QTL的挖掘和定位,是基因(QTL)定位分析的另一重要方法。
3.2 關聯分析程序
3.2.1 連鎖不平衡分析。
(1)基因型頻率統計分析:運用PLINK v1.07 軟件進行一般的統計分析,包括等位基因頻率、標記的雜合率、材料的雜合度等。
(2)連鎖不平衡(LD)分析:首先從所有標記中篩選出單個標記缺失率小于10%同時最小等位頻率大于10%的標記,然后去除標記間距小于50 Kb 的標記,再隨機選擇幾千個標記,進一步進行群體結構分析。用選擇的幾千個標記,運用Structure V2.3.3 軟件對500個左右品種或高代品系組成的關聯分析群體進行遺傳結構分析。根據關聯分析群體的遺傳組成,將與特定亞群的遺傳相似性比例大于60%的材料劃分到相應亞群中,而將與任何亞群的遺傳相似性比例均小于60%的材料劃分到混合亞群中。
(3)鄰近LD窗口分析:用TASSEL進行材料間遺傳距離計算,并運用Neighborjoining 算法進行聚類圖構建。用進化樹查看軟件FigTree v1.3.1 進行畫圖。
(4)單倍型分析:采用統計算法,以LD 為基礎,如果2標記存在―強LD,則將該標記劃入一種單倍型。單倍型分析用軟件PLINK v1.07完成。
3.2.2 關聯作圖。首先將PLINK 生成的單倍型塊(Haplotype blocks)結果在Excel中生成可以輸入TASSEL 的多態性文件格式(如果單倍型中有任何標記缺失,則將該單倍體基因型定為缺失),然后將單倍型數據導入TASSEL對500份左右品種或高代品系的表型數據和SNP數據進行關聯作圖,找到與目標基因(QTL)緊密連鎖的SNP標記,并定位相關基因(QTL)。
4 結語
關聯分析較傳統QTL分析存在優勢,它是建立在自然群體基礎之上,可以對一些骨干親本、大面積推廣品種進行全基因組高密度掃描,找到這些重要品種的重要基因組區段,弄清骨干親本及推廣品種的基因組學基礎,為分子育種奠定基礎。但關聯分析也有局限性,如結果受群體結構的影響大,大量數據所導致的統計分析方法的不足以及對遺傳多樣性低的物種群體作圖效果差等。因此,在QTL分析時,應將關聯分析與QTL連鎖分析相結合,相互補充,相互印證,取長補短,最終實現目標性狀的精細作圖。
參考文獻
[1] 楊紹華.植物QTL研究進展[J].中國農學通報,2011,27(3):226-231.
[2] 薛永國,劉麗君,高明杰,等.作物中 QTL 的研究進展及展望[J].東北農業大學學報,2007,38(4):542-547.
[3] PATERSON A H,LANDER E S,HEWITT J D,et al Resolution of quantitative traits into Mendelian factors,using a complete linkage map of restriction fragment length polymorphisms[J].Nature,1988,335:721-726.
[4] 章元明.作物QTL 定位方法研究進展[J].科學通報,2006(19):2223-2231.
[5] FLINTGARCIA S A,THORNSBERRY J M,BUCKLER E S.Structure of linkage disequilibrium in plants[J].Annual Review of Plant Biology,2003,54:357-374.
[6] LI H,PENG Z,YANG X,et al.Genomewide association study dissects the genetic architecture of oil biosynthesis in maize kernels[J].Nature Genetics,2013,45:43-50.
[7] HUANG X,ZHAO Y,WEI X,et al.Genomewide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J].Nature Genetics,2012,44:32-39.
[8]
BRESEGHELLO F,SORRELLS M E.Association mapping of kernel size and milling quality in wheat (Triticum aestivum L.) cultivars[J].Genetics,2006,172:1165-1177.
[9] MACCAFERRI M,SANGUINETI M C,MANTOVANI P,et al.Association mapping of leaf rust response in durum wheat[J].Molecular Breeding,2010,26:189-228.
[10] 張學勇,童依平,游光霞,等.選擇牽連效應分析:發掘重要基因的新思路[J].中國農業科學,2006,39(8):1526-1535.
[11] CROSSA J,BURGUENO J,DREISIGACKER S,et al.Association analysis of historical wheat germplasm using additive genetic covariance of relatives and population structure[J].Genetics,2007,177:1889-1913.
[12] HAO C Y,WANG Y Q,HOU J,et al.Association mapping and haplotype analysis of a 3.1Mb genomic region involved in Fusarium head blight resistance on wheat chromosome 3BS[J].PLOS ONE,2012,7(10):46444.