劉源
摘 要:數量性狀基因的定位又叫QTL定位,QTL 定位就是采用類似單基因定位的方法將QTL 定位在遺傳圖譜上,確定QTL 與遺傳標記間的距離。QTL定位的基本原則是關聯度量的遺傳變異和表型變異。群體的選擇、用于度量表型個體選擇和基因型判型個體的選擇是所有QTL定位設計要重點考慮的因素。本文介紹了小麥等作物不同作圖群體的優缺點以及QTL定位的原理和方法,從而對遺傳群體的選擇以及QTL定位技術的使用提供依據。
1、QTL 作圖群體的選擇
QTL是quantitative trait locus的縮寫,中文可以翻譯成數量性狀座位或者數量性狀基因座,它指的是控制數量性狀的基因在基因組中的位置。QTL 定位的第一步是選擇合適的親本構建作圖群體。親本選擇要本著性狀差異大和親緣關系遠的原則,以便發生較多的重組事件和表型變異,利于定位研究的進行。目前,小麥 QTL 定位常用的作圖群體按照保存時間的長短,分為兩類:臨時性分離群體和永久性分離作圖群體。前者包括 F2及其衍生的 F3、F4家系,以及回交產生的BC 群體等。后者包括 DH、RIL、IF2和 NIL 群體等。不同的群體具有各自的特性。臨時性群體的主要特點是群體內各個體間基因型不同,雜合基因型占很大比例。它們包含的遺傳信息豐富,可以同時估算加性、顯性效應。缺點是個體間基因型存在雜合型,后代發生分離,群體結構發生改變,不能進行多年、多點試驗。而永久性群體系內基因型一致,系間基因型不同,因此可以進行多重復、多年、多點試驗,增加QTL 定位準確性。缺點是永久性群體由于系間基因型一致,不能估算顯性效應;若群體量不夠大,則提供的遺傳信息不如臨時性群體豐富。尤其是 DH 群體,染色體加倍時可能存在基因型的丟失,通常不適于構建分子標記連鎖圖。對于異花授粉作物,由于存在自交衰退現象,構建 RIL 意義不大。IF2區別于其他永久性群體的最大特點是可同時估算加性、顯性及與顯性相關的上位性效應。NILs 僅在系間存在染色體區段差異,消除背景干擾,因此可用于 QTL 的精細定位。另外,還存在另一種特殊的群體——自然群體。由于林木等植物具有很長的世代間隔,很高的遺傳雜合性和遺傳負荷,不能構建理想的群體類型;人工雜交困難,難以獲得理想的群體量,使得遺傳參數準確性不高。利用自然群體對這類植物進行 QTL 定位是實用、有效的。目前玉米、水稻、小麥等作物的自然群體用于植物數量性狀的關聯分析,大大提高了控制目標性狀的基因或相關 QTL 的挖掘效率。
2、QTL 定位的原理和方法
QTL 定位是利用分子標記進行遺傳連鎖分析以檢測出控制某一性狀的所有基因的集合。其基本思想就是尋找數量性狀與 DNA 分子標記的特定染色體片段之間的關系,也即通過分析整個染色體組的 DNA 分子標記和數量性狀表型值的關系,將 QTL 逐一定位到連鎖群的相應位置,并估計其遺傳效應。
目前常用的 QTL 定位方法主要有以下五種:
(1)單標記分析法(SMA):通過方差分析、回歸分析或似然比檢驗,比較不同標記基因型個體均值,如果差異顯著,則說明控制該性狀的 QTL 與標記連鎖。此法不需要完整的分子標記連鎖圖譜,早期使用較多。缺點是不能確定該標記同幾個 QTL 連鎖,無法估計 QTL 位置、低估 QTL效應、容易產生假陽性、檢測效率低等。
(2)區間作圖法(IM):1989 年 Lander 和Botstein 等提出基于兩側標記的區間作圖法。該方法能從置信區間推測 QTL 位置,可以實現對不存在互作的 QTL 的位置和效應值達到無偏估計,此外,QTL 檢測所需群體小。缺點是回歸效應為固定效應,無法估算基因型與環境間的互作及上位性,易產生假陽性 QTL,每次檢測僅用兩個標記,檢測效率底。
(3)復合區間作圖法(CIM):1994 年 Zeng提出結合區間作圖和多元回歸特點的 CIM 作圖方法。該法仍采用最大似然法估測 QTL 位置和效應,從而保留了 IM 作圖法的優點;假如不存在 QTL 間上位性及與環境間的互作,可以對 QTL 位置和效應做到無偏估計;同時結合全基因組標記信息,控制了背景遺傳效應,提高了作圖的精度。缺點是將兩側標記用作區間作圖,會引起鄰近標記區間 QTL 估計的偏離;不能分析基因型與環境的互作及上位性等遺傳效應;運算速度慢等。
(4)完備區間作圖法(ICIM):2007 年 Li 等提出完備區間作圖法,彌補了 CIM 法算法上的一些缺陷,操作簡單、參數估計穩定;可進行
QTL 間上位性檢測,提高了 QTL 檢測的準確性,假陽性 QTL 減少。
(5)基于混合線性模型的復合區間作圖法(MCIM):1999 年朱軍提出用隨機效應的預測方法或的基因型效應及基因型與環境的互作效應,然后再用 IM 或 CIM 法進行遺傳效應的分析。此法將效應估計和定位分析相結合,即可無偏分析 QTL 與環境的互作效應,又提高了作圖的效率和準確性。
3、QTL定位的統計軟件與閾值
隨著許多物種高密度遺傳連鎖圖譜的建立和分子標記技術的迅速發展,使得 QTL定位研究不斷深入。目前 QTL 定位常用的統計分析軟件有 Microsoft Excel、SAS、SPSS,QTL 作圖軟件主要有 Mapmaker/QTL、Map Manager QTL、QTL Cartographer(http://statgen.ncsu.edu/qtlcart)、Ici Mapping(http://www.isbreeding.net)和 Join Map等。QTL 定位所設閾值(LOD 值)多為 2.0~3.0(P=0.01 或 P=0.001 或 P=0.005)。一般認為,LOD 值過高則容易漏掉效應較小的 QTL;LOD 值過低則容易產生“假陽性”QTL,即不是 QTL 的位點也被認為是 QTL。另外,LOD 值還與群體大小有關,小群體用大的閾值會大大減少 QTL 的檢出個數。因此,有必要運用較小的閾值進行檢測,以發現所有的 QTL 位點。總之,QTL 定位結果受到群體大小、閾值、標記間遺傳距離及統計方法等諸多因素的影響,一些遺傳率較低、貢獻率較小的 QTL 檢測結果是不可靠的,有待進一步驗證。