邢德智 (西安市臨潼區代王初級中學 陜西西安 710611)
三點測驗(three-point test)是基因定位(gene mapping)最常用的方法,主要目的是根據基因之間的(染色體片段)交換值(cross-over value,交換百分率)確定基因之間的排列次序和相對距離進而繪制連鎖遺傳圖(linkage map)。遺傳圖距(genetic distance)是由交換值確定的,但在三點測驗中通過表現型(phenotype)數據測算出的直接結果是重組值(recombinant value,重組百分率)而非交換值;考慮到雙交換和多交換,重組值理論上低于交換值,實際結果也往往反映出這樣的關系;重組值(率)在任何情況下都不能大于0.5(50%)但是在作圖函數中,與遺傳距離對應的交換值可大于0.5。本文探討兩點測驗和三點測驗中交換值被低估的原因及其對應的校正方法,以及四點測驗中交換值的計算方法及重組值的校正機理。
1.1 重組值、交換值和遺傳圖距之間的關系 重組值和交換值的關系為:在2 個基因間遺傳圖距較短時,基因之間幾乎只發生單交換,重組值接近交換值。遺傳圖距較遠時,由于雙交換、多交換發生機會增大,可檢測出雙交換的三點測驗或重組值較大的兩點測驗中,重組值與交換值差別較大(詳見1.3 和2.2),重組值和交換值的關系需要通過雙交換、多交換率或作圖函數進行校正。
根據定義,交換值與遺傳圖距之間的關系為:遺傳圖距是用交換值表示2 個基因之間的相對距離,以1%交換值去掉% 作為遺傳圖距單位(map unit,mu);為了紀念摩爾根(T. H. Morgen),該單位又稱厘摩或分摩爾根(centi-Morgen,cM)。從測交實驗數據計算出的是重組值而非交換值,在實際應用中往往需要將單交換重組值通過雙交換重組值或作圖函數校正為交換值。
1.2 三點測驗中何時需1 倍、何時需2 倍雙交換值校正 果蠅有刺眼(ec)、截翅(ct)和橫脈缺失(cv)。將三雜合雌果蠅(ec ct+/+ +cv)與雄果蠅(ec ct cv/Y)測交,測交結果有8 種表現型,其中:親組合型(ec ct+)為2 125 只、(+ +cv)為2 207只,單交換Ⅰ型(ec+cv)為273 只、(+ct+)為265只,單交換Ⅱ型(ec+ +)為217 只、(+ct cv)為223只,雙交換型(+ + +)為5 只、(ec ct cv)為3 只;根據8 種 結 果 及 其 比 例 得 出ec、ct、cv為 連 鎖 基 因而且順序為ec-cv-ct,將測交結果整理為表1[1]進行連鎖遺傳分析。

表1 ec ct+/++cv×ec ct cv/Y測交結果[1]
分析表明,單交換Ⅰ重組值10.1%是ec-cv間發生單交換導致的,雙交換重組值0.15%是ec-cv間和cv-ct間均發生1 次單交換導致的,但單交換Ⅰ重組值10.1%并未包括0.15%;同樣道理單交換Ⅱ重組值8.3%也未包括0.15%。因此,三點測交實驗中,在有雙交換重組值時,如果用實測的單交換重組值直接替代相鄰2 個基因間的交換值,則交換值一定被低估了,圖距隨之縮小了;當用2種實測的單交換重組值計算最遠2 個基因間的交換值(18.4%)時,既未包括ec-cv間的0.15%也未包括cv-ct間的0.15%,自然要加上2 倍的雙交換重組值才能接近最遠2 個基因間的交換值。所以,用對應實測的單交換重組值加1 倍實測的雙交換重組值計算ec-cv間和cv-ct間相鄰基因間的交換值(10.1%+0.15%=10.3%;8.3%+0.15%=8.4%);用實測的單交換Ⅰ、Ⅱ重組值之和加2 倍的實測的雙交換重組值計算ec-ct間最遠基因間的交換值(10.1%+8.3%+2×0.15%=18.7%)。
這樣才能正確地反映實際發生交換的頻率。根據校正后的交換值繪制染色體圖(chromosome map)(圖1b)。如果不用2 倍雙交換重組值校正2 種實測的單交換重組值,基因ec-cv間的圖距是10.3,基因cv-ct間的圖距是8.4 ,則基因ec-ct間的圖距是18.4;不等于基因ec-cv和cv-ct之和18.7(圖1a),所以,計算最遠2 個基因間的交換值時,需要加上2 倍實測雙交換重組值校正,其本質是分別校正了2 種實測的單交換重組值。

圖1 果蠅基因ec-cv-ct 染色體圖
1.3 為什么要用作圖函數校正 當2 個連鎖基因之間只發生單交換,重組值接近交換值,二者相當于一次函數關系。但當發生“二線雙交換(或二線偶數次交換)”時,并不導致標記基因重組;發生“二線三交換(或二線奇數次交換)”時,標記基因重組的結果與單交換(一次交換)的結果完全相同;所以,對于交換導致重組的結果而言,偶數次交換相當于0 交換,除1 外的奇數次交換相當于單交換,即2 個連鎖基因之間偶數次交換不導致重組只有奇數次交換才會導致重組[2];根據n個連鎖基因性母細胞交換種類計算式C1n-1種單交換,C2n-1種雙交換,C3n-1種三交換,…,Cn-1n-1種(n-1)交換,當n=2 時交換種類只有C12-1=1種單交換,即2 個連鎖基因間不論發生多少次交換,測算出的只能是1 種“單交換”重組值,而這個“單交換”重組值完全沒有反映出發生的偶數次交換、未完全反映出發生的除1 外的奇數次交換,從而導致這2 種情況下重組值都低于交換值,二者是非一次函數的特殊函數關系,自變量的變化值與函數的變化值不成正比例。因此,當2 個連鎖基因間的距離較遠重組值較大時,由于可能發生雙交換或多交換(奇數次或偶數次),以及重組值中不反映(或不完全反映)2 個連鎖基因之間發生了雙交換或多交換,所以,重組值往往低于交換值,需要用霍爾丹(Haldane)作圖函數校正(相關論述可參考遺傳學教材[3])。
正因交換不一定導致重組,或交換與重組不是對應關系,重組值和交換值在這種情況下確實是不同的。

2.1 四點測驗中需要3 種雙交換和1 種三交換重組值校正 假設“四點測驗”有3 種單交換、3 種雙交換、1 種三交換重組值,4 個基因在染色體上的順序是a-b-d-e,單交換i、ii、iii 分別是a-b、b-d、d-e間各發生1 次交換導致的;雙交換和三交換分別是單交換i、ii、iii 的i、ii,ii、iii,i、iii 或i、ii、iii同時發生導致的。各種交換的情況見表2 及圖2,用3 段尺寸線表示在a-b、b-d、d-e間分別發生了1 次交換,染色體圖下面表示染色體上同時發生了2 次交換且因交換位置不同而形成不同的雙交換及同時發生了3 次交換形成三交換:

圖2 基因a-b-d-e 交換圖
由于四點測驗的難度遠遠大于三點測驗,而三點測驗已解決了相關的實際問題,所以四點測驗的資料較少見;表2 是一個四點測驗的結果,則其交換值計算方法如下:

表2 四點測驗結果分析
1)a-b、b-d、d-e相鄰2 個基因1 段基因圖距間交換值依次為:
①a-b間交換值=單交換i 重組值+1 倍(雙交換i+雙交換iii+三交換)重組值=9.3%+0.23%+0.53%+0.07%=10.1%。
②b-d間交換值=單交換ii 重組值+1 倍(雙交換i+雙交換ii+三交換)重組值=6.6%+0.23%+0.37%+0.07%=7.3%。
③d-e間交換值=單交換iii 重組值+1 倍(雙交換ii+雙交換iii+三交換)重組值=10.3%+0.37%+0.53%+0.07%=11.2%。
2)a-d、b-e相鄰3 個基因2 段基因圖距間交換值依次為:
①a-d間交換值=(單交換i+單交換ii)重組值+2 倍雙交換i 重組值+1 倍(雙交換ii+雙交換iii)重組值+2 倍三交換重組值=9.3%+6.6%+2×0.23%+0.37%+0.53%+2×0.07%=17.4%。
②b-e間交換值=(單交換ii+單交換iii)重組值+1 倍 雙 交 換i 重 組 值+2 倍 雙 交 換ii 重 組 值+1 倍雙交換iii 重組值+2 倍三交換重組值=6.6%+10.3%+0.23%+2×0.37%+0.53%+2×0.07%=18.5%。
3)a-e最遠間4 個基因3 段基因圖距交換值a-e間交換值=1 倍(單交換i+單交換ii+單交換iii)重組值+2 倍(雙交換i+雙交換ii+雙交換iii)重組值+3 倍三交換重組值=9.3%+6.6%+10.3%+2×(0.23%+0.37%+0.53%)+3×0.07%=28.7%。
最遠2 個基因之間的交換值28.7%與由a-b、b-d、d-e間交換值之和(10.1%+7.3%+11.2%)相吻合。反映出最遠2 個基因之間的交換值=校正后所有連續相鄰2 個基因間的交換值之和;即:最遠2 個基因之間的遺傳圖距=所有連續相鄰2 個基因間的遺傳圖距之和。
四點測驗中交換值計算方法揭示出相鄰2 個基因間、最遠2 個基因間和任意2 個基因間的交換值計算規律是:
1)相鄰2 個基因間的交換值=某1 種(對應的)單交換重組值+1 倍某2 種(相關)雙交換重組值之和+1 倍三交換重組值;不論是幾交換重組值,其對應的交換最多與相鄰2 個基因間相關1次,計算時都用1 倍值。這間接說明兩點測驗檢測不出2 個基因間發生了雙交換和多交換,因此需要作圖函數校正。
2)任意2 個基因間的交換值=相關的單交換重組值之和+相關雙交換所涉及的交換次數×相關雙交換的重組值+三交換所涉及的交換次數×三交換重組值;例如,b-e間的交換值=(單交換ii+單交換iii)的重組值+(1×雙交換i 的重組值+2×雙交換ii 的重組值+1×雙交換iii 的重組值)+2×三交換的重組值,即6.6%+10.3%+0.23%+2×0.37%+0.53%+2×0.07%。此算式中交換值的計算規律更清楚地揭示出校正值“倍數”的本質是形成該重組配子時在所計算的2 個基因間的相關交換所涉及的交換次數。
3)表2 中每個區間的交換值等于該區間涉及的所有重組值之和;其中單交換重組值只用1 倍值,雙交換和三交換重組值可能要用幾倍值,用幾倍值取決于它們在這個區間所涉及的交換次數(“√”的個數,無“√”空白處個數為0)。
“四點測驗”中交換值的計算為什么能揭示出用幾倍值校正的道理?“三點測驗”中只有相鄰2個基因1 段基因圖距、相鄰3 個基因2 段基因圖距2 種交換值的計算,并且校正值只涉及1 種雙交換值,因此根本無法說清楚“倍數”的本質。林毅在論述四點測驗方法時,未說明四點測驗中為什么產生3 種單交換、3 種雙交換、1 種三交換,自然無法厘清單交換與雙交換及三交換的關系;在計算交換值時只涉及4 個連鎖基因中相鄰2 個基因之間交換值的計算,同樣無法說清楚“倍數”的本質。
本“四點測驗”交換結果除了涉及7 種交換重組值外,還涉及相鄰2 個基因1 段基因圖距、相鄰3 個基因2 段基因圖距和最遠4 個基因3 段基因圖距3 種情況的交換值計算,它們都包括在“任意2個基因間交換值的計算”里。這個算式具有普遍意義并且校正時涉及多種雙交換和三交換;而且用雙交換值校正時情況較為復雜——例如,某種雙交換與2 個基因間無關或相關1 次,最多相關2次,校正時對應的“倍數”分別為0、1、2。這樣就可清楚地揭示校正值“倍數”的本質。
綜上所述,多點測驗中任意2 個基因間的交換值主要由相關的單交換重組值決定,但要估算出較準確的基因間交換頻率,還需要用雙交換、多交換重組值校正。用幾倍重組值校正取決于它們在這2 個基因之間所涉及的交換次數。四點測驗中不論是雙交換重組值還是多交換重組值在相鄰2 個基因間最多測出1 次交換所得的重組值,所以都是用1 倍值校正(a-b、b-d、d-e間交換值);雙交換、多交換重組值是在2 段或3 段基因圖距上發生2 次單交換及多次單交換導致的,所以通常用2 倍值、多倍值校正。總之,相鄰2 個基因之間不論是幾交換重組值,都是用1 倍值校正;最遠2 個基因之間是幾交換重組值,就用幾倍值校正;任意2 個基因之間用幾個雙交換、多交換重組值校正取決于這2 個基因之間相關雙交換、多交換的種類及種類個數,用幾倍值校正取決于該交換在這2 個基因之間所涉及的交換次數。“四點測驗”中任意2 個基因間雙交換、三交換重組值校正時的“倍數”分別為0、1、2 和1、2、3,即雙交換重組值最大用2 倍值進行校正,也可能用1 倍值或0 倍值去校正、三交換重組值最大用3 倍值校正,也可能用2 倍值或1 倍值進行校正。用0 倍值去校正指這2 個基因間的交換值與該種雙交換重組值無關。
“三點測驗”通常有2 種單交換,最多有1 種雙交換,情況比“四點測驗”簡單。“三點測驗”中因為形成雙交換重組配子時,是中間基因與兩側相鄰的2 個基因間分別交換1 次,即同時發生的2次交換也就是雙交換,其重組的結果統計到實測雙交換值里了,而相鄰的2 個基因間的單交換重組值并未包括這部分雙交換值,所以,估算相鄰2個基因間的交換值,要用實測的單交換重組值加上1 倍雙交換重組值校正;而形成雙交換重組配子時在最遠的2 個基因間(實際上為3 個基因2 段基因圖距間)交換了2 次也未包括這部分雙交換值,因此,估算最遠2 個基因間的交換值,要用實測的2 種單交換重組值之和加上2 倍雙交換重組值校正。有雙交換重組值時,相鄰2 個基因或最遠2 個基因間的單交換重組值一定低于對應節段上基因間的交換值,只有通過1 倍或2 倍雙交換重組值校正,才能正確地反映基因間實際發生交換的頻率進而得到較為準確的遺傳圖距。例如,前述“果蠅有刺眼(ec)、截翅(ct)和橫脈缺失(cv)”基因間交換值的計算。
這就是“三點測驗”中交換值低估的原因,以及三點測驗和四點測驗中重組值校正的方法。
2.2 四點測驗與Haldane 作圖函數 兩點測驗無法檢測出2 個基因間發生了雙交換和多交換。如果四點測驗中不考慮居間基因b和d,則無法反映出a-e間發生的3 種雙交換和1 種三交換、只能檢測出1 種單交換,其數值就是3 種單交換重組值之和(2 個標記基因間不論何處發生了1 次交換,結果形成同一類型的重組型配子);不校正之前交換值肯定被低估了。當考慮居間基因b和d,相當于在a-e間增添了2 個標記基因,就可檢測出a-e間發生的雙交換和多交換。
a-b、a-d和a-e間遺傳圖距依次增大,每一個區間涉及的交換總次數也相應增多(表2 中對應區間的對號總數,即4、8、12),這與Haldane 作圖函數中,交換平均數越大,遺傳圖距也越大規律相吻合;或者說四點測驗分析反映的規律,比三點測驗更清楚地解釋了Haldane 作圖函數中,遺傳圖距隨著交換平均數變化的道理。
遺傳圖距是按交換值確定的,根據三點測交實驗統計數據直接計算出的是重組值而非交換值,通過實測雙交換重組值或作圖函數校正間接計算出數值才是交換值。當有雙交換重組值時,重組值一定小于交換值,一定要用雙交換重組值校正,用幾倍值校正取決于形成該種重組型配子時這2 個基因之間交換的次數;相鄰2 個基因之間用1 倍值校正,最遠2 個基因之間用2 倍值校正。“四點測驗”中任意2 個基因間交換值計算式具有普遍意義,用重組值校正時涉及多種雙交換和三交換,從而清楚地揭示出重組值校正值“倍數”的本質是相關交換在這2 個基因間所涉及的交換次數。當沒有雙交換重組值而且2 個連鎖基因相距的遺傳圖距較遠、重組值較大時,由于可能發生雙交換或多交換,重組值也往往小于交換值,需要用Haldane 作圖函數校正。
交換值確定遺傳圖距,它是個固定值。當2個基因的遺傳圖距較近只發生單交換時,交換值直接用單重組值替代;遺傳圖距較遠發生雙交換和多交換時,重組值要校正為交換值。所以,確定遺傳圖距時往往要對單交換重組值進行校正。本研究主要幫助學習者理解重組值的校正機理,減少交換值計算上的錯誤,加深對重組值、交換值概念及二者關系本質的理解,特別是對重組值校正“倍數”本質及Haldane 作圖函數校正機理的理解。