王 也,吳方楠,周伊婷,鞠秀峰,湯在祥
(蘇州大學醫學部公共衛生學院流行病與衛生統計學系,遺傳流行病與基因組學研究中心,蘇州,江蘇 215123)
生物性狀的表達有賴于基因間的上位性作用,上位性作用構成了復雜的網絡,調節了幾乎全部的基因表達[1]。目前研究人員已經發展出一系列解析核內基因間上位性的統計模型和分析方法,在實際研究中也檢測到了具有顯著上位性的基因[2]。隨著對復雜性狀遺傳基礎研究的不斷深入,細胞質環境對于基因表達的影響作用正在受到研究人員的關注。在模式生物上線粒體與細胞核間的上位性效應對性狀表達有明顯的影響[3-5],核質之間的緊密聯系多次得到了證實。雖然這些研究結果為深入認識復雜性狀的遺傳表達以及核質互作遺傳機制提供了一定的依據,然而,如何在分子水平上探明核質互作的遺傳學基礎,仍然有待研究。長期以來,由于相關統計學方法的缺乏,核質上位性在復雜數量性狀遺傳中的重要性常常被研究人員忽視[6]。尚沒有將核質互作效應在分子水平上作進一步的遺傳剖析,因而,無法追蹤在一定細胞質背景下哪些基因表達,表達的基因所在位置,表達效應的方向和大小,以及重要的核質上位互作效應等。
Tang等[7]在2007年較早地提出核質互作的quantitative trait locus (QTL)分析思想,在分離群體中引入細胞質變異,即將雙親雜交衍生的正交分離群體和反交分離群體進行混合分析,有效地分解控制復雜性狀的細胞質效應、核內QTL效應以及QTL和細胞質的互作效應。本研究將在前期研究工作的基礎上[7-9],擬進一步改善該模型和方法,并以公開發表的小鼠膽固醇含量等復雜性狀的數據為例,展示該分析方法和模型的有效性和實用性,并在現有數據基礎上發現新的遺傳機制。
本研究采用QTL Archive 網站上的公共數據,其遺傳設計如下:取DBA/2J (D2)和CAST/EiJ (CAST)兩種品系的小鼠,采用正反遺傳交配設計。親代小鼠以及F1和F2均在相同的環境條件下飼養繁殖[10,11]。F1代小鼠由D2和CAST兩種品系的小鼠相互交配產生,兩種雜交形式為CAST(父本)×D2(母本)和D2(父本)×CAST(母本)。F2代由F1代個體隨機組合交配產生。遺傳設計如圖1所示。

圖1 正反雜交遺傳設計
根據原作者描述,研究采用了F2代小鼠全部為雄性,共278只,年齡在16~18周。F2代小鼠生長至6~8周后進行連續十周的高脂肪飲食喂養[12],實驗前禁食4 h后眼窩靜脈竇進行采血。血液在4℃環境下保存,然后通過離心(1 000 r/min,5 min)將血漿分離,在分析前儲存在-20℃環境下。采用自動生化分析儀及配套的試劑對高密度脂蛋白膽固醇和總膽固醇進行分析[13,14]。非高密度脂蛋白通過計算總膽固醇與高密度膽固醇之間的差值而確定。
采用在DBA/2J (D2)和CAST/EiJ (CAST)小鼠間具有多態性的微衛星遺傳標記,其數量選擇依染色體長度而定。標記間平均遺傳距離約20 cM, 覆蓋小鼠除性染色體以外全部19條染色體。

(1)

記Xj=(1xcjx1jx2jx3jx4j)為一行向量,b=(b0cadiaciad)Τ,則模型(1)可以矩陣語言表示為:
(2)


表1 個體基因型及基因型值組成分量

(3)

(4)

以上二式中的“E”表示有關缺失變量的期望值,其計算方法概述如下:
(7)

(8)
進而有EM算法實現的極大似然估計步驟如下:



(4)重復(2)和(3)兩步,直至收斂為止。收斂時的參數估計值即為相應參數的極大似然估計值。
1.4.3 似然比檢驗:本研究主要進行兩方面檢驗,首先是是否有無QTL的檢驗,其次是關于該QTL是否存在核質交互作用的檢驗,具體如下:

(9)
上式中的Xj=(1xcj)。獲得相關參數估計值后,計算H0假設下的對數似然函數值L0為:
其中
而H1下的對數似然函數lnL1,則以模型(1)中相應參數的極大似然估計值代入(4)式計算獲得,從而有似然比測驗統計量:
(10)
用于測驗H0,該統計量服從自由度為4的χ2分布。

(11)
該統計量服從自由度為2的χ2分布。
1.4.4 核質互作QTL定位:在進行QTL定位和核質上位性分析時,首先利用(9)進行全基因組搜索,獲得QTL的似然圖譜,并以之推斷各染色體上是否存在QTL,以及各個QTL可能的位置,然后進一步進行似然比檢驗,確定該QTL是否存在顯著的基因型效應,以及QTL與細胞質遺傳物質是否存在上位性效應。本研究以LOD值3.0為顯著性的閾值。
細胞質效應分析,采用正反交之間比較,膽固醇相關性狀指標的細胞質效應分析見表2。由表2可見,僅HDL在不同的細胞質背景下呈現出顯著的差異(P<0.05),該結果暗示了細胞質效應的存在,為進一步進行核質互作QTL分析奠定了基礎。需要指出的是,細胞質效應不顯著,并不表示不存在QTL與細胞質背景的互作效應。
圖2~圖4展示了3個性狀全基因組掃描的結果,該結果表明,CHOL在第9染色體上存在一個QTL,HDL在第2,4,6染色體上共有4個QTL,nonHDL在第9染色體上存在1個QTL,各個QTL的參數估計見表3。采用上述顯著性檢驗方法,對各個QTL是否存在顯著核質互作效應進行了檢驗,表中LOD1為QTL似然比檢驗統計量,LOD2為QTL與細胞質交互作用似然比檢驗統計量,該統計量大于3.0表示,存在QTL或存在顯著的核質互作效應。結果表明在第6染色體上,影響HDL的一個QTL存在顯著核質效應,且以加性與細胞質互作效應為主。在第9染色體上,影響CHOL的QTL也存在較大的核質互作效應,盡管沒有通過顯著性檢驗,仍然提示可能存在核質交互作用。

表2 F2群體血漿總膽固醇、高密度脂蛋白、非高密度脂蛋白濃度分析

表3 核質互作QTL定位結果

圖2 小鼠總膽固醇量各連鎖群QTL定位的似然圖譜

圖4 小鼠非高密度脂蛋白各連鎖群QTL定位的似然圖譜
本研究改進了業已構建的核質互作統計遺傳模型,增加了對核質效應的檢驗,有利于發掘具有顯著核質互作效應的基因。利用公共數據庫的數據,分析了小鼠正反F2家系數據,不僅驗證了前任研究的結果,而且進一步明確了有關QTL的核質互作作用,為進一步解釋相關性狀的核質互作機制奠定了初步的研究結果。
在前人的研究結果中[16-18],對CHOL,HDL和nsn-HDL 3個性狀,采用常用的區間作圖方法共定位到了6個QTL。它們分別是影響CHOL的QTL,位于第9染色體第8 cM位置的Chol6;影響HDL的4個QTL,分別位于第2染色體上48 cM處Hdl1,第4染色體的20 cM處Hdlq10,以及第6染色體的48 cM 處的Hdl11,和68 cM位置上的Hdl12;影響non-HDL的QTL,位于第9染色體8 cM處Chol6。本研究QTL的定位于上述QTL定位結果相似,特別是在QTL位置的置信區間上相互重疊。這證明了本研究的模型方法以及分析結果正確性,也說明了這些QTL的事實存在。因此,本研究的意義在于,采用新的統計遺傳模型發掘現有數據,并得出新的結論,為進一步全面深入了解小鼠復雜性狀的遺傳機制奠定基礎。
參考文獻:
[1] Malmberg RL, Held S, Waits A, et al. Epistasis for fitness-related quantitative traits in Arabidopsis thaliana grown in the field and in the greenhouse [J]. Genetics,2005, 171(4):2013-2027.
[2] Hua J, Xing Y, Wu W, et al. Single-locus heterotic effects and dominance by dominance interactions can adequately explain the genetic basis of heterosis in an elite rice hybrid [J]. Proc Nat Acad Sci U S A,2003, 100(5):2574-2579.
[3] Allen JO. Effect of teosinte cytoplasmic genomes on maize phenotype [J]. Genetics,2005, 169(2):863-880.
[4] Rand DM, Haney RA, Fry AJ. Cytonuclear coevolution: the genomics of cooperation [J]. Trends Ecol Evol,2004, 19(12):645-653.
[5] Roubertoux P L, Sluyter F, Carlier M, et al. Mitochondrial DNA modifies cognition in interaction with the nuclear genome and age in mice [J]. Nat Genet,2003, 35(1):65-69.
[6] Carlborg O, Haley CS. Epistasis: too often neglected in complex trait studies [J]. Nature Rev Genet,2004, 5(8):618-625.
[7] Tang Z, Wang X, Hu Z, et al. Genetic dissection of cytonuclear epistasis in line cross [J]. Genetics, 2007, 177:669-672.
[8] Hang Y, Jiang B, Zhu J, et al. Bayesian models for detecting epistatic interactions from genetic data [J]. Ann Hum Genet,2011b, 75(1):183-93.
[9] 王曦, 李紅霞, 王靖宇. 鼠數量性狀QTL定位的研究進展 [J]. 中國比較醫學雜志, 2006, 16(4):249-254.
[10] Valdar W, Solberg LC, Gauguier D, et al. Genetic and environmental effects on complex traits in mice [J]. Genetics, 2006, 174:959-984.
[11] 周淑佩, 張曉紅, 劉國慶, 等. 混合性高甘油三酯/高膽固醇血癥小鼠模型的培育 [J]. 中國比較醫學雜志, 2005, 15(6):368-371.
[12] 楊小毅, 楊永宗, 譚健苗, 等. 一種純系小鼠動脈粥樣硬化病理模型的建立 [J].中國動脈硬化雜志, 1996, 4(1): 54-57.
[13] Allain CC, Poon LS, Chan CS, et al. Enzymatic determination of total serum cholesterol [J]. Clin Chem,1974, 20:470-475.
[14] Roeschlau P, Bernt E, Gruber W. Enzymatic determination of total cholesterol in serum [J]. Z Klin Chem Klin Biochem,1974, 12(9):403-407.
[15] Xu C, He X, Xu S. Mapping quantitative trait loci underlying triploid endosperm traits [J]. Heredity,2003, 90(3):228-235.
[16] Lyons MA, Wittenburg H, Li R, et al. Quantitative trait loci that determine lipoprotein cholesterol levels in DBA/2J and CAST/Ei inbred mice [J]. J Lipid Res,2003, 44(5):953-967.
[17] Lyons MA, Wittenburg H, Li R, et al. Lith6: a new QTL for cholesterol gallstones from an intercross of CAST/Ei and DBA/2J inbred mouse strains [J]. J Lipid Res,2003, 44(9):1763-1771.
[18] Li R, Lyons MA, Wittenburg H, et al. Combining data from multiple inbred line crosses improves the power and resolution of quantitative trait loci mapping [J]. Genetics,2005, 169(3):1699-1709.