李吉印 郭滿才
摘要:利用群體遺傳學的基本知識推導出1對等位基因平衡群體中半同胞對子間基因型的聯合概率分布;給出了半同胞對子間的聯合信息熵、互信息,并定義了信息關聯系數;與生物統計學研究相比,表明生物信息學的方法可使1對等位基因平衡群體中半同胞對子間的親屬關系研究成為可能。
關鍵詞:1對等位基因;平衡群體;半同胞;親屬關系;信息關聯系數
中圖分類號:Q811.4 文獻標識碼:A 文章編號:0439-8114(2017)18-3419-02
DOI:10.14088/j.cnki.issn0439-8114.2017.18.006
Abstract: Using the basic knowledge of population genetics, the author derived the joint probability distribution of genotypes of half sib pairs among alleles equilibrium population; gave the entropy and mutual information about half sib pairs, and defined the information coefficient of correlation. By comparing the results with the statistical study, it indicated that its possible to use the method of informatics to study the kinship of half sib pairs a pair of alleles in equilibrium population.
Key words: a pair of alleles; equilibrium population; half sib; kinship; information coefficient of correlation
群體遺傳研究的核心是孟德爾群體(Mendelian population)世代傳遞中,基因頻率與基因型頻率變化的規律。群體遺傳學的傳統研究方法是建立統計學模型[1]。然而,由于基因在世代間的傳遞本身就是一個信息傳遞過程,故也可用信息論的方法對其進行研究[2-4]。
平衡群體內存在著親子、全同胞、半同胞等親屬關系,國內外學者在這方面已做了一些研究。杜俊莉等[5]利用Shannon信息熵指數研究了母子間和同胞對子間的相關與信息關聯度,而對半同胞對子間的相關與信息關聯度的研究較少。本研究就是用信息論模型討論1對等位基因平衡群體中半同胞對子間親屬關系的關聯性,以此說明運用信息學方法可對群體遺傳學的有些問題進行更深入地研究,以進一步豐富群體遺傳學的研究內容。
平衡群體內同母異父與同父異母兩種情況下的半同胞關系,其結論是一樣的。本研究中指定研究同父異母下半同胞對子間的親屬關系。
1 1對等位基因平衡群體的遺傳結構及其Shannon信息
這種分析是利用傳統統計學方法進行研究,因而需要對AA,Aa和aa分別賦值2,1和0,Aa和aA無區別。在同父異母(即父親分別與兩個母親產生的后代)的情況下,當父親的基因型不同時,分別產生的后代的基因型頻率如表1所示,由此可以得到各種交配類型中半同胞對子的頻率如表2所示,表3給出了平衡群體中各種同胞對子的聯合分布。
4 比較分析
傳統統計學在研究親屬關系時,只是對1對等位基因群體采用賦值的方法進行了研究,而且得到的相關系數均為常量;但從上面的分析可看出,用信息學的方法可求出其信息關聯系數,并進一步研究它們之間的信息關聯程度。研究結果表明,在1對等位基因平衡群體中半同胞對子間的親屬關系與基因頻率有關,這在進化上更客觀。
參考文獻:
[1] 袁志發.群體遺傳學、進化與熵[M].北京:科學出版社,2011.50-58.
[2] 郭滿才,袁志發,宋世德,等.相對Shannon信息量與基因變異的測量[J].西北農業大學學報,1998,26(4):30-34.
[3] 郭滿才,宋世德,周靜宇,等.非平衡群體基因變異測量的Shannon信息量方法[J].生物數學學報,2001,16(3):341-347.
[4] 袁志發,周靜宇.多元統計分析[M].北京:科學出版社,2002.257-288.
[5] 杜俊莉,郭滿才,張宏禮,等.復等位基因平衡群體中親屬關系的信息學研究[J].西北農林科技大學學報(自然科學版),2005, 33(2):155-158.endprint