999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從熵原理角度描述基因序列多樣性的方法

2015-07-02 21:28:09劉旻昊
科技資訊 2015年7期
關鍵詞:基因突變

劉旻昊

摘 要:Shannon熵理論可用于描述“無序狀態”,而以Shannon熵為基礎的AMI圖形的算法則包含了生物序列的獨特信息。DNA序列蘊含了生命的所有信息,基于Shannon熵為基礎的AMI則描述了這種“無序狀態”的變化趨勢。這種計算方法簡單易行,在遺傳學、醫學和生物學等領域都有廣泛的應用。

關鍵詞:Shannon熵 基因突變 多樣性

中圖分類號:TP39 文獻標識碼:A 文章編號:1672-3791(2015)03(a)-0242-01

隨著計算機技術和信息技術的發展,對復雜冗長的DNA序列的分析研究變為現實。如何分析這些數據,提取相應的特征量來描述生命體之間的聯系,是近年研究的熱門問題。通過近幾年的發展,也開發出一系列對比軟件,常用的有CLUSTRALW等軟件。

該文擬提取出不同DNA序列的平均互信息AMI作為特征參數,通過多元統計的方法對DNA序列進行描述,進而可以進行分類,在遺傳學、醫學等領域廣泛應用。此種方法的優點是計算簡單且速度較快,對大量數據的處理非常方便且準確率較高。

1 平均互信息AMI

對隨機變量M,事件m的自信息定義為:

其中p(m)是事件m發生的概率,自信息I(m)是事件m發生的可能性的一種度量,表示事件M=m發生時,事件m所含有的所能提供的信息量。

對隨機變量M和N,M的事件m與N的事件n之間的互信息定義為:

其中表示在事件n發生的概率下m發生的條件概率。

根據上述公式,可以定義基因序列的平均互信息(AMI):

其中為4種核苷酸A、C、G、T的集合,如果固定X在基因序列上的某一位置,則Y為X下游方向間隔k個位置的核苷酸。和是核苷酸為X和Y的概率。其中表示前一個核苷酸為X,下游方向間隔k個位置為Y的組合的個數,這樣就表示X和Y間隔為k的聯合分布概率。當k=0時,就表示了緊鄰二聯體核苷酸的概率,k=1時表示次緊鄰二聯體核苷酸的分布率[1]。

[2]就是基因序列的AMI,不同的k值對應不同的,對于每一個基因組,我們都能夠得到一組向量,不同的基因序列,則可以得到不同的向量。

2 相關系數

在該文中我們選擇的是pearson相關系數,又稱為線性相關系數,它能反映兩個數據集之間的線性相關程度。

令為兩個向量和的Pearson相關系數,和代表的AMI各有k個分量(,,…,)和(,,…, )。

這是一個范圍在[-1,+1]之間的數值,若相關系數為+1,表示兩個數據集合之間呈現完美的正線性相關;若相關系數為-1,則表示量數據集之間是負線性相關;若相關系數為0,則表示兩組數據之間沒有線性相關性。

3 距離計算

根據相關系數,我們定義兩種基因的AMI之間的距離為:

通過計算的距離可以看出各個物種與自己的距離為0,與其他物種的距離則根據進化關系的遠近而不同。

4 聚類分析

通過計算不同物種兩兩之間的AMI距離,可以得到一個距離矩陣。對于這個距離,該文選用“ward”法即離差平方和方法進行聚類[3]。

5 K值選擇

對于不同的基因組,首先提取各自序列的AMI的值,對于k值大小的選取,通過反復計算,認為取0到500是比較合適的。這樣每種基因組就得到一個向量,共有501個分量。對于不同基因組的AMI向量,計算相關系數得到距離,兩兩相比較距離得到一個距離矩陣,對距離矩陣通過ward法聚類,最后得到結果。

6 具體應用

通過此種方法,可以很方便地對各類DNA序列進行分類和研究。該課題研究者對64種脊椎動物線粒體DNA繪制了生物進化樹,進行分類進而構建它們之間的進化關系的應用。

參考文獻

[1] Yuan Zhi fa,Zhou Jing yu,Guo Man cai,et al.Gene Diversity and Shannon Information Entropy.Animal[A]Biotechnology Bulletin,8(1):353-358.

[2] 羅遼復.生命進化的物理觀[M].上海:上海科學技術出版社,2000,168-183.

[3] Mark Bauer,Sheldon M Schuster, Khalid Sayood.The Average Mutual Information Profile as a Genomic Signature[J].BMC Bioinformatics,2008 Jan 25,9:48.

猜你喜歡
基因突變
大狗,小狗——基因突變解釋體型大小
英語世界(2023年6期)2023-06-30 06:29:10
18F-FDG PET/CT代謝參數對結直腸癌KRAS基因突變的預測
管家基因突變導致面部特異性出生缺陷的原因
基因突變的“新物種”
管家基因突變導致面部特異性出生缺陷的原因
乙型肝炎病毒逆轉錄酶基因突變的臨床意義
JAK2V617F基因突變在骨髓增殖性腫瘤診斷中的應用
兩個雄激素不敏感綜合征家系中AR基因突變檢測
類脂蛋白沉積癥一家系調查及基因突變檢測
一例腦腱黃瘤病患者的CYP27A1基因突變
主站蜘蛛池模板: 亚洲三级成人| 国产草草影院18成年视频| 久久精品无码国产一区二区三区| 伊人网址在线| 99国产精品免费观看视频| 国产精品林美惠子在线播放| 免费国产高清精品一区在线| 亚洲日韩图片专区第1页| 欧美在线三级| 国产69精品久久久久孕妇大杂乱 | 国内精品伊人久久久久7777人| 国产91色| a亚洲视频| 国产91无码福利在线| 亚洲午夜久久久精品电影院| 亚洲V日韩V无码一区二区| 亚洲欧美不卡中文字幕| 性色在线视频精品| 免费人欧美成又黄又爽的视频| 国产精品妖精视频| 精品人妻系列无码专区久久| 亚洲国产黄色| 欧美日韩中文字幕二区三区| 国产一区二区三区在线精品专区| 国产精品久久久久鬼色| 黄色一级视频欧美| 国产精品尤物在线| 在线国产资源| 99热这里只有免费国产精品 | 亚洲—日韩aV在线| 国产99在线| 热思思久久免费视频| 99热国产这里只有精品无卡顿" | 亚洲bt欧美bt精品| 午夜日韩久久影院| 三上悠亚一区二区| 国产人成在线观看| 国产黄网永久免费| 国产精品视频导航| 在线亚洲小视频| 高清国产va日韩亚洲免费午夜电影| 国产成人综合日韩精品无码首页| 国产成在线观看免费视频| 久草视频精品| 欧美在线一二区| 欧美成人精品在线| 国产精品手机视频| 国产精品毛片一区| 成年人久久黄色网站| 欧美va亚洲va香蕉在线| 91亚洲国产视频| 精品无码日韩国产不卡av| 国外欧美一区另类中文字幕| 91视频首页| 毛片基地视频| 亚洲第一中文字幕| 999精品色在线观看| 高清久久精品亚洲日韩Av| 精品久久久无码专区中文字幕| 日本手机在线视频| 日本欧美成人免费| 亚洲综合日韩精品| 成人在线亚洲| 国产一区二区三区日韩精品 | 青青国产在线| 国产自视频| 亚洲日韩精品伊甸| 亚洲男人天堂久久| 粗大猛烈进出高潮视频无码| 狠狠综合久久| 日韩最新中文字幕| 免费a级毛片视频| 99在线国产| 欧美国产日产一区二区| 精品一区二区三区水蜜桃| 国产精品第5页| 精品欧美一区二区三区在线| 亚洲欧美不卡中文字幕| 无码aaa视频| 一级成人欧美一区在线观看| 日韩免费成人| 国产成人高清精品免费软件|