999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從熵原理角度描述基因序列多樣性的方法

2015-07-02 21:28:09劉旻昊
科技資訊 2015年7期
關鍵詞:基因突變

劉旻昊

摘 要:Shannon熵理論可用于描述“無序狀態”,而以Shannon熵為基礎的AMI圖形的算法則包含了生物序列的獨特信息。DNA序列蘊含了生命的所有信息,基于Shannon熵為基礎的AMI則描述了這種“無序狀態”的變化趨勢。這種計算方法簡單易行,在遺傳學、醫學和生物學等領域都有廣泛的應用。

關鍵詞:Shannon熵 基因突變 多樣性

中圖分類號:TP39 文獻標識碼:A 文章編號:1672-3791(2015)03(a)-0242-01

隨著計算機技術和信息技術的發展,對復雜冗長的DNA序列的分析研究變為現實。如何分析這些數據,提取相應的特征量來描述生命體之間的聯系,是近年研究的熱門問題。通過近幾年的發展,也開發出一系列對比軟件,常用的有CLUSTRALW等軟件。

該文擬提取出不同DNA序列的平均互信息AMI作為特征參數,通過多元統計的方法對DNA序列進行描述,進而可以進行分類,在遺傳學、醫學等領域廣泛應用。此種方法的優點是計算簡單且速度較快,對大量數據的處理非常方便且準確率較高。

1 平均互信息AMI

對隨機變量M,事件m的自信息定義為:

其中p(m)是事件m發生的概率,自信息I(m)是事件m發生的可能性的一種度量,表示事件M=m發生時,事件m所含有的所能提供的信息量。

對隨機變量M和N,M的事件m與N的事件n之間的互信息定義為:

其中表示在事件n發生的概率下m發生的條件概率。

根據上述公式,可以定義基因序列的平均互信息(AMI):

其中為4種核苷酸A、C、G、T的集合,如果固定X在基因序列上的某一位置,則Y為X下游方向間隔k個位置的核苷酸。和是核苷酸為X和Y的概率。其中表示前一個核苷酸為X,下游方向間隔k個位置為Y的組合的個數,這樣就表示X和Y間隔為k的聯合分布概率。當k=0時,就表示了緊鄰二聯體核苷酸的概率,k=1時表示次緊鄰二聯體核苷酸的分布率[1]。

[2]就是基因序列的AMI,不同的k值對應不同的,對于每一個基因組,我們都能夠得到一組向量,不同的基因序列,則可以得到不同的向量。

2 相關系數

在該文中我們選擇的是pearson相關系數,又稱為線性相關系數,它能反映兩個數據集之間的線性相關程度。

令為兩個向量和的Pearson相關系數,和代表的AMI各有k個分量(,,…,)和(,,…, )。

這是一個范圍在[-1,+1]之間的數值,若相關系數為+1,表示兩個數據集合之間呈現完美的正線性相關;若相關系數為-1,則表示量數據集之間是負線性相關;若相關系數為0,則表示兩組數據之間沒有線性相關性。

3 距離計算

根據相關系數,我們定義兩種基因的AMI之間的距離為:

通過計算的距離可以看出各個物種與自己的距離為0,與其他物種的距離則根據進化關系的遠近而不同。

4 聚類分析

通過計算不同物種兩兩之間的AMI距離,可以得到一個距離矩陣。對于這個距離,該文選用“ward”法即離差平方和方法進行聚類[3]。

5 K值選擇

對于不同的基因組,首先提取各自序列的AMI的值,對于k值大小的選取,通過反復計算,認為取0到500是比較合適的。這樣每種基因組就得到一個向量,共有501個分量。對于不同基因組的AMI向量,計算相關系數得到距離,兩兩相比較距離得到一個距離矩陣,對距離矩陣通過ward法聚類,最后得到結果。

6 具體應用

通過此種方法,可以很方便地對各類DNA序列進行分類和研究。該課題研究者對64種脊椎動物線粒體DNA繪制了生物進化樹,進行分類進而構建它們之間的進化關系的應用。

參考文獻

[1] Yuan Zhi fa,Zhou Jing yu,Guo Man cai,et al.Gene Diversity and Shannon Information Entropy.Animal[A]Biotechnology Bulletin,8(1):353-358.

[2] 羅遼復.生命進化的物理觀[M].上海:上海科學技術出版社,2000,168-183.

[3] Mark Bauer,Sheldon M Schuster, Khalid Sayood.The Average Mutual Information Profile as a Genomic Signature[J].BMC Bioinformatics,2008 Jan 25,9:48.

猜你喜歡
基因突變
大狗,小狗——基因突變解釋體型大小
英語世界(2023年6期)2023-06-30 06:29:10
18F-FDG PET/CT代謝參數對結直腸癌KRAS基因突變的預測
管家基因突變導致面部特異性出生缺陷的原因
基因突變的“新物種”
管家基因突變導致面部特異性出生缺陷的原因
乙型肝炎病毒逆轉錄酶基因突變的臨床意義
JAK2V617F基因突變在骨髓增殖性腫瘤診斷中的應用
兩個雄激素不敏感綜合征家系中AR基因突變檢測
類脂蛋白沉積癥一家系調查及基因突變檢測
一例腦腱黃瘤病患者的CYP27A1基因突變
主站蜘蛛池模板: 日本91在线| 久久黄色视频影| 91九色国产porny| 精品91视频| 日本人妻丰满熟妇区| 精品撒尿视频一区二区三区| 国产欧美日本在线观看| 国产欧美精品一区aⅴ影院| 国产乱子伦精品视频| 香蕉伊思人视频| 99视频在线免费| 国产网站免费观看| 色AV色 综合网站| 日韩经典精品无码一区二区| 伦精品一区二区三区视频| 亚洲手机在线| 亚洲第一成年免费网站| 国产无人区一区二区三区| 狠狠ⅴ日韩v欧美v天堂| 久久综合结合久久狠狠狠97色| 国产一区二区影院| 国产在线自揄拍揄视频网站| 国产内射一区亚洲| 国产成人综合久久| 亚洲天堂视频网站| 欧美色亚洲| 亚洲无码视频喷水| 国产性生大片免费观看性欧美| aaa国产一级毛片| 国产成人综合亚洲网址| 99热精品久久| 国产精品伦视频观看免费| 高清无码手机在线观看| 日日拍夜夜嗷嗷叫国产| 国产成人AV男人的天堂| 午夜少妇精品视频小电影| 日本亚洲欧美在线| 亚洲美女视频一区| www.亚洲天堂| aⅴ免费在线观看| 欧美人与性动交a欧美精品| 亚洲精品自产拍在线观看APP| 亚洲无码免费黄色网址| 国产va欧美va在线观看| 日韩大片免费观看视频播放| 亚洲第一成年免费网站| 秋霞一区二区三区| 激情成人综合网| 亚洲综合天堂网| 国产一区二区人大臿蕉香蕉| 欧美日韩亚洲国产| 2048国产精品原创综合在线| 福利在线一区| 日韩在线永久免费播放| 久久伊人色| 污视频日本| 色综合天天操| 日韩少妇激情一区二区| 国产精品三区四区| 亚洲欧美国产视频| 亚洲天堂伊人| 日本人又色又爽的视频| 不卡无码网| 国内自拍久第一页| 成年人久久黄色网站| 亚洲无码精彩视频在线观看| 91破解版在线亚洲| 91精品国产福利| 伊人久综合| 在线日韩日本国产亚洲| 国产精品亚洲αv天堂无码| 国产黄网站在线观看| 理论片一区| 欧美有码在线| 欧美激情福利| 国产精品亚洲一区二区三区在线观看| 91美女在线| 九色在线观看视频| 久久亚洲AⅤ无码精品午夜麻豆| 99精品视频在线观看免费播放| 一级片一区| 亚洲综合狠狠|