999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于HMM的算法和功率譜算法的基因預(yù)測(cè)對(duì)比研究*

2013-08-15 00:46:21張力丹梁曉佳曹興芹
關(guān)鍵詞:方法模型

張力丹,梁曉佳,李 丹,曹興芹

(1.新疆師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,新疆烏魯木齊830054;2.新疆師范大學(xué)計(jì)算機(jī)科學(xué)學(xué)院,新疆 烏魯木齊830054)

基因預(yù)測(cè)問(wèn)題是生物信息學(xué)中一個(gè)重要問(wèn)題,隨著基因組信息爆炸性的增長(zhǎng),如何從中獲取有用的信息,充分利用現(xiàn)有資源,準(zhǔn)確識(shí)別基因編碼區(qū),揭示生物的遺傳特性,已變得越來(lái)越重要,迫切需要快速準(zhǔn)確的預(yù)測(cè)方法.

一些統(tǒng)計(jì)模型應(yīng)運(yùn)而生,如神經(jīng)網(wǎng)絡(luò)模型、隱馬爾科夫模型、傅里葉變換、線性辨別分析、語(yǔ)言學(xué)、決策樹(shù)等.隱馬爾科夫模型(HMM)是一類智能化的算法,結(jié)構(gòu)合理且容易解釋,被廣泛地應(yīng)用于生物序列的數(shù)學(xué)建模和分析,在基因預(yù)測(cè)的問(wèn)題上也有著突出的優(yōu)勢(shì).但是隱馬爾科夫模型的最大缺陷是有較少的基因構(gòu)造的知識(shí),尤其是在新的基因組序列中.此外,當(dāng)前已知的有些基因也沒(méi)有呈現(xiàn)潛在的基因功能,因此在物理學(xué)和信號(hào)處理方面的一些技術(shù),被應(yīng)用到識(shí)別基因,如功率譜算法.它根據(jù)基因序列編碼區(qū)的周期特性來(lái)實(shí)現(xiàn),算法模型較少,易于理解和操作.

1 功率譜估計(jì)

Kotlar和Lavner[1]提出用離散傅里葉變換的方法進(jìn)行基因預(yù)測(cè),該方法利用蛋白質(zhì)編碼區(qū)的典型特征“三周期性”來(lái)研究編碼區(qū).功率譜算法在傅里葉變換的基礎(chǔ)上發(fā)展而來(lái),功率譜算法可分為經(jīng)典譜估計(jì)和現(xiàn)代譜估計(jì),現(xiàn)代譜估計(jì)是針對(duì)經(jīng)典譜估計(jì)分辨率低和方差性能較差問(wèn)題進(jìn)行改進(jìn)的.

對(duì)于傅里葉技術(shù)預(yù)測(cè)DNA編碼區(qū),王玉等人提出,只計(jì)算1/3頻率點(diǎn)的傅里葉頻譜[2],通過(guò)實(shí)驗(yàn)分析,在確保計(jì)算準(zhǔn)確性不變的情況下,該方法的計(jì)算速度比使用傅里葉變換或快速傅里葉變換,大有提高,而且不需要訓(xùn)練組或現(xiàn)有的數(shù)據(jù)庫(kù)信息.在此基礎(chǔ)上,王玉又提出一種新的基于小波變換的DNA序列編碼區(qū)的預(yù)測(cè)方法[3],利用小波變換分析DNA序列編碼區(qū)的三周期性,解決了傅里葉峰值中噪聲問(wèn)題,在靈敏性和特異性方面有不同程度的提高.之后,王玉將這兩種方法結(jié)合,形成一種新的方法,即先計(jì)算1/3頻率點(diǎn)的傅里葉頻譜,接著利用小波變換進(jìn)行濾波,實(shí)現(xiàn)對(duì)DNA序列編碼區(qū)的預(yù)測(cè)[4].該方法繼承前兩種方法的優(yōu)點(diǎn),即計(jì)算快速,在小波變換下,有效地去掉了噪聲的干擾,預(yù)測(cè)更加準(zhǔn)確.但是分析窗口和濾波尺度需要選擇.馬玉韜提出了一種新的功率譜算法[5],即多滑動(dòng)周期圖法,用于識(shí)別信號(hào)具有周期性和弱周期性的片段,并能給出這些片段所處的時(shí)域位置.

2 隱馬爾科夫模型

隱馬爾科夫模型是一個(gè)動(dòng)態(tài)的統(tǒng)計(jì)模型,是描述大量相互聯(lián)系的狀態(tài)之間發(fā)生轉(zhuǎn)換的概率模型[6].基于HMM的算法,有大量的可用的在線程序,預(yù)測(cè)外顯子、內(nèi)含子以及基因間區(qū)域的定位,都獲得良好的效果.

GENESCAN是美國(guó)麻省理工大學(xué)的Burge和Karlin[7]在1997年開(kāi)發(fā)的基因預(yù)測(cè)軟件,是一個(gè)五階HMM在線基因預(yù)測(cè)程序,用于預(yù)測(cè)脊椎動(dòng)物、擬南芥和玉米的基因.

HMMgene也是 HMM模型的在線預(yù)測(cè)程序,1997由Krogh開(kāi)發(fā)的,主要是運(yùn)用條件的最大似然估計(jì)來(lái)識(shí)別編碼區(qū).首先由其他的方法識(shí)別編碼區(qū),然后程序采用有偏估計(jì)來(lái)鎖定編碼區(qū),并預(yù)測(cè)余下的編碼區(qū).用于人類、脊椎動(dòng)物和線蟲(chóng)基因預(yù)測(cè).

AUGUSTUS 是2003 年 Mario Stanke 和 Stephan Waack[8]開(kāi)發(fā)的預(yù)測(cè)軟件,根據(jù)基因結(jié)構(gòu)而創(chuàng)建的概率模型,該程序可在線使用也可下載使用,是目前精確度較高的預(yù)測(cè)軟件.

基因隱馬爾科夫模型有較多成型的模型,還有FGENES,F(xiàn)GENESH,GENEMARK等軟件也可在線使用.

3 實(shí)驗(yàn)與分析

對(duì)以上提到的基于隱馬爾科夫模型的幾種在線程序與基于功率譜算法設(shè)計(jì)的matlab程序做實(shí)驗(yàn)對(duì)比.選取人類基因40條DNA序列,含有兩類基因,分別為單個(gè)外顯子基因和多外顯子基因.外顯子個(gè)數(shù)從2-30不等,平均個(gè)數(shù)為8.47.采用王玉提出的基于功率譜的預(yù)測(cè)方法,求每條序列的靈敏度和特異性,再求總的平均值,靈敏度和特異性分別為0.90 和 0.88(見(jiàn)表1).

算法優(yōu)劣的評(píng)價(jià),并沒(méi)有確定的標(biāo)準(zhǔn),分別從準(zhǔn)確度、操作性、有效性上加以對(duì)比.從準(zhǔn)確度上看,根據(jù)各類算法性能比較結(jié)果(見(jiàn)表2),取人類基因?yàn)闇y(cè)試集[9],在外顯子水平上,基于功率譜的算法在靈敏度和特異性方面都略高于其他算法,HMMgene,F(xiàn)GENES,F(xiàn)GENESH 和 GENESCAN 的靈敏度和特異性也相對(duì)較高,但功率譜預(yù)測(cè)克服了它們對(duì)物種的選擇性,適用于任何一物種;從操作性看,基于隱馬爾科夫模型的程序,需要對(duì)隨機(jī)過(guò)程的知識(shí)了解較透徹,才能準(zhǔn)確理解該模型的過(guò)程,使用的模型較多,依賴序列間的同源性,參數(shù)設(shè)置也存在問(wèn)題.而基于功率譜的算法用matlab實(shí)現(xiàn),不需要強(qiáng)大的數(shù)學(xué)功底和復(fù)雜的數(shù)學(xué)模型,易于理解,實(shí)現(xiàn)方便;從有效性上看,基于隱馬爾科夫模型軟件,都需要對(duì)已知的基因結(jié)構(gòu)進(jìn)行學(xué)習(xí)訓(xùn)練,才得以進(jìn)行預(yù)測(cè),就目前日益增長(zhǎng)的基因庫(kù)序列,能夠進(jìn)行學(xué)習(xí)訓(xùn)練的序列畢竟有限,對(duì)于那些與訓(xùn)練集基因結(jié)構(gòu)不太相似的基因,就不那么湊效.

從上面的比較我們可以看出,功率譜算法的優(yōu)點(diǎn)明顯多于其他算法,該方法不需要任何一個(gè)訓(xùn)練組來(lái)獲得某類生物體的先驗(yàn)知識(shí),適用面更廣;預(yù)測(cè)較短序列的編碼區(qū)性能更好,但是該算法基于蛋白質(zhì)的三周期性進(jìn)行預(yù)測(cè),并不是所有序列都具有該性質(zhì),有大約4%~5%的基因并不具有這種性質(zhì),因此此方法便失去效力,這是此類算法的缺陷.

4 展望

基因預(yù)測(cè)有很多種方法,每種方法都有其局限性,基于傅里葉變換的功率譜算法是一種較好的算法,但是此算法只是對(duì)序列進(jìn)行了初步定位.可以對(duì)此算法進(jìn)行深入研究,對(duì)基因進(jìn)行更精確的定位.對(duì)算法中存在的數(shù)值映射以及噪聲問(wèn)題,逐步完善并加以解決.對(duì)于那些周期性或弱周期片段,雖然馬玉韜給出了一種新型的基于傅里葉的變換,但是此算法的精確度有待提高,有很大的改進(jìn)空間.正如Fickett所說(shuō),很難用一種方法將各種生物的DNA序列的編碼區(qū)預(yù)測(cè)問(wèn)題全部解決,需要多種方法結(jié)合,才能準(zhǔn)確預(yù)測(cè)和定位基因的編碼區(qū).此外,對(duì)于算法的評(píng)價(jià),目前還缺乏統(tǒng)一的標(biāo)準(zhǔn).

[1]Kotlar D,Lavner Y.Gene prediction by spectral rotation measure:A new method for identifying protein - coding regions[J].Genome Research,2003,(13):1930 -1937.

[2]王玉,饒妮妮.基于傅里葉技術(shù)快速預(yù)測(cè)DNA序列編碼區(qū)[J].電子科技大學(xué)學(xué)報(bào),2006,(5):837 -840.

[3]王玉,饒妮妮,匡斌,等.基于小波變換技術(shù)預(yù)測(cè)DNA序列編碼區(qū)[J].電子學(xué)報(bào),2007,(1):141-144.

[4]王玉.基于小波變換的一種快速預(yù)測(cè)基因方法[J].生物數(shù)學(xué)學(xué)報(bào),2008,(2):364-370.

[5]馬玉韜,車進(jìn).基于傅里葉分析的蛋白質(zhì)編碼區(qū)預(yù)測(cè)中功率譜密度計(jì)算方法研究[J].寧夏大學(xué)學(xué)報(bào),2011,(2):134 -138.

[6]Baum L E,Egon J A.An inequality with applications to statistical estimation for probabilistic functions of a Markov process and to a model for ecology[J].Bulletin of American Meteorological Society,1967,(2):360 -363.

[7]Burge C,Karlin S.Prediction of complete gene structures in human genomic DNA[J].Journal of Molecular Biology,1997,(268):78-94.

[8]Stanke M,Waack S.Gene predition with a hidden Markov model and a new intron submodel[J].Bioinformatics,2003,(19):215-225.

[9]Nasiri J,Moradi A,Abhari S A.Analysis of some conventional ab initio gene findersusing human and mouse DNA sequences[J].African Journal of Biotechnology,2012,(7):1545 -1558.

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
學(xué)習(xí)方法
3D打印中的模型分割與打包
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产成人久视频免费| 国产视频 第一页| 国产人妖视频一区在线观看| 国产成人精品无码一区二| 免费在线不卡视频| 国产精品刺激对白在线| 综合人妻久久一区二区精品| 91在线日韩在线播放| 久久永久免费人妻精品| 免费在线看黄网址| 国产办公室秘书无码精品| 亚洲中文字幕无码爆乳| 中文字幕天无码久久精品视频免费 | 2021无码专区人妻系列日韩| 久久久久亚洲精品成人网| 黄色免费在线网址| 中国一级毛片免费观看| 日韩欧美中文| 911亚洲精品| 国产精品永久在线| 国产爽歪歪免费视频在线观看 | 久久性视频| 亚洲精品无码av中文字幕| 亚洲视频在线观看免费视频| 久久国产精品麻豆系列| 亚洲一区第一页| 日韩第一页在线| 五月天丁香婷婷综合久久| 波多野结衣视频一区二区 | 欧美 国产 人人视频| 欧美色图久久| 日本欧美中文字幕精品亚洲| 久久77777| 久青草免费视频| 欧美日韩在线国产| av在线无码浏览| 欧洲极品无码一区二区三区| a亚洲视频| 狠狠色香婷婷久久亚洲精品| 久久国产香蕉| 2021天堂在线亚洲精品专区| 国产va在线观看| 精品99在线观看| 国产精品理论片| 真实国产乱子伦高清| 亚洲天堂首页| 黄色网址免费在线| 22sihu国产精品视频影视资讯| 国产精品白浆无码流出在线看| 狠狠色成人综合首页| 国产欧美成人不卡视频| 久久国产精品无码hdav| 久久国产V一级毛多内射| 亚洲香蕉在线| 国产又粗又爽视频| 毛片久久久| 无码一区中文字幕| 天天综合网色| 久久精品国产一区二区小说| av在线人妻熟妇| 国产哺乳奶水91在线播放| 亚洲综合色在线| 永久免费无码成人网站| 日本影院一区| 国产噜噜噜| 国产精品无码作爱| 欧美高清视频一区二区三区| 制服丝袜亚洲| 99999久久久久久亚洲| 中文字幕首页系列人妻| 日韩区欧美区| 欧类av怡春院| 亚洲欧美日韩色图| 国产福利2021最新在线观看| 国产欧美日韩视频一区二区三区| 黄色网在线| 久久99热66这里只有精品一| 色亚洲成人| 日韩国产综合精选| 97se亚洲综合| 久久中文电影| 免费毛片全部不收费的|