999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

蛋白質序列混沌游戲表示模擬效果的優化

2010-10-23 13:14:06肖前軍周金玉鄧總綱
汕頭大學學報(自然科學版) 2010年1期
關鍵詞:游戲效果系統

肖前軍,周金玉,鄧總綱

(湖南理工職業技術學院,湖南湘潭411104)

蛋白質序列混沌游戲表示模擬效果的優化

肖前軍,周金玉,鄧總綱

(湖南理工職業技術學院,湖南湘潭411104)

蛋白質序列的可視化表示——混沌游戲表示呈現出明顯的分形特征.根據分形的產生機理,可以用遞歸迭代函數系統很好地模擬蛋白質序列的混沌游戲表示.在實驗中發現,其模擬效果可以進一步優化,可能有助于更準確地進行物種親緣關系的分析.

遞歸迭代函數系統;混沌游戲表示;模擬;蛋白質序列;優化

0 引言

蛋白質序列是由20種不同的氨基酸組成的一維字符序列,但要直接從中得出更多隱含的生物特性是非常困難的.為此人們設計出很多方法來進行序列分析,例如,統計分析、人工神經網絡技術和動態規劃等方法已經成功地應用到蛋白質序列分析的某些領域,但這些方法不夠直觀且其中很多方法都需要進行繁瑣的序列比對.因此,人們探索將蛋白質序列轉化為數字信號、曲線或者可視化模型,再利用數學方法(如分形理論)進行相關分析,以期從中發現更多的生物特性.Jeffrey[1]介紹了一種表征蛋白質序列的可視化方法——混沌游戲表示,通過在蛋白質序列的混沌游戲表示圖中發現明顯的分形特征[2-5],而實際的分形是隨機迭代產生的,因此可以運用遞歸迭代函數系統[2,5-10]來模擬蛋白質序列的混沌游戲表示.實驗發現模擬效果很好[2,7],而且其結果可以進行物種進化等相關分析[6],實驗過程中還發現其模擬結果可以進一步優化.

1 理論模型

1.1 蛋白質序列混沌游戲表示(CGR)[1-5]

蛋白質序列由20種不同的氨基酸組成[11],即甘氨酸(G)、丙氨酸(A)、纈氨酸(V)、異亮氨酸(I)、亮氨酸(L)、苯丙氨酸(F)、脯氨酸(P)、甲硫氨酸(M)、色氨酸(W)、半胱氨酸(C)、絲氨酸(S)、蘇氨酸(T)、天冬酰胺(N)、谷氨酸(E)、酪氨酸(Y)、組氨酸(H)、天冬氨酸(D)、谷酰胺(Q)、賴氨酸(K)和精氨酸(R).根據detailed-HP模型[5,7,12-13],可以把以上20種氨基酸分成4類:無極性氨基酸(A、I、L、M、F、P、W和V),負極性氨基酸(D和E),正極性氨基酸(R、H和K)和不帶電氨基酸(N、C、Q、G、S、T和Y).對一條長度為l的蛋白質序列s=s1s2…sl,其中si是20種氨基酸中的某一種,i=1,2,…,l,定義:這樣就把蛋白質的氨基酸序列轉換成了一條字符序列X(s)=a1a2…al,其中ai∈{0,1,2,3}.根據Jeffrey[1]的定義,一條蛋白質序列s的混沌游戲表示規則如下:先在平面上作一正方形[0,1]×[0,1],以其4個頂點分別代表4個字符0、1、2和3,然后進行打點,第一點打在正方形中心與序列X(s)第一個字符對應頂點的中點,第i(i≥2)點打在第i-1點與序列X(s)第i個字符對應頂點的中點,直到在正方形中作出序列X(s)最后一個字符對應的點,這樣得到的圖像稱為蛋白質序列s的混沌游戲表示CGR.

1.2 混沌游戲表示測度[5,8,10,12]

根據蛋白質序列混沌游戲表示的作法可知,序列X(s)與其CGR之間具有一一對應關系,即不同的蛋白質序列對應著不同的混沌游戲表示.為了進一步討論的需要,引入蛋白質序列的混沌游戲表示的測度這一概念,對給定的蛋白質序列,以如下方式來定義其CGR測度:μ(B)=#(B)/N,其中#(B)表示該蛋白質序列CGR子集B中點的數目,N表示蛋白質序列的長度.為了便于討論,將正方形[0,1]×[0,1]分割成2k×2k個小正方形網格,對每一種分割,取B為該分割中每一網格與蛋白質序列CGR的交集,則#(B)就是該網格上CGR點的數目,這樣我們得到2k×2k的測度矩陣.

1.3 遞歸迭代函數系統(RIFS)[2,5-10]

在完備距離空間X上,一個由壓縮映射集S={S1,…,SN}和與其對應的概率集P=(pij)(其中構成的系統(S,P),任取起始點A0,按如下的迭代過程產生隨機點列:An+1=Sσn(An)(n=0,1,2,…),其中σn在集合{1,2,…,N}中取值且P(σn+1=i)=pσni,i=1,…,N,則稱(S,P)為遞歸迭代函數系統.

在本文中,我們取X=[0,1]×[0,1],N=4,壓縮映射為:1,2,3,4,即:

遞歸迭代函數系統的一個主要結論是:存在唯一不變測度且其支撐集為遞歸迭代函數系統的吸引子.由于需要用遞歸迭代函數系統的吸引子來逼近蛋白質序列的混沌游戲表示,所以為了得到給定的蛋白質序列對應的RIFS的吸引子,我們根據已知蛋白質序列混沌游戲表示的測度,用矩方法來估計遞歸迭代函數系統中的未知參數pij.如果μ′與A分別是RIFS的不變測度與吸引子,則μ′的矩為:

記Gmn為蛋白質序列的混沌游戲表示測度μ的各階矩,通過解優化問題Gmn)2可得參數pij的估計值,根據其估計值可以產生上述RIFS吸引子A,記χB為吸引子A的子集B的特征函數,根據RIFS遍歷理論可知其不變測度為:μ′(B)=這樣就可以計算出與上述蛋白質序列混沌游戲表示的測度矩陣同樣大小的不變測度矩陣,然后根據它們的差異程度來判別RIFS的吸引子逼近蛋白質序列CGR的好壞.

1.4 CGR模擬效果判斷[2,5-6,10]

1.4.1 相對標準誤差

為了說明不變測度對原始測度的模擬效果,引入相對標準誤差:e=e1/e2,其中e1=為原始測度矩陣的元素,yij為模擬測度矩陣的元素,若e<1,則說明擬合得比較好,如果e<0.1,則擬合的效果更好[2].

1.4.2 測度累積行走

測度累積行走定義如下:其中fi是將測度矩陣的k×k網格所有行擴展為一行后第i個網格的密度值,是網格上所有密度值的平均值.

2 結果與分析

數據庫Genebank(ftp://ncbi.nlm.nih.gov/genbank/genomes)中有大量的蛋白質序列,從中隨機下載了20種細菌(見表1)的蛋白質序列.以細菌Thevo(Thermoplasma volcanium,火山熱原體,廣古生菌(Euryarchaeota))為例,根據1.1節中的方法,圖1是Thevo蛋白質序列的混沌游戲表示,該圖呈現出明顯的分形特征.根據1.2節中的方法,圖2是k=7時Thevo蛋白質序列混沌游戲表示的測度圖.基于1.3節中的理論,通過計算得到參數pij的估計為:

根據概率矩陣P4×4得到了對應的k=7時遞歸迭代函數系統的吸引子圖3及不變測度圖4.對于Thevo而言,根據1.4.1節的方法,計算得到e=0.130 8,根據1.4.2節的方法,圖5給出了k=7時Thevo的CGR測度行走表示及其模擬的比較圖,表明用遞歸迭代函數系統能很好地模擬Thevo的蛋白質序列CGR.為了對模擬結果進一步優化,我們考慮兩個問題:第一,迭代次數是否影響迭代結果?第二,k的不同取值是否影響迭代效果?在文獻[2,5]中,都是選用k=7來進行研究.實驗證實迭代次數并不影響迭代結果,而k的不同取值可以影響迭代效果.以Thevo為例,圖6~8分別是k=8時Thero的CGR測度,RIFS吸引子及RIFS模擬CGR的不變測度,由圖1和圖3、圖2和圖4的對比結果與圖1和圖7、圖6和圖8的對比結果可以直觀地看出,k=8時的模擬效果明顯優于k=7時的模擬效果,圖5和圖9分別表示k=7和8時,Thevo的CGR測度行走表示及其模擬的比較圖,也很好地證實了上述結論.此時,參數pij的估計為:

而且從表1可以看出,對Thevo而言,k=8時有最好的模擬效果.之后隨機選取了20種不同細菌進行實驗發現,當k取不同的值時,其模擬效果是不同的,可以選取不同的k值使其模擬效果達到最優(見表1).其缺點就是過程相對麻煩,需要進行反復的實驗去尋找適合的k值.

圖1 Thevo的CGR

圖2 k=7時Thevo的CGR測度

圖3 k=7時Thevo的RIFS吸引子

圖4 k=7時Thevo的RIFS模擬CGR不變測度

表1 不同k值時RIFS對20種細菌的CGR模擬結果

細菌名稱(簡寫)蛋白質序列長度相對標準誤差k=7k=8k=9k=10k=11k=12Cloab1 123 6040.189 50.180 50.092 30.099 20.099 60.099 8 lo640 5460.052 70.037 70.039 10.041 10.043 50.044 8Borbu283 5960.200 80.167 80.152 70.101 40.108 10.115 3Brume950 1280.038 20.036 00.027 30.025 90.026 90.027 8Camje508 8370.080 20.083 80.025 70.026 00.026 70.027 2Caucr1 209 2280.025 90.024 20.015 80.016 20.017 20.018 1Chlmu321 0650.118 30.113 80.092 40.098 10.098 70.113 2ChlpnAYerpek1 273 9040.068 90.058 00.055 10.057 50.058 60.060 5Wigbr201 6721.103 51.116 90.867 70.932 00.961 20.964 0Thevo450 1070.130 80.050 30.053 60.055 20.057 20.063 5Mycpe400 8000.325 30.221 70.230 20.235 20.241 20.251 1Urepa228 2390.405 80.330 30.248 10.262 80.268 90.271 3Bachd1 188 4480.048 70.046 60.034 60.036 70.037 20.038 2Bacsu1 218 6160.068 60.041 80.042 30.043 30.045 10.048 1Bif 364 0780.104 40.098 20.061 90.064 60.074 50.086 7

3 結語

用分形方法中的遞歸迭代函數系統對基于detailed-HP模型的蛋白質序列可視化方法——混沌游戲表示作了逼近,分析發現用遞歸迭代函數系統來逼近蛋白質序列的混沌游戲表示時有好的效果,且其模擬結果可以進一步優化,為更準確地進行物種親緣關系的分析提供一種新的方法.

[1] Jeffrey H J.Chaos game representation of gene structure[J].Nucleic Acids Res,1990(18):2 163-2 170.

[2] 肖前軍.遞歸迭代函數系統對基于detailed-HP模型的蛋白質序列的混沌游戲表示的模擬[J].湘潭師范學院學報(自然科學版),2008,30(1):14-17.

[3] 肯尼思·法爾科內.分形幾何中的技巧[M].曾文曲,王向陽,陸夷,等,譯.沈陽:東北大學出版社,1999.

[4] 肯尼思·法爾科內.分形幾何——數學基礎及其應用[M].曾文曲,王向陽,陸夷,等,譯.沈陽:東北大學出版社,2001.

[5] 肖前軍.功能蛋白質序列的混沌游戲表示及其遞歸迭代函數系統模擬[D].湘潭:湘潭大學數學與計算科學學院,2008.

[6] Lau K S,Anh V V,Yu Z G.Recognition of an organism from fragments of its complete genomes[J].Physical Review E,2002(66):0319101-9.

[7] 喻祖國,Vo Anh,劉家成.迭代函數系統模型在生物序列分析中的應用[J].湘潭大學(自然科學學報),2003(9):131-139.

[8] Yu Z G,Anh V V,Wanliss J A,et al.Chaos game representation of the dst index and prediction of geomagnetic storm events[J].Chaos,Solitons and Fractals,2007(31):736-746.

[9] Vrscay E R.Fractal geometry and analysis,chapter iterated function systems:theory,applicationsand the inverse problem[M].Dorsrecht:Kluwer,1991:405-468.

[10] Yu Z G,Shi L,Xiao Q J,et al.Simulation for chaos game representation of genomes by recurrent iterated function systems[J].J Biomedical Science and Engineering,2008(1):44-51.

[11] 孫嘯,陸祖宏,謝建明,等.生物信息學基礎[M].北京:清華大學出版社,2005.

[12] Yu Z G,Anh V V,Lau K S.Chaos game representation of protein sequences based on the detailed HP model and their multifractal and correlation analyses[J].Journal of Theoretical Biology,2004(226):341-348.

[13] Yu Z G,Anh V V,Lau K S.Fractal analysis of measure representation of large proteins based on the detailed HP model[J].Physica A:Statistical and Theoretical Physics,2004(337):171-184.

Optimization of Simulation for Chaos Game Representation of Protein Sequence

XIAO Qian-jun,ZHOU Jin-yu,DENG Zong-gang

(Hunan Vocational College of Science and Technology,Xiangtan 411104,Hunan,China)

A fractal pattern is apparent in visual representation of a protein sequence:Chaos Game Representation(CGR).According to the mechanism of fractal forming,Chaos Game Representation(CGR)of protein sequences can be simulated by Recurrent Iterated Function System(RIFS).In experiments,a close approximation of CGR is obtained by the method.The results of simulation can be further optimized and the phylogenetic tree can be correctly worked out.

iterated function system;chaos game representation;simulation;protein sequence;optimization

O 29;O 811.4;Q 516

A

1001-4217(2010)01-0035-07

2009-06-24

肖前軍(1978-),男,湖南湘潭人,講師.研究方向:分形幾何與生物信息學.E-mail:xqjxt@126.com

2008年湖南省教育廳項目(08C882)

猜你喜歡
游戲效果系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
按摩效果確有理論依據
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
數獨游戲
瘋狂的游戲
飛碟探索(2016年11期)2016-11-14 19:34:47
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
主站蜘蛛池模板: 91亚洲精选| 人妻丰满熟妇AV无码区| 91精品国产自产91精品资源| 国产麻豆aⅴ精品无码| 免费在线播放毛片| 91视频精品| 久久综合结合久久狠狠狠97色| 精品国产www| 美女黄网十八禁免费看| 日韩区欧美区| 欧美色视频在线| 九九久久99精品| 黄色在线网| 日韩精品一区二区三区免费在线观看| 国产美女精品一区二区| 国产精品 欧美激情 在线播放| h网址在线观看| 色婷婷在线播放| 国产玖玖视频| 亚洲人成色在线观看| 午夜少妇精品视频小电影| 一区二区影院| 国产日韩欧美中文| 国产色伊人| 欧美一级夜夜爽www| 国产精品3p视频| 亚洲日韩精品伊甸| 久久综合色天堂av| 亚洲无卡视频| 国产精品无码作爱| 亚洲AV无码一区二区三区牲色| 亚洲综合片| 538国产在线| 婷婷激情五月网| 91综合色区亚洲熟妇p| 女人18毛片水真多国产| 波多野结衣国产精品| 中文字幕 欧美日韩| 日韩精品一区二区深田咏美| 久久国产乱子| 91九色国产在线| 黄色福利在线| 亚洲色图狠狠干| 国产小视频免费| 91美女视频在线| 一级在线毛片| 国产自在自线午夜精品视频| 一级一级特黄女人精品毛片| 伊人AV天堂| 美女一区二区在线观看| 亚洲精品成人福利在线电影| 中文精品久久久久国产网址 | 999在线免费视频| 亚洲av无码久久无遮挡| 美女无遮挡免费视频网站| 成人福利在线看| 久久美女精品| 精品国产香蕉在线播出| 久久精品丝袜| 国产主播福利在线观看| 国产 在线视频无码| 五月天福利视频| 特级做a爰片毛片免费69| 国产在线小视频| 黄色网址免费在线| 日本伊人色综合网| 色国产视频| 午夜一区二区三区| 精品久久久无码专区中文字幕| 欧美成人一区午夜福利在线| 久久人妻系列无码一区| 97国产在线播放| 久久精品无码中文字幕| 久久这里只有精品国产99| 亚洲另类色| 日本高清有码人妻| 国产资源站| 欧美精品三级在线| 国产日产欧美精品| 亚洲福利一区二区三区| 熟妇无码人妻| 扒开粉嫩的小缝隙喷白浆视频|