999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

正選擇位點及其計算軟件研究進展

2016-03-25 13:54:04夏云顏淵
長江大學學報(自科版) 2016年27期
關鍵詞:生物

夏云,顏淵

(武漢輕工大學生物與制藥工程學院,湖北 武漢 430030)

?

正選擇位點及其計算軟件研究進展

夏云,顏淵

(武漢輕工大學生物與制藥工程學院,湖北 武漢 430030)

隨著分子生物學實驗技術的發(fā)展和實驗方法的改進,如今已經(jīng)有大量的DNA相關數(shù)據(jù)。研究者從這些大數(shù)據(jù)中通過生物信息學的手段尋找關鍵的信息成為近年來的熱門。介紹了計算正選擇位點相關軟件的發(fā)展過程及其現(xiàn)狀。

正選擇位點;生物信息;分子進化

21世紀生物學面臨的一個難題,是弄清選擇作用和堿基替換的關系,從微觀角度來分析堿基的替換的原因。估算蛋白質編碼基因的同義替換和非同義替換的相關比率是分子水平研究生物體進化選擇的常用手段,近年來,越來越多相關領域的研究者使用該方法來計算正選擇位點,其使用到的相關軟件也一直在革新。

1 正選擇位點的研究

達爾文發(fā)表的《物種起源》指出自然選擇是使得物種進化的最主要動力。而20世紀60年代,中性主義學派代表Kimura(1968)提出了具有爭議的隨機漂變假說[1],認為在微觀分子水平上,絕大多數(shù)生物的演進不是因為自然選擇而引起的,而是因為某種隨機因素導致的等位基因通過遺傳漂變造成的,即大多數(shù)進化中核苷酸替代均是中性或者近中性的隨機因素突變。Saitou等[2]1987年提出雖然大多數(shù)的堿基替換都是隨機的,但確實存在部分的選擇性。微觀分子角度的進化分析主要分析核苷酸密碼子的替換情況。密碼子的堿基被替換后產(chǎn)生的新密碼子有以下情況:第一種,新的密碼子是同義密碼子,并不影響氨基酸的種類;第二種,新的密碼子改變了氨基酸的表達。第一種情況被稱為同義替換,第二種被稱為非同義替換。單位時間(每年或每代)內(nèi)在每個可能同義替換的位點上發(fā)生同義替代的數(shù)目被稱為同義替代速率,非同義替代速率類似,分別用DN和DS來表示。DN和DS的比值DN/DS是衡量選擇壓力的分子進化參數(shù),通常用ω表示。非同義替換對于生物體而言大多是有害的,純化選擇(purifying selection)可以使其逐漸減少,純化選擇在數(shù)據(jù)上的體現(xiàn)為DN/DS<1(ω<1),而有些少數(shù)的非同義替換,少數(shù)對于生物體而言是有益的堿基替換會被正選擇作用[3](positive selection)所保留,那么在數(shù)據(jù)上的體現(xiàn)為DN/DS>1(ω>1),另外中性選擇(neutral selection),DN/DS(ω=1)的期望值為1。

近些年,多數(shù)研究者通過計算DN/DS值來尋找正選擇位點,具有代表性的方法有進化通路法(evolutionary pathway methods)[4]、基于Kimura雙參數(shù)模型的方法(Methods based on Kimura’s 2-Parameter model)[5]、密碼子替代模型為代表的最大似然法。近些年最常用的是楊子恒的最大似然法(maximum likelihood)[6]。

2 計算正選擇位點的相關軟件

1997年,Yang等[7]發(fā)表了最大似然法系統(tǒng)進化分析軟件包PAML。2007年,Yang等[8]又發(fā)表了PAML4,通過軟件的迭代,對程序和算法進行了優(yōu)化,但是程序仍然不具備圖形操作界面,對于大多數(shù)剛接觸的使用者來說上手難度很大。

2008年,Egan等[9]發(fā)表了IDEA:Interactive Display for Evolutionary Analyses,針對PAML的codeml和baseml 2個程序設計出圖形化操作界面的軟件IDEA;形象的圖形界面使得相比以前代碼形式的輸入和輸出文件而言,易用性大大提高。IDEA支持并行運算,許多PAML的分析都需要輸入系統(tǒng)發(fā)育樹文件,IDEA的一個好處在于整合了PHYLIP,可以讓使用者在開始分析的時候軟件自行調(diào)取PHYLIP。IDEA最大的好處在于輸出結果的界面非常直觀,將結果完全可視化的輸出,不僅用不同顏色表示高概率證選擇位點,而且將PAML不同模型輸出結果的似然比檢驗值直接顯示在操作界面,省去了使用者部分的工作。

2013年,Xu等[10]發(fā)表了基于可視化圖形操作界面的PLAMX,相較于之前版本,雖然易用性提高了很多,但僅僅是在參數(shù)設置界面進行可視界面化,因此易用性還有很大提升空間。

3 使用正選擇位點計算軟件中遇到的問題

3.1 安裝問題

通常生物信息學計算軟件都基于Linux環(huán)境,雖然很多軟件有簡易的網(wǎng)頁版,網(wǎng)頁版生物信息軟件有諸多限制,往往研究還是需要用到本地安裝版生物軟件。但很多研究者往往輸入的序列樣本比較龐大,多數(shù)軟件以源代碼的形式給出,大多軟件使用的開源依賴包,軟件所涉及到的依賴包并不包括軟件本身。當前國內(nèi)Windows在操作系統(tǒng)中占絕對主導,在此環(huán)境下,對大多數(shù)生物專業(yè)的研究者來說,即便安裝后,缺乏可視化圖形操作界面對于快速掌握生物學軟件而言仍然有很大障礙。相比于其他的同類軟件,IEDA安裝比較復雜,涉及到多個依賴包,安裝起來難度很大。

3.2 運算速度問題

在序列量較大、需要測定的次數(shù)較多的情況下,PAML和大多生物信息學軟件一樣,計算的效率往往較低。其原因是因為近年來隨著測序技術的發(fā)展,所測基因序列也越多,運算的基因序列越來越長,PAML的計算性能跟不上計算需求。情況與MrBayes等軟件類似,早些年使用MrBayes時運算序列較大的情況下需要數(shù)月的時間才能得出結果,中間要保持計算機的運行狀態(tài),如若中斷,則需要重新進行運算。隨后,MrBayes軟件在MacOS環(huán)境下推出了支持多核心多線程的并行運算,用常規(guī)4核心8線程的計算機進行運算,其效率提高了8倍。更值得關注的是,最近幾年基于GPU的計算應用非常多,Mrbayes等生物信息軟件有基于GPU運算的版本。由于GPU計算核心有上千個,充分利用GPU運算可以大大增加運算效率,縮短運行時間。近些年來,相較于CPU計算能力提升而言,GPU的計算能力提高很大,使用GPU并行運算的效率會提高數(shù)十倍。

有些研究者指出,PMAL由于涉及到的模型十分復雜,參數(shù)眾多,計算非常耗時。對于PMAL中計算正選擇位點的codeml軟件包,有研究者提出了CPU并行方案[11]。通過實際操作實驗表明,多核心CPU并行運行codeml可以使其速度有效提高。使用常規(guī)四核心CPU加速比高達約8倍。最佳的解決方案是期待將來實現(xiàn)GPU甚至是GPU和CPU一起并行的計算方案。這樣用服務器CPU和GPU進行運算,加速效率應該提升數(shù)十倍甚至更高,尤其是在2016年GPU進入帕斯卡構架[12]后,對于運算性能有質的提升,這樣面對當下研究者計算大量數(shù)據(jù)速度緩慢的問題可以得到解決。

4 關于計算正選擇位點相關軟件的最新進展

在2016年,高芳鑾等對原來的PMAL軟件包中最核心的CodeML程序進行了革新,推出了適合絕大多數(shù)生物研究者使用的EasyCodeML(Gao F L等. EasyCodeML:an interactive visual tool for CodeML analysis,2016.尚未發(fā)表)。此軟件的優(yōu)點提供2種模式:預置模式和自定模式。以往的CodeML程序中,晦澀的參數(shù)設置是大多數(shù)運用正選擇位點相關軟件的研究者最大障礙之一。軟件的預置模式內(nèi)置了4種模型,均是以成對模型進行運算,解決了繁瑣參數(shù)設置的問題。軟件的自定義模式和2013年Xu等[10]發(fā)表的PAMLX版本類似,參數(shù)設置菜單具有圖形輸入界面。相比之前的相關軟件,EasycodeML支持文件拖拽功能,能可視化標記樹的分支,解決了以往軟件手動代碼標記易錯的問題。EasyCodeML運算完成后可以自動完成Likelihood ratiotestes(LRT)分析,其結果可以直接導出Excel,易用性大大提升,非常符合國內(nèi)研究者的使用習慣。而且軟件不僅支持多線程操作,還支持多平臺,如常見的Windows、Mac OS以及Linux等。近十年來,計算正選擇位點的相關軟件一直在發(fā)展,易用性逐步提高。可以說EasycodeML在易用性和兼容性上達到了一個新的高度。

[1]Kimura M.Evolutionary rate at the molecular level[J].Nature,1968,217:624~626.

[2]Saitou N,Nei M.The neighbor-joining method:a new method for reconstructing phylogenetic trees[J].Mol Biol Evol,1987,4:406~425.

[3]Yang Z,Nielsen R. Estimating synonymous and non-synonymous substitution rates under realistic evolutionary models[J].Mol Biol Evol,2000,17:32~43.

[4]NeiM,Gojobori T. Simple methods for estimating the numbers of synonymous and nonsynonymous nucleotide substitutions[J].Mol Biol Evol,1986,3:418~426.

[5]Li WH,Wu C I,Luo C C. A new method for estimating synonymous and nonsynonymous rates of nucleotide substitution considering the relative likelihood of nucleotide and codon changes [J]. Mol. Biol. Evol,1985,2:150~174.

[6]Yang Z,Bielawski J P. Statistical methods for detecting molecular adaptation[J].Trends in Ecology and Evolution,2000,15:496~503.

[7]Yang Z. PAML:a program package for phylogenetic analysis by maximum likelihood [J].Computer Applications in Biosciences,1997,13:555~556.

[8]Yang Z. PAML 4:a program package for phylogenetic analysis by maximum likelihood [J].Molecular Biology and Evolution,2007,24:1586~1591.

[9]Egan A,Mahurkar A,Crabtree J,etal.IDEA:Interactive Display for Evolutionary Analyses [J]. BMC Bioinformatics,2008,9:524.

[10]Xu B,Yang Z. PAMLX:a graphical user interface for PAML[J].Mol Biol Evol,2013,30:2723~2724.

[11]楊菊吳,卓鋒,王剛,等.多核平臺PAML并行算法研究[J].計算機工程與科學,2013,35(9):15~19.

[12]Manuel Ujaldón.CUDA Achievements and GPU Challenges Ahead[J].Articulated Motion and Deformable Objects,2016,9756:207~217.

2016-08-30

夏云(1991-),男,碩士生,研究方向為分子生物學, mm800@qq.com。

Q75;Q-31

A

1673-1409(2016)27-0051-03

[引著格式]夏云,顏淵.正選擇位點及其計算軟件研究進展[J].長江大學學報(自科版),2016,13(27):51~53.

猜你喜歡
生物
生物多樣性
天天愛科學(2022年9期)2022-09-15 01:12:54
生物多樣性
天天愛科學(2022年4期)2022-05-23 12:41:48
上上生物
發(fā)現(xiàn)不明生物
科學大眾(2021年9期)2021-07-16 07:02:54
史上“最黑暗”的生物
軍事文摘(2020年20期)2020-11-28 11:42:50
第12話 完美生物
航空世界(2020年10期)2020-01-19 14:36:20
最初的生物
自然生物被直銷
清晨生物初歷直銷
生物的多樣性
主站蜘蛛池模板: 亚洲香蕉伊综合在人在线| 欧美丝袜高跟鞋一区二区| 四虎永久免费地址在线网站| 欧美97色| 啊嗯不日本网站| 欧美精品在线看| 日韩欧美国产区| 女同久久精品国产99国| 99这里精品| 在线观看亚洲人成网站| 亚洲人成电影在线播放| 97视频免费在线观看| 欧美综合中文字幕久久| 国产一区二区人大臿蕉香蕉| 热久久这里是精品6免费观看| 中文字幕调教一区二区视频| 亚洲日韩高清在线亚洲专区| 国产美女精品一区二区| 亚洲色图欧美| 国产综合精品一区二区| 色婷婷视频在线| 中文字幕在线看视频一区二区三区| 大香网伊人久久综合网2020| 精品亚洲国产成人AV| 精品一區二區久久久久久久網站| 国产成人亚洲欧美激情| 国产极品美女在线| 国产尤物视频在线| 中文字幕亚洲乱码熟女1区2区| 亚洲综合婷婷激情| 中国毛片网| 久久国产av麻豆| 波多野结衣二区| 噜噜噜久久| 国产美女无遮挡免费视频| 中文字幕在线看| 免费高清自慰一区二区三区| 人妻无码中文字幕第一区| 日本高清视频在线www色| 第一区免费在线观看| 少妇精品网站| 丝袜亚洲综合| 国产va在线观看| 天堂中文在线资源| 黄色a一级视频| 成人伊人色一区二区三区| 久久黄色视频影| 欧美中文一区| 国产精品美人久久久久久AV| 亚洲无码电影| 日韩黄色大片免费看| 亚洲色欲色欲www网| 久久亚洲国产最新网站| 亚洲欧美综合精品久久成人网| 91麻豆精品视频| 久久香蕉欧美精品| 欧美精品亚洲日韩a| 91亚洲视频下载| 欧美成人午夜视频| 国产啪在线91| 亚洲有码在线播放| 在线人成精品免费视频| 精品一区国产精品| 欧美怡红院视频一区二区三区| 四虎在线高清无码| 国产二级毛片| 欧美日本激情| 成年女人a毛片免费视频| 中国一级毛片免费观看| 极品尤物av美乳在线观看| 国产精品三区四区| 国产va免费精品观看| 精品午夜国产福利观看| 最新国产精品第1页| 久久免费成人| 美女扒开下面流白浆在线试听| 日韩成人免费网站| 在线一级毛片| 啪啪免费视频一区二区| 性视频一区| 精品少妇人妻无码久久| 亚洲高清资源|