999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CASP10的模板依賴型蛋白質結構預測方法研究進展

2016-10-14 19:39:40畢瀟文李娟方慧生
醫學信息 2016年7期
關鍵詞:結構方法模型

畢瀟文 李娟 方慧生

摘要:CASP(critical assessment of structure prediction)是代表蛋白質結構預測領域的世界前沿水平的評比活動。模板依賴型蛋白質結構預測方法(Template-based modeling,TBM)可以進行蛋白質結構與功能關系分析及蛋白質分子設計。本文詳細綜述了CASP10中靶蛋白收集、預測模型收集和方法評估以及利用分析討論得出的CASP10中最佳5種模板依賴型蛋白質結構預測方法,可對研究蛋白質組尤其是對那些通過實驗難以測定結構的蛋白質分析則具有理論意義與實用價值。

關鍵詞:CASP10;蛋白質結構預測模型質量評估;模板依賴型蛋白質結構預測方法

Abstract:CASP is the assessment activities representative of the world advanced level of protein structure prediction . TBM can analyze the relationship between structure and function of proteins and protein molecular design. This paper reviews target protein collection, prediction model collection , evaluation measures and the top5 template-based protein structure prediction methods through the analysis and discussion in CASP10. For proteome studying,especially for those who is difficult to determine the protein structure through experiment analysis has theoretical significance and practical value.

Key words:CASP10; Evaluation measures ;Template-based modeling

迄今為止,蛋白質結構預測已經有近40年的歷史,期間,人們提出了一系列預測方法,取得了豐碩成果。自1994 年起每兩年在美國加利福尼亞州舉辦一次蛋白質結構預測評比活動-CASP。它代表著蛋白質結構預測領域的世界前沿水平,深入客觀的分析了當前的蛋白質結構預測技術水平, 認識到當前的方法能力與局限以及將來的發展方向。CASP 主要包括三部分:①靶蛋白質序列的收集;②蛋白質結構預測模型的收集;③蛋白質結構預測模型及預測方法的評估, 組織會議公布和討論結果。

1 CASP10簡介

1.1靶蛋白質序列的收集 在2012年舉辦的CASP10中,來自23個國家的217個預測小組以114個靶蛋白提交了超過66000個預測結果。所選擇的靶蛋白被分為全型靶蛋白和僅服務器靶蛋白。全型靶蛋白是從具有挑戰性的靶蛋白中選出來的典型例子,難度評估指標是基于啟發式搜索和PSI-BLAST模板搜索得出的[1]。并且,在CASP10中,考慮到模板的共識增加了目標類別定義的特殊性,基于得分和LOMETS線串比對的共同判斷將靶蛋白分為四組:平常組、簡單組、困難組和極其困難組。

1.2蛋白質結構預測模型的收集 靶蛋白預測結果公布的時間內,各個靶蛋白通過自動分配系統自動轉發給參賽服務器,追蹤收集服務器的狀況。經過初步評估服務器預測結果之后,預測小組提交較好的模型(GDT_TS[2,3]> 60)。在近三次的CASP比賽中,每次都有超多100個服務器小組參賽,服務器預測組數量超過了專家預測組,這反映了在結構預測方面自動化程度的提高。為了適應預測結果的龐大數據,修改了預測結果處理,存儲,評估和可視化的原則。在CASP10中,接受五種不同格式的預測結果:三級結構TS,殘基-殘基接觸RR,無序區域DR,模型質量評估QA,結合位點的預測FN。

1.3蛋白質結構預測模型及方法的評估 CASP10最大的變化是質量評估的分類,除了QA之外,稍微改變了RR和DR分類的規則,對每一個靶蛋白限制預測結果數目。在DR分類中,也開始要求殘基的預測結果以無序態。CASP10最明顯的改進是類別的精化。首次出現一個預測小組能成功的提高所有靶蛋白預測的準確度。令人鼓舞的是,這個結果由分子動力學方法得出的,顯示出更多的物理學衍生的方法可為模建做出貢獻。輔助接觸型模建新的分類結果證實這些方法可以與適量的額外信息產生更緊缺型的模型[3]。所有提交的模型以預測中心與獨立評估小組磋商得出的相應實驗參考結構為標準進行評估。為了進行評估,靶蛋白的結構序列,殘基編號,鏈ID需要與公布序列一致[4]。

RMSD[5]是CASP評估中第一個評估標準,并仍然使用。它很適合評估結構非常相似的兩個蛋白之間的差異,但當模建的模型結果非常偏離實驗結果的時候,就不是評估的最佳標準;GDT-TS[5,6]的開發是為了解決RMSD存在的不足之處,并在CASP中成為一個標準的評價標準。通過擴大閾值后的平均值,更能突出正確結構的得分;GDT-HA[5,6]是GDT-TS改進版,縮小了閾值,更適合高同源性靶蛋白骨架精度評估;GDT-SC[6]用臨近每一條側鏈末端特征原子來比較殘基位置,從而著重在側鏈位置上來突出模型之間差異;GDT-like[5,6]評估模板和模型靶蛋白殘基和相應的靶蛋白預測殘基全局相似性。這些得分,有序列依賴性性質,不能將模型與從與靶蛋白有高結構相似性的不正確構象區分開來,想要完全得出這些差異,用比對準確度得分AL0(AL4),可以顯示出比對正確對齊殘基所占比例。

CAD[7]是比較基于兩個結構殘基-殘基接觸域不同的一種新的評估標準,得分可幫助找到物理學上更加合理的模型;LDDT[8]是另一種最新推出的無疊合評估標準,是基于模型全原子距離圖譜和靶蛋白結構的比較。相似于CAD得分,非常適合在結構域動態存在的本地模型質量評估,仍然保留良好的相關性;SG[4]得分反映基于相應子結構局部相似性的模板-靶蛋白相似性,得出的是模型結構與靶蛋白球體一致的百分比;RPF[9]最初開發是用來評估NMR結構準確度的,類似于IDDT,它是一種基于比較模板和靶蛋白距離矩陣的無疊合標準。已經觀察到RPF值和GDT-TS/RMSD值有一個很強的相關性。

Molprobity[10]得分可幫助評估者區分正確和扭曲立體化學特征的模型。整體得分包括四個部分來評估結構定義的準確性:沖突得分,旋轉異構體異常得分,拉式構像圖偏離得分,拉式構象圖符合得分。

2 CASP10中最佳模板依賴型蛋白質結構預測方法

目前,常用的蛋白結構預測方法分為三類:①針對高相似序列的同源模建;②針對較低序列相似性的折疊識別;③不依賴于模板而利用物理學原理直接進行從頭計算。但實際上由于現在大多數從頭預測技術依賴結構數據庫和統計學原理及其他技術,為了研究需要,自CASP7開始,前兩者合并為模板依賴型蛋白質結構預測方法。CASP10選擇114個蛋白,因為各種原因,最后只包括96個序列,112個評估單元,其中有111個評估單元是基于模板模建的。

2.1自動化的結構評估打分 CASP允許每個提交者提供5個蛋白結構,每一個預測小組,只有命名為“模型1”的模型用于排名。自動化結構評估分為如下四步:①對提交的模型計算GDT-HA,GDC-all,LDDT-15,RPF-9;接著,計算這些打分的平均值和標準偏差,用于計算Z-得分;基于Z-得分,對預測小組進行排名,用來消除差模型造成的罰分。②Z-得分小于-2.0的直接排除;對每一評估單元計算,加入UB即最高得分后,重新計算GDT-HA,GDC-all,LDDT-15,RPF-9的平均值和標準偏差;同時當Z值小于-2時,設置Z值等于-2。③計算每一個度量的Z-得分,并進行求和。④計算了每個AU的得分,通過評估單元的數目分配綜合得分。而Z-得分只能用于確定前25組,不能用來確定排名,還需配對T檢驗進行重新排名,同時還對模型選擇對結果的影響做了分析。經過分析,CASP10評估認證Zhang-Server,QUARK,PMS, LEEcon,Zhang作為基于模板模建最佳預測小組[11]。

2.2最佳模板依賴型蛋白質結構預測方法方法簡介 QUARK[12]最開始是開發作為無需用到全局模板結構的蛋白質從頭結構預測的,開始于從非冗余PDB結構庫用無縫線串法得到的連續的分散片段集合。最后,這些片段被運用復制-交換蒙特卡洛模擬由距離輪廓和基于物理學和經驗誘發復合指導下組裝成全長模型。在新的開發中,從LOMETS線串比對提取的空間限制被用于協助QUARK結構重組模擬。

Zhang和Zhang-Server[13]方法是由I-TASSER與QUARK結合相互作用開發的。本質上是相同的,不同的是Zhang是采用的CASP10服務器上的模板,而后者采用的是內部線串方法得到的模板。整體結構預測包括以下三個基本步驟:①模型識別, 目標序列來自非冗余PDB結構庫,用LOMETS來確定合適的模板比對;②基于模板和從頭結構組裝;③模型的選擇與改進。運用7-MQAP方案來選擇模型,包括I-TASSER 的C-得分,TM-得分,五個統計指標(RW,RWplus, Dfire,Dope和verify3D)。最后,7個MQAP得分總和作為MQAP一致性得分,低一致性得分的模型最終被選擇出來用于提交。

PMS[14]是基于能量函數和蛋白質3D模型質量評估的全局優化方法,在側鏈原子細節模建以及主鏈結構模建的準確性來說相當成功。PMS對于蛋白質的3D模型的模建,開發了一種新的洛倫茲型能量項取代在MODELLER中使用的高斯型或樣條函數用于結構約束限制。利用構象空間退火來優化能量函數。對于模板選擇和比對,利用隨機森林算法開發了一種新的質量評估方法。在折疊識別步驟中,質量評估方法被用于重新排序由FOLDFINDER產生的候選模板。

LEEcon[15]相似于PMS,但是考慮到從FOLDFINDER獲得其他模板。Leecon模建是利用SERVER預測方法即從CASP10發布的所有SERVER模型最大集群中選擇模型的一致性方法。進行SERVER模型的結構集群,并確定出最大的集群。對于序列查詢,FOLDFINDER用域從PDB中識別最佳模板。排除掉與模板有幾乎相同的結構(TM-得分≥0.975)和很不相似的結構(TM-得分<0.65)。基于序列得分和基于3D得分結合起來,確定重心模板和次級可選模板。模板合并生成一個模板列表,對于每個模板列表,進行多重序列比對、側鏈構架、質量評估和側鏈重建。

3 總結和展望

掌握蛋白質的結構信息對于研究蛋白質的功能及作用機制具有重要意義。對于蛋白質結構和功能, 雖然可以通過實驗的方法來實現, 但當前的蛋白檢測技術水平還遠遠跟不上由“人類基因組計劃”不斷發展所產生的海量生物信息,所以利用蛋白質預測技術協助實驗科學變得尤為重要。CASP作為蛋白質結構預測領域的世界前沿水平代表,可以客觀的反映蛋白質結構預測技術水平。CASP10所得到的最佳5種模板依賴型蛋白質結構預測方法:Zhang-Server,QUARK, PMS,LEEcon,Zhang可對研究蛋白質組尤其是對那些通過實驗難以測定結構的蛋白質分析則具有理論意義與實用價值。并且首次出現一個由分子動力學方法得出的預測小組能成功的提高所有靶蛋白的準確度,顯示出更多的物理學衍生的方法可為模建做出貢獻。總之,藥物生物信息學對蛋白結構和功能的預測與實驗科學的發展結合起來,將給蛋白質設計、藥物設計等生命科學領域提供巨大的幫助。

參考文獻:

[1]Moult J, Fidelis K, Kryshtafovych A, et al. Critical assessment of methods of protein structure prediction (CASP)-round x[J]. Proteins: Structure, Function, and Bioinformatics, 2014, 82(S2): 1-6.

[2]Zemla A. LGA: a method for finding 3D similarities in protein structures[J]. Nucleic acids research, 2003, 31(13): 3370-3374.

[3]Kryshtafovych A, Fidelis K, Moult J. CASP10 results compared to those of previous CASP experiments[J]. Proteins: Structure, Function, and Bioinformatics, 2014, 82(S2): 164-174.

[4]Kryshtafovych A, Monastyrskyy B, Fidelis K. CASP prediction center infrastructure and evaluation measures in CASP10 and CASP ROLL[J]. Proteins: Structure, Function, and Bioinformatics, 2014, 82(S2): 7-13.

[5]Moult J. A decade of CASP: progress, bottlenecks and prognosis in protein structure prediction[J]. Current opinion in structural biology, 2005, 15(3): 285-289.

[6]Monastyrskyy B, Kryshtafovych A, Moult J, et al. Assessment of protein disorder region predictions in CASP10[J]. Proteins: Structure, Function, and Bioinformatics, 2014, 82(S2): 127-137.

[7]Olechnovi? K, Kulberkyt? E, Venclovas. CAD‐score: A new contact area difference‐based function for evaluation of protein structural models[J]. Proteins: Structure, Function, and Bioinformatics, 2013, 81(1): 149-162.

[8]Mariani V, Biasini M, Barbato A, et al. lDDT: a local superposition-free score for comparing protein structures and models using distance difference tests[J]. Bioinformatics, 2013, 29(21): 2722-2728.

[9]Huang Y J, Powers R, Montelione G T. Protein NMR recall, precision, and F-measure scores (RPF scores): structure quality assessment measures based on information retrieval statistics[J]. Journal of the American Chemical Society, 2005, 127(6): 1665-1674.

[10]Chen V B, Arendall W B, Headd J J, et al. MolProbity: all-atom structure validation for macromolecular crystallography[J]. Acta Crystallographica Section D: Biological Crystallography, 2009, 66(1): 12-21.

[11]Huang Y J, Mao B, Aramini J M, et al. Assessment of template‐based protein structure predictions in CASP10[J]. Proteins: Structure, Function, and Bioinformatics, 2014, 82(S2): 43-56.

[12]Xu D,Zhang Y.Ab initio protein structure assembly using continuous structure fragments and optimized knowledge‐based force field[J]. Proteins: Structure,Function,and Bioinformatics,2012, 80(7):1715-1735.

[13]Xu D, Zhang J, Roy A, et al. Automated protein structure modeling in CASP9 by I‐TASSER pipeline combined with QUARK‐based ab initio folding and FG‐MD‐based structure refinement[J]. Proteins: Structure, Function, and Bioinformatics, 2011, 79(S10): 147-160.

[14]Joo K, Lee J, Sim S, et al. Protein structure modeling for CASP10 by multiple layers of global optimization[J]. Proteins: Structure, Function, and Bioinformatics, 2014, 82(S2): 188-195.

[15]Lee J, Gross S P, Lee J. Modularity optimization by conformational space annealing[J]. Physical Review E, 2012, 85(5): 056702.

編輯/成森

猜你喜歡
結構方法模型
一半模型
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
論《日出》的結構
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 精品综合久久久久久97超人该| 亚洲人成网址| 国产视频欧美| 欧洲极品无码一区二区三区| 亚洲最黄视频| 国产精女同一区二区三区久| 蝴蝶伊人久久中文娱乐网| 77777亚洲午夜久久多人| 手机精品视频在线观看免费| 在线五月婷婷| 国产亚洲欧美日本一二三本道| 99久久精品免费看国产免费软件| 国产成人禁片在线观看| 91年精品国产福利线观看久久 | 国产成人精品男人的天堂下载| 国产成人乱无码视频| 鲁鲁鲁爽爽爽在线视频观看| 亚洲精品无码不卡在线播放| 午夜免费小视频| 免费激情网站| yy6080理论大片一级久久| 色一情一乱一伦一区二区三区小说| 性视频久久| 成人日韩精品| 国产精品天干天干在线观看 | 亚洲中文字幕精品| 成人国产精品2021| 国产日韩丝袜一二三区| 国产精品欧美激情| 国产美女无遮挡免费视频| 国产久草视频| 国产午夜无码片在线观看网站| 99视频在线看| 色综合天天娱乐综合网| 亚洲无线国产观看| 亚洲人成网站18禁动漫无码| a在线亚洲男人的天堂试看| 手机永久AV在线播放| 这里只有精品在线| 日本a∨在线观看| 99在线国产| 国产视频只有无码精品| 亚洲A∨无码精品午夜在线观看| 人人妻人人澡人人爽欧美一区| 国产精品毛片一区| 国产在线视频二区| 亚洲无限乱码一二三四区| 国产va视频| 四虎影视8848永久精品| 国产成人盗摄精品| 久久中文电影| 精品1区2区3区| 人妻精品久久无码区| 少妇精品在线| 精品国产美女福到在线直播| 香蕉视频在线观看www| 99在线观看免费视频| 波多野结衣无码AV在线| 欧美综合区自拍亚洲综合天堂| 成人福利在线观看| 亚洲综合日韩精品| 免费在线色| 1024国产在线| 成人无码一区二区三区视频在线观看 | 欧美高清视频一区二区三区| 成人在线不卡视频| AV不卡在线永久免费观看| 在线高清亚洲精品二区| 国产噜噜噜视频在线观看| 老司国产精品视频91| 精品伊人久久久香线蕉 | 亚洲最黄视频| 欧美国产日韩在线观看| 国产欧美日韩另类精彩视频| 亚洲欧洲一区二区三区| 久久精品这里只有精99品| 国内老司机精品视频在线播出| 欧美国产在线看| 中文字幕在线看视频一区二区三区| 日本人又色又爽的视频| 国产精彩视频在线观看| 欧美va亚洲va香蕉在线|