999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于序列的蛋白質相互作用預測方法研究進展

2020-02-19 12:16:05孫晶京
云南化工 2020年9期
關鍵詞:物種特征方法

孫晶京

(山西農業大學 文理學院,山西 太谷 030801)

蛋白質是生物大分子,可以與其他各種分子相互作用,如DNA、RNA、小的配體和其他蛋白質。這些相互作用是促進細胞中大多數生物學過程的主力,包括基因表達,細胞生長、增殖,營養吸收,形態,運動性,細胞間通訊以及細胞凋亡。在分子水平上了解這些相互作用對于開發新的治療方案,注釋蛋白質功能,研究疾病的分子機制以及描述蛋白質相互作用網絡非常重要。因此蛋白質的相互作用 (PPI)預測得到了研究人員的廣泛關注,并提出了很多方法,包括物理化學實驗方法和計算方法。物理化學實驗技術可以識別蛋白質之間的物理化學相互作用,進而可以預測蛋白質之間的功能關系。這些技術包括基于酵母雙雜交的方法、免疫共沉淀、串聯親和純化、蛋白質芯片和混合方法等。盡管這些技術已經成功地鑒定了幾種物種的幾種重要的相互作用蛋白,如酵母和擬南芥等,但是,實驗方法在檢測PPI方面存在費時費力、檢測效率低、難以識別弱相互作用等缺點。因此,人們開始尋求一些新的計算方法來驗證實驗結果并加速對未知蛋白質相互作用的預測。

1 計算方法

近年來,已提出許多用于預測蛋白質相互作用的計算方法。這些方法可以分為兩類:基于結構的預測和基于序列的預測。基于結構的預測方法受到由實驗確定的蛋白質結構相對較少的約束,相反,基于序列的預測方法只需要蛋白質序列即可預測蛋白質相互作用。因此,本文主要介紹基于序列的PPI預測方法的研究進展。

基于序列的PPI預測方法主要是利用氨基酸(AA)特性,比如疏水性,理化特性,進化譜,AA組成,AA平均值或滑動窗口上的加權平均值等。可以分為統計方法和機器學習的方法。

1.1 基于統計的預測方法

1.1.1 鏡像樹

Pazos和Valencia[1]提出的鏡像樹是一種基于統計的方法,基于相關蛋白質家族序列之間進化距離的比較和系統樹的拓撲相似性來預測PPI。其距離來自McLachlan氨基酸同源性矩陣的殘基相似性的平均值。將樹之間的相似度用于構建樹的距離矩陣之間的相關性。鏡像樹方法不需要創建系統樹,而僅分析基礎距離矩陣,因此,此方法獨立于樹的構建方法。盡管鏡像樹方法不需要完全測序的基因組,但要求在考慮的所有物種中都存在直系同源蛋白。所以,當更多的物種基因組可用時,可以應用的蛋白質就更少了。此外,由于距離矩陣不是系統樹的最佳表示,因此基于對距離矩陣的比較可能引入一些誤差。

1.1.2 共同進化差異

Liu等[2]提出了一種共同進化差異 (CD)的方法來預測人類蛋白質的相互作用。該方法基于兩個假設,一個是PPI對可能具有相似的替代率,另一個是,PPI更可能在相關物種之間保存。CD定義為兩個蛋白質之間取代率差異的絕對值。CD方法結合了來自許多物種的相互作用蛋白對的共同進化信息。該方法未使用多元比對,因此比其他比對方法(如鏡像樹)花費時間更少。該方法不要求所研究物種具有直系同源性的蛋白質,但增加物種數量有利于提高方法的準確性。盡管此方法可以確定給定蛋白質對相互作用的可能性,但它不能推斷相互作用的特定特征,如界面中的相互作用殘基。

1.2 基于機器學習的預測方法

1.2.1 自協方差

Guo等[3]提出了一種使用自協方差 (AC)和支持向量機 (SVM)來預測PPI的方法。其中用AC來表征序列中相距一定距離的殘基之間的相互作用。這樣蛋白質序列則由一系列AC表征,然后使用AC向量作為輸入,構建SVM模型。實驗表明,一個AA殘基與其30個鄰位AA的相互作用將有助于表征PPI信息。該方法的優點是AC包含了AA殘基的遠程相互作用信息,這在PPI識別中很重要。

1.2.2 相似比對

Zaki等[4]提出了一種基于蛋白質一級結構成對相似性比較的PPI預測方法。每個蛋白質序列通過滑動窗口創建的AA子序列的相似值來表示。然后使用這些值作為輸入,構建SVM模型。因此,蛋白質序列的相似性暗示了其同源性,也揭示了結構和功能的相似性。

1.2.3 氨基酸組分

Roy等[5]研究了氨基酸組分 (AAC)在PPI預測中的作用及其常見特征 (例如域、元組特征和標識產物特征)的性能。每個蛋白質對用AAC和域特征來表示。AAC以單體和二聚體特征來表示。單體特征是由單個AA特征組成,而二聚體特征是由連續AA對的特征組成。然后將這些特征離散化為二進制特征。域特征是由離散化的域名標識來表示。為了將AAC與其他基于非域序列的特征進行比較,創建了元組特征和標識產物特征。并使用三個機器學習分類器 (邏輯回歸,SVM和樸素貝葉斯)對提出的方法進行了評估。結果表明,AAC在不同數據集和分類器中所做的貢獻幾乎等同,這表明AAC包含了識別PPI的重要信息。AAC適用于任何蛋白質序列,尤其在缺乏域信息時非常有用。AAC也可以結合其他特征來提高PPI預測的能力。

1.2.4 蛋白質相互作用的通用計算機模擬預測器(UNISPPI)

Valente等[6]提出了UNISPPI方法。該方法使用20種AA理化性質的頻率和組成,用于訓練決策樹分類器。頻率特征集包括20個AA在蛋白質序列中的百分比。每個AA歸入與理化性質相關的三個不同組之一,并計算每個特征的每個組的百分比,最終得到共21個組成特征,從而構建了組成特征集。結果表明,僅使用AA頻率就足以預測PPI。另外,天冬酰胺,半胱氨酸和異亮氨酸的AA頻率是區分相互作用和非相互作用蛋白對的重要特征。UNISPPI的主要優點是簡單和計算成本低,因為少量特征用于訓練決策樹分類器。但是,決策樹分類器通常會出現過度擬合的問題。

1.2.5 ETB-Viterbi

Kern[7]提出的ETB-Viterbi是ipHMMs中的一種具有早期追溯機制的解碼算法 (“交互特征隱馬爾可夫模型”),該算法旨在最佳地將輸入序列中相互作用的AA殘基之間的長距離相關性納入其中。它能夠捕獲長距離相關性以提高預測精度,且不受序列方向的影響。但是,Viterbi算法在內存和計算時間上是非常昂貴的。因為隱馬爾可夫模型訓練涉及Viterbi算法的重復迭代,且可能無法收斂到給定訓練集的真正最佳參數集,也可能會出現過度擬合現象。

3 結語

本文對基于序列的蛋白質相互作用預測的計算技術進行了回顧,總結了幾種相關的現有方法,并對它們進行了分類和比較。顯然,為了達到合理的預測精度,PPI預測仍然需要大量的研究工作。在現有PPI預測方法中的特征更多關注AA理化性質,而忽略了蛋白質的生物學特性。在未來工作中,應更加關注將生物學知識納入預測方法中。

猜你喜歡
物種特征方法
吃光入侵物種真的是解決之道嗎?
英語世界(2023年10期)2023-11-17 09:18:18
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
回首2018,這些新物種值得關注
電咖再造新物種
汽車觀察(2018年10期)2018-11-06 07:05:26
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
瘋狂的外來入侵物種
捕魚
主站蜘蛛池模板: 中文字幕啪啪| 亚洲第一中文字幕| 91在线一9|永久视频在线| 亚洲欧洲日产无码AV| 亚洲日韩每日更新| 免费国产好深啊好涨好硬视频| 全午夜免费一级毛片| 美女无遮挡免费网站| 超薄丝袜足j国产在线视频| 在线观看国产黄色| 亚洲中久无码永久在线观看软件| 最新国产网站| 一边摸一边做爽的视频17国产 | 亚洲欧美另类日本| 国产 在线视频无码| 亚洲视频四区| 亚洲AV无码精品无码久久蜜桃| 日韩精品免费一线在线观看| 青青热久免费精品视频6| 成人免费视频一区二区三区| 亚洲国产成人久久精品软件| 99re视频在线| 四虎AV麻豆| 亚洲日韩精品无码专区| 欧美日韩资源| 国产真实乱人视频| 欧美精品1区2区| 真实国产乱子伦视频| 91久久国产成人免费观看| 亚洲国产天堂久久综合| 日韩av在线直播| 亚洲欧美成aⅴ人在线观看| 国产男人的天堂| 成人一级免费视频| 日日拍夜夜操| 麻豆国产精品视频| 国产女人水多毛片18| 久久久久无码精品| 精品一区二区无码av| 午夜视频免费试看| 国产夜色视频| 久青草免费在线视频| 亚洲精品国产首次亮相| 成·人免费午夜无码视频在线观看| 日本91在线| 日本中文字幕久久网站| 成人一级黄色毛片| 永久免费精品视频| 日韩精品久久久久久久电影蜜臀| 91成人在线免费观看| 久久香蕉国产线看精品| 国产美女精品一区二区| 日韩毛片视频| 国产迷奸在线看| 2021国产乱人伦在线播放| 欧美a在线视频| 人与鲁专区| 久久精品这里只有精99品| 亚洲制服丝袜第一页| 国产精品护士| 呦视频在线一区二区三区| 久久国产高潮流白浆免费观看| av在线手机播放| 特级做a爰片毛片免费69| 99ri精品视频在线观看播放| 午夜福利网址| 女人毛片a级大学毛片免费| 999精品免费视频| 老司国产精品视频| 国产精品刺激对白在线| 国产主播喷水| 中美日韩在线网免费毛片视频| 在线免费观看AV| 日本欧美午夜| 国产91在线|中文| 六月婷婷综合| 亚洲色图另类| 亚洲天堂2014| 午夜a级毛片| 国产18页| 无码福利视频| 国产a网站|