999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

線性B細胞表位預測方法研究進展①

2017-09-21 02:18:21羊紅光
中國免疫學雜志 2017年9期
關鍵詞:方法

程 華 成 彬 羊紅光

(河北省科學院生物研究所,石家莊050081)

線性B細胞表位預測方法研究進展①

程 華 成 彬②③羊紅光③

(河北省科學院生物研究所,石家莊050081)

在抗原抗體的結合反應中,抗體參與結合的部位稱抗體的對位(Paratope),抗原參與結合的部位稱抗原的表位(Epitope)[1]。表位就是抗原中能被免疫細胞特異性識別的線性片段或空間構象性結構,是引起免疫應答和免疫反應的基本單位。

表位是蛋白質抗原性的基礎,在蛋白的特異性抗體制備、疫苗的計算機輔助設計,特別是近期具有很大潛力的腫瘤免疫療法中都具有非常重要的作用[2]。掌握了表位的規律將有助于繪制抗原表位圖譜、降低蛋白質藥物的免疫原性以及設計無毒副作用的人工疫苗等。近幾年以來,隨著免疫學理論、生物物理學及計算機技術的進步和廣泛應用,蛋白質B細胞抗原表位的研究方法有了新的進展,一些適應于蛋白質抗原表位研究的實驗檢測和理論預測方法相繼被發現[3,4]。本文就線性B細胞表位預測方法及相關數據庫的最新進展作一綜述,并指出當前存在的問題和未來發展的方向。

1 抗原表位的分類

目前,抗原表位有兩種分類方法[5]:一種是按與抗原受體細胞結合不同,分為B細胞抗原表位和T細胞抗原表位;另一種是按表位結構不同分為連續性抗原表位和不連續性抗原表位。前者又稱線性表位,是由肽鏈上順序連續的氨基酸組成;后者又稱構象抗原表位,是由那些空間鄰近但順序上不連續的氨基酸組成。線性表位可見于T細胞表位和部分B細胞表位,構象抗原表位只見于B細胞抗原表位。

2 線性B細胞表位預測方法

早期的線性B細胞表位預測基本上都是根據20種氨基酸的理化性質、結構特點及統計學等指標來進行的。人們通過觀察抗原表位與已知氨基酸序列的蛋白質的某些關系,發現一些蛋白質的序列或結構特征與形成表位有關,于是提出了單一參數預測及多參數復合預測等方法。

2.1單一經典參數預測

2.1.1可及性(Accessibility) 指蛋白質中氨基酸殘基被溶劑分子接觸的可能性,反映了蛋白質內、外各層殘基的分布情況。1979年Janin[6]統計了20種氨基酸在22個不同蛋白質中的位置數據,發現極性氨基酸更容易暴露在蛋白質的外表,而非極性氨基酸則多位于蛋白質的內部。在結合自由能的基礎上,根據氨基酸在蛋白質內部和外表的位置頻率,作者得到了判斷某個氨基酸構成表位的幾率數據。

2.1.2親水性(Hydrophilicity) 一般認為蛋白質抗原各氨基酸殘基可分為親水性殘基和疏水性殘基兩類,疏水性殘基多埋在蛋白內部,而親水性殘基則位于蛋白表面,因此蛋白的親水部位與蛋白抗原表位有密切的聯系。常用的有Hopp-Woods參數和HPLC親水參數。1981年Hopp等[7]做了開創性的工作,他們以6個多肽殘基為一個研究單元,以有機相環境轉移到水相環境的自由能為依據,計算出各種氨基酸的親水性數據。利用這些數據能夠對蛋白做出親水性曲線,連續的高峰區則是潛在的表位區域。5年后Parker等[8]利用高效液相色譜技術重新對20種氨基酸的親水性進行了測定,他們檢測了每種氨基酸的保留時間,以此為依據計算出了不同氨基酸的親水性參數。

2.1.3抗原性(Antigenicity) 1985年Welling等[9]通過對20個已知表位的蛋白質中氨基酸進行統計分析,得到每種氨基酸出現在抗原區的頻率,將此頻率除以各氨基酸在所有蛋白質中的頻率就可得到一個比值,即抗原性參數。該研究發現疏水性氨基酸殘基對抗原表位形成亦有貢獻。1990年Kolaskar等[10]統計了已知34個蛋白質中的156個長度不超過20個氨基酸的線性表位。以氨基酸的統計數據為基礎,結合親水性、可及性及柔韌性,作者計算出了每種氨基酸位于蛋白質表面的概率。每種氨基酸位于表位的概率除以位于蛋白質表面的概率,即得到抗原特性值Ap。

2.1.4可塑性(Flexibility) 蛋白質多肽鏈骨架有一定程度的活動性,抗原抗體相結合時常涉及構象上的相互契合,活動性強的氨基酸殘基即可塑性大的位點,易形成抗原表位。Karplas等[11]根據31個已知結構蛋白質在不同溫度下多肽鏈骨架的變形程度,將氨基酸分為可塑性和不可塑性兩大類,在參考前后氨基酸碳鏈可塑性對中間氨基酸的影響后,發展出了一種預測蛋白質片段活動性的方法。

2.1.5二級結構預測 (Secondary structure) 蛋白質的二級結構α螺旋、β片層及β轉角等空間構象也可用于表位預測。一般認為β轉角多位于蛋白質表面,利于與抗體結合,較可能成為表位。而α螺旋和β片層結構位于內部,較難嵌和抗體,不易形成表位。1993年Pellequer等[12]根據氨基酸在4種不同空間結構中的頻率,得出β轉角參數。

2.2多個經典參數復合預測 通過比較上述各種單參數的預測,發現正確率均不是太高。隨后研究人員逐漸提出了各自不同的綜合分析方法,以期提高預測的準確率。1988年Jameson和Worf[13]提出一種綜合預測方案。該方案選取了4種參數,并且對各參數賦予了不同的權重,即二級結構預測是40%,親水性參數是30%,可及性和柔韌性參數各占15%。作者利用該方案,對多個蛋白質進行了表位預測,得到了較為理想的結果。1997年萬濤等[14]綜合了5種參數,即Hopp親水性、HPLC親水性、可及性、抗原性方案和二級結構參數。作者利用含有169個已知抗原位點的34個蛋白質對這5種參數進行綜合測試,得出的結論是Hopp親水性參數和可及性參數在預測中占有重要位置,權重分別能夠達到0.36,而HPLC親水性也是比較重要的一個參數,權重達到0.18。利用這個綜合預測模型,作者對5個蛋白進行了預測,準確率接近50%。

2000年Alix[15]提出了抗原性指數Antigenic Index(AG),并且使用C+語言編寫了一個基于DOS操作系統的預測軟件PEOPLE(Predictive estimationof protein linear epitopes)。他采用了與Jameson[13]相同的4個參數及權重。不同的是每種參數中,作者都選取了多個文獻中的數據,所以他的結果要比Jameson的更加全面。2004年Saha等[16]使用7種單參數(親水性參數、可及性、柔韌性、表面特征、極性特征、β轉角參數和抗原性參數)建立了多種不同的組合,結果發現以柔韌性為主輔以親水性及極性特征的組合,預測的準確率最高,達到58.7%。同時作者編寫了一個預測軟件BcePred供其他研究人員免費使用。Blythe等[17]利用50個蛋白質表位檢驗了AAindex數據庫中484個氨基酸參數,發現即使結合了最好的參數,比隨機法也僅有少許提高。多參數綜合雖然比單個參數的預測準確率提高了一些,但結果依然不能讓大家感到滿意。

2.3基于機器學習算法的預測 隨著21世紀初多種機器學習算法的出現,研究人員將這些方法引入到表位預測的工作中,即機器學習方法嘗試從一套學習樣本中抽提出表位的共同特點,概括為一個分類算法。結果表明準確率較傳統方法有一定的提高,將B細胞表位預測方法引入了一個新的方向。

2006年4月Larsen等[18]將兩種經典參數HPLC親水性、二級結構參數與一種機器學習算法--隱馬爾科夫模型(HMM,hidden Markov model)相結合,提出預測方法Bepipred。隱馬爾科夫模型是一種統計分析模型,能夠從可觀察的參數中確定該過程的隱含參數,然后利用這些參數來作進一步的分析。Larsen方法的AROC評分達到0.671,比隨機預測法和基于參數的方法有一定提高。4個月后Saha等[19]提出了基于人工神經網絡模型的B細胞表位預測(Artificial neural network basedB-cell epitope prediction server,ABCpred)。人工神經網絡模型是一種運算模型,是由大量處理單元互聯組成的并行分布式、非線性、自適應信息處理系統。Saha的系統利用了Bcipep數據庫中700個非冗余B細胞表位和Swiss-Prot數據庫的700個長度為10~20個氨基酸殘基的隨機多肽為訓練對象,在預測長度為16個氨基酸的表位時,其總體準確率接近66%。

2007年Chen等[20]首次使用機器學習算法(Amino acid pair,AAP),他們利用Bcipep數據庫中872個已知B細胞表位和872個非表位隨機多肽進行訓練,結果表明單獨使用AAP時,準確率為71%。而在結合了傳統參數如親水性、可及性等參數后,其準確率可以達到72.5%。2008年Leslie和Manzalawy等[21,22]將4種字符串函數引入到機器學習算法支持向量機(Support vector machine,SVM)中,這四種字符串函數分別是光譜函數、錯配函數、局部對比函數和超序列函數。支持向量機是一種監督學習模型,可以分析數據,識別模式,用于分類和回歸分析。Manzalawy利用Bcipep數據庫中701個已知B細胞表位和701個非表位隨機多肽進行訓練,結果表明當超序列函數與SVM相結合時,準確率能達到75.8%。作者分別編寫了2種不同的程序BCPred和FBCPred來進行固定長度表位(12、14、16、18和20個氨基酸)及可變長度表位的預測。

2009年Sweredoski和Baldi[23]推出了COBE pro,一個分兩步來預測線性B細胞抗原表位的系統。第一步該系統對待測蛋白進行表位分析,找出所有潛在的表位,第二步則對找到的所有表位逐一進行分值運算,按分值高低進行排序。經過與現有的幾種算法進行比較后作者發現該系統具有一定的競爭力。同時能夠對所預測的表位按分值進行排序的特點將非常有助于使用者進行表位篩選工作。2011年Wang等[24]提出了一個新的預測體系Linear Epitope Prediction System (LEPS),該體系結合了SVM和其他相關數據,使用了4個不同的數據庫(AntiJen,HIV,PC和AHP)來進行訓練。在與現有4種預測方法(BepiPred,ABCPred,BCPred和FBCPred)進行比較后,作者發現LEPS預測特異性最高能達到88.33%,準確率方面最高能達到73.81%,具有明顯的優勢。

2013年Lin等[25]提出BEEPro,該方法將包括氨基酸比例參數、位置特異性得分矩陣(Position specific scoring matrix,PSSM)及14種氨基酸物理化學特性在內的16種參數與Support Vector Machine (SVM)相結合。作者使用了6個不同的數據庫(Sollner、AntiJen-1、AntiJen-2、HIV、Pellequer和PC)來訓練該體系。最終作者認為多理化參數預測的結果明顯要好于單個參數的結果。同時,在與現有5種已知預測方法(LEPS、BepiPred、ABCPred、BCPred和FBCPred)進行比較后,作者發現BEEProS預測特異性是94.33%~99.46%,準確率為93.73%~99.29%,具有非常明顯的優勢。2個月后Singh等[26]首次使用全部經過實驗驗證的49 694個表位序列和50 324個非表位多肽序列進行數據的訓練,并將這些數據分為了5個包括固定長度和可變長度不同的數據庫。作者認為與以往使用隨機多肽作為非表位肽進行訓練的方法相比,他們使用經實驗確定的非表位多肽序列,將得到更為可信的預測結果。

2014年Lian等[27]提出了基于多元線性回歸的表位預測(Epitope prediction using the multiple linear regression,EP MLR),一種基于MLR的線性表位預測系統。作者從BEOracle中選取了300個線性表位和300個隨機多肽作為訓練對象,在與現有3種預測方法(ABCPred、BCPred和LEPS)進行比較后,作者發現EP MLR在預測特異性和準確率方面與這些預測方法基本一致。2015年Shen等[28]提出了一種將a mino acid anchoring pair composition(APC)和SVM兩種機器學習相結合的預測系統APCpred。作者使用了6個表位數據庫對該系統進行訓練,分別是BC1727、Chen872、ABC16、Blind387、Lbtope-Confirm及FBC934。在與現有3種預測方法(ABCPred、BCPred和LEPS)進行比較后,作者發現APCpred在預測特異性和準確率方面與這些預測方法基本一致。

2.4各種預測方法比較 對目前各種預測方法進行了比較,見表1。

3 線性B細胞表位在線預測網站

目前多個研究小組在互聯網上發布了線性表位的預測網址,總結見表2。

表1各種預測方法比較

Tab.1Compareofdifferentpredictionmethods

PreditionMethodFeaturesUsedCharacteristicApplicationSingleclassicparame-terAccessibility,HydrophilicityAntigenicity,Flexi-bilitySecondarystructureSimplemethod,LowaccuracyBasicallynouseMulitpleclassicparam-eterssameasaboveTheintroductionoftheconceptofweight,me-diumaccuracyNarrowapplicationrangeSinglemachinelearn-ingapproachHiddenMarkovmodel,Artificialneuralnet-work,SupportVectorMachineBasedontheexistingdatabase,speedcompu-tingsystem,highaccuracyWideapplicationCombinationofmach-inelearningandclassicmethodAccessibility,HydrophilicityAntigenicity,Hid-denMarkovmodel,Artificialneuralnetwork,SupportVectorMacMultiplemethods,highaccuracyWideapplication

表2線性B細胞表位預測網址

Tab.2WebsiteoflinearB-cellepitopesprediction

TimeNameWebsiteReference2004BcePredhttp://www.imtech.res.in/raghava/bcepred/[16]2006BepiPredhttp://www.cbs.dtu.dk/services/BepiPred/[18]2006ABCpredhttp://www.imtech.res.in/raghava/abcpred/[19]2007VaxiJenhttp://www.jenner.ac.uk/VaxiJen[29]2008BCPREDShttp://ailab.ist.psu.edu/bcpred/pre-dict.html[21-22]2009COBEprohttp://scratch.proteomics.ics.uci.edu[23]2009Epitopiahttp://epitopia.tau.ac.il/[30]2011LEPShttp://leps.cs.ntou.edu.tw[24]2012IEDBhttp://tools.iedb.org/main/bcell/[31]2013LBtopehttp://crdd.osdd.net/raghava/lbtope/index.php[26]2014EPMLRhttp://www.bioinfo.tsinghua.edu.cn/epitope/EPMLR/[27]2015APCpredhttp://ccb.bmi.ac.cn/APCpred/pre-diction.php[28]

4 小結與展望

表位是蛋白質抗原性的基礎,也與生物機體免疫調節密切相關,表位研究對疾病的診斷以及疫苗分子的設計等具有重要的意義。經過多年的研究積累,特別是近10年來機器學習算法和高速計算機技術的幫助,表位預測研究有了突飛猛進的發展,新預測方法和數據庫層出不窮。盡管如此,表位預測的總體表現尚不能令人十分滿意,多個方面仍需進一步改進和提高。相信隨著對蛋白質功能和結構研究的不斷深入,抗原表位及蛋白質3D結構數據庫的不斷豐富及生物信息學技術等學科的快速發展,表位預測的準確性也將進一步提升,人們對蛋白質抗原表位的研究將更加透徹。

[1] Van Regenmortel MH.The concept and operational definition of protein epitopes[J].Philos Trans R Soc Lond B Biol Sci,1989,323(1217):451-466.

[2] Daga DA,Davila ML.CAR models:next-generation CAR modificationsfor enhanced T-cell function[J].Mol Ther Onco,2016,3:16014-16021.

[3] Correia BE,Bates JT,Loomis RJ,etal.Proof of principle for epitope-focused vaccine design[J].Nature,2014,507(7491):201-206.

[4] Uhlen M,Bandrowski A,Carr S,etal.A proposal for validation of antibodies[J].Nature Methods,2016,13(10):823-827.

[5] Barlow DJ,Edwards MS,Thornton JM.Continous and discontinuous protein antigenic determinants[J].Nature,1986,322(6081):747-748.

[6] Janin J.Surface and inside volumes in globular proteins[J].Nature,1979,277:491-492.

[7] Hopp TP,Woods KR.Prediction of protein antigenic determinants from a mino acid sequences[J].Proc Natl Acad Sci,1981,78(6):3824-3828.

[8] Parker JMR,Guo D,Hodges RS.New hydrophilicity scale derived from high-performance liquid chromatography peptide retention data:correlation of predicted surface residues with antigenicity and X-ray-derived accessible sites[J].Biochemistry,1986,25:5425-5432.

[9] Welling GW,Weijer WJ,Vander ZR,etal.Prediction of sequential antigenic regions in proteins[J].FEBS Lett,1985,188(2):215-218.

[10] Kolaskar AS,Tongaonkar PC.A semi-emperical method for prediction of antigenic determinants on protein antigens[J].FEBS Lett,1990,276(1):172-174.

[11] Karplus PA,Schultz GE.Prediction of chain flexibility in proteins:a tool for the selection of peptide antigen[J].Naturwissenschaften,1985,72(4):212-213.

[12] Pellequer JL,Westhof E,Van Regenmortel MH.Correlation between the location of antigenic sites and the prediction of turns in proteins[J].Immunol Lett,1993,36(1):83-99.

[13] Jameson BA,Wolf H.The antigenic index:a novel algorithm for predicting antigenic determinants[J].Bioinformatics,1988,4(1):181-186.

[14] 萬 濤,孫 濤,吳加金.蛋白順序性抗原決定簇的多參數綜合預測[J].中國免疫學雜志,1997,13(6):329-333.

[15] Alix AJ.Predictive estimation of protein linear epitopes by using the program PEOPLE[J].Vaccine,1999,18(3-4):311-314.

[16] Saha S,Raghava G.BcePred:Prediction of continuous B-cell epitopes in antigenic sequences using physico-chemical properties[J].Int Conference on Artificial Immune System,2004,3239:197-204.

[17] Blythe MJ,Flower DR.Benchmarking B cell epitope prediction:underperformance of existing methods[J].Protein Sci,2005,14(1):246-248.

[18] Larsen JEP,Lund O,Nielsen M.Improved method for predicting linear B-cell epitopes[J].Immunome Res,2006,2(1):2-9.

[19] Saha S,Raghava G.Prediction of continuous B-cell epitopes in an antigen using recurrent neural network[J].Proteins,2006,65:40-48.

[20] Chen J,Liu H,Yang J,etal.Prediction of linear B-cell epitopes using a mino acid pair antigenicity scale[J].Amino Acids,2007,33:423-428.

[21] Manzalawy YEL,Dobbs D,Honavar V.Predicting linear B-cell epitopes using string kernels[J].Mol Recognit,2008,21:243-255.

[22] Leslie C,Eskin E,Cohen A,etal.Mismatch string kernels for discriminative protein classification[J].Bioinformatics,2004,20(4):467-476.

[23] Sweredoski MJ,Baldi P.COBEpro:a novel system for predicting continuous B-cell epitopes[J].Protein Eng Des Sel,2009,22(3):113-120.

[24] Wang HW,Lin YC,Pai TW,etal.Prediction of B-cell linear epitopes with a combination of support vector machine classification and a mino acid propensity identification[J].J Biomed Biotechnol,2011,447-451.

[25] Lin SYH,Cheng CW,Su ECY.Prediction of B-cell epitopes using evolutionary information and propensity scales[J].BMC Bioinformatics,2013,14( 2):10-19.

[26] Singh H,Ansari HR,Raghava GP.Improved method for linear B-cell epitope prediction using antigen′s primary sequence[J].PLoS One,2013,8(5):62216-62224.

[27] Lian Y,Ge M,Pan XM.EP MIR:sequence-based linear B-cell epitope prediction method using multiple linear regression[J].BMC Bioinformatics,2014,15:414-420.

[28] Shen KW,Cao Y,Cha L,etal.Predicting linear B-cell epitopes using a mino acid anchoring pair composition[J].BioData Mining,2015,8:14-26.

[29] Doytchinova IA,Flower DR.VaxiJen a server for prediction of protective antigens,tumour antigens and subunit vaccines[J].BMC Bioinformatics,2007,8:4-11.

[30] Rubinstein ND,Mayrose I,Martz E,etal.Epitopia:a web-server for predicting B-cell epitopes[J].BMC Bioinformatics,2009,10:287-292.

[31] Kim Y,Ponomarenko J,Zhu Z,etal.Immune epitope database analysis resource[J].Nucleic Acids Res,2012,40:525-530.

[收稿2016-12-27 修回2017-01-13]

(編輯 張曉舟)

10.3969/j.issn.1000-484X.2017.09.032

①本文受河北省科學院兩院合作項目(15005023)資助。

程 華(1977年-),男,碩士,副研究員,主要從事抗體工程研究。

R392.1

A

1000-484X(2017)09-1422-05

②共同第一作者。

③河北省科學院應用數學研究所,石家莊050081。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 手机永久AV在线播放| 无码中文AⅤ在线观看| 福利在线不卡一区| 成AV人片一区二区三区久久| 国产精品久久久久久久久kt| 亚洲欧洲一区二区三区| 亚洲国产成人久久精品软件| 国产三级视频网站| 四虎AV麻豆| 国产成人资源| 麻豆精品视频在线原创| 国产精品久久久久久久久久久久| 伊人色婷婷| 亚洲高清资源| 免费看黄片一区二区三区| 91视频日本| 极品私人尤物在线精品首页 | 亚洲伦理一区二区| 亚洲中文在线视频| 免费在线视频a| 欧美精品啪啪一区二区三区| 色久综合在线| 久久99久久无码毛片一区二区| 综合色在线| 国内熟女少妇一线天| 欧美日韩国产在线播放| 67194在线午夜亚洲| 18禁黄无遮挡免费动漫网站| 国产白浆在线| 国产精品播放| 欧美精品在线视频观看| 91久久夜色精品| 无码丝袜人妻| 精品久久久久无码| 亚洲熟女中文字幕男人总站| 美女视频黄频a免费高清不卡| 亚洲免费毛片| 久久久波多野结衣av一区二区| 亚洲丝袜第一页| 视频二区欧美| 婷婷午夜天| 国产99免费视频| 精品剧情v国产在线观看| 国产在线一区视频| 97视频精品全国免费观看| 国产精品永久免费嫩草研究院| 一区二区午夜| 亚洲六月丁香六月婷婷蜜芽| 国产精品yjizz视频网一二区| 四虎国产精品永久一区| 国产视频欧美| a毛片在线| 91麻豆久久久| 色婷婷啪啪| 成人亚洲视频| 欧美日韩免费在线视频| 久久久亚洲色| 国产综合精品一区二区| 欧美日韩激情在线| 五月婷婷丁香综合| 久久久久久久久18禁秘| 一级毛片免费的| 亚洲欧美一区二区三区蜜芽| 91无码视频在线观看| 亚洲成人黄色在线| 欧美成人aⅴ| 国产成人亚洲无吗淙合青草| 精品欧美视频| 亚洲精品无码高潮喷水A| 亚洲美女久久| 欧美第九页| 最新日本中文字幕| 成人一级免费视频| 日本五区在线不卡精品| 国产网友愉拍精品视频| 国产一区亚洲一区| 全免费a级毛片免费看不卡| 为你提供最新久久精品久久综合| a级高清毛片| 午夜三级在线| 国产18在线播放| 五月婷婷欧美|