劉陽星月,張 迪,姚亞亞,苗字葉,劉 壯,李慧靜*
(河北農業大學食品科技學院,河北 保定 071000)
大豆在豆類中的營養價值最高,含有大量的優質蛋白質、不飽和脂肪酸、維生素和微量元素[1],大豆蛋白質只需經過適當加工,其消化率接近于牛奶等動物蛋白,因此廣泛存在于大量食品中,但同時大豆作為八大食物過敏原之一也受到了極大關注[2]。大豆過敏主要是由大豆蛋白引起的[3]。食物過敏多數屬于免疫學的I型變態反應,反應癥狀發生迅速,與機體內的IgE有關,故又稱為IgE介導的速發型變態(超敏)反應[4]。
近年,食物過敏安全問題日益顯著,需要提高對食物過敏原的檢測水平,通過在食品外包裝上對過敏原的標注,提醒過敏人群避免食用該食物[5]。因此,找到快速簡便準確的過敏原檢測方法迫在眉睫。
本研究團隊發現引起我國嬰幼兒大豆過敏的致敏原主要如下:11S球蛋白G1的A1鏈、G2的A2鏈、G5的A3鏈;7S球蛋白α、α’和β亞基;11S突變體C88s晶體結構A鏈與11S突變體C12g的A鏈;大豆凝集素2,6-戊糖復合體A鏈。11S突變體C12g的A鏈、11S突變體C88s晶體結構A鏈與大豆凝集素2,6-戊糖復合體的A鏈為新過敏原,11S球蛋白G1中的A1鏈、G1 A1ab1b中的A1a鏈為已批準的過敏原Gly m 6.0101。11S球蛋白G2為已批準的過敏原Gly m 6.0201,由A2酸性亞基和B1a堿性亞基構成,本研究團隊發現其中主要起致敏作用的為A2酸性亞基,目前國內外還鮮有對11S球蛋白G2中A2鏈中具體抗原表位的研究[2]。不同國家所鑒定出的大豆過敏原組分及其致敏概率并不完全相同,這主要是由各地區大豆品種的差異、加工工藝的不同以及所采集的過敏者的血清標本不一致導致的[2]。因此市售進口的食品大豆過敏原檢測試劑盒或試紙條并不適合我國人群。
本研究團隊擬建立適合我國大豆過敏人群的食品中大豆過敏原的免疫學方法,如雙抗體夾心酶聯免疫吸附實驗法[6-7],為了使檢測結果更加精準,需要找到精確的抗體。免疫細胞一般很難借助其表面受體來識別整個抗原分子,僅能識別蛋白質抗原分子上的特定部分,這一特定部位就是表位,也可稱為抗原決定簇[6,8]。表位一般由5~7 個氨基酸殘基組成,最多不超過30 個氨基酸[3]。表位代表抗原分子上的一個免疫活性區,可與抗體分子或免疫細胞表面的抗原受體結合,嚴格來說,抗體的特異性針對的是抗原表位而不是完整的蛋白質抗原分子[6,8]。B細胞表位是抗原中可被B細胞抗原受體或抗體特異性識別并相互結合的線性片段或空間構象性結構[9-10]。表位是蛋白質抗原性的基礎[11],準確預測B細胞表位有助于找到精準的抗體。因此,本研究擬以引起我國嬰幼兒大豆過敏的主要過敏原的新變體11S球蛋白G2中A2鏈為例預測其抗原表位。
目前,B細胞表位分析的方法主要有以下幾種:1)表位預測方法,根據表面可及性方案[12]、親水性方案(其中以Hopp-Woods[13]方案最為著名)、可塑性方案[14]、二級結構預測方案[15]、抗原性方案[16]、電荷分布方案等方法預測表位[17-19],這種方法適用于已知一級結構的多肽抗原或是蛋白質的線性結合表位的預測[6]。在吳加金等[6]編的Goldkey軟件中,以Hopp-Woods、反向高效液相色譜的肽滯留時間、表面可及性、可塑性、電荷分布、抗原性6 種參數綜合考慮,得出了綜合判斷圖,在閾值以上的峰即認為是預測的抗原表位。2)傳統化學“切割”法或酶法,分為用化學法或酶“切割”抗原法和水解抗原-抗體復合物法。用化學法或酶“切割”抗原法即運用化學方法或生物學方法處理抗原分子得到多肽碎片,然后再利用單克隆抗體篩選能與其發生陽性反應的片段[6]。水解抗原-抗體復合物法即利用抗原-抗體的結合部位能夠抵抗蛋白酶的水解這一原理,水解復合物,從而找到結合部位[6]。3)合成肽庫的方法,分為有機合成法和噬菌體隨機肽庫方法[6]。有機合成法即利用固相肽合成技術,合成含有各種可能序列的短肽,再通過熒光標記或ELISA法進行篩選,得到結合表位[6],也可使合成多肽與特異性抗體反應,而后通過重疊多肽掃描技術確定結合表位[20];噬菌體隨機肽庫方法即將包被后的單抗加入到噬菌體肽庫中,充分反應后,用洗脫液處理得到結合狀態的噬菌體,使其侵染宿主大腸桿菌擴增后回收,而后繼續與已包被的單抗反應進行篩選,重復3、4 輪后,即可獲得與單抗結合較為緊密的噬菌體克隆,最后通過DNA序列分析,即可得知噬菌體克隆攜帶的外源肽序列,從而得知抗原表位[6]。4)X-射線衍射方法,X-射線可以揭示出復合物中抗原與抗體結合的位點以及結合表位的類型,但此方法耗時長,成本高,對蛋白質的純度要求極高[20]。5)核磁共振分析法,抗原抗體結合時,抗原結合位點的氨基酸殘基的動力學值會發生改變,核磁共振技術可以根據動力學值的改變定位抗原表位[20]。6)質譜技術,此項技術主要針對的是分子間的非共價鍵反應,從而對抗原抗體間的特異性結合進行分析,找出結合位點[20]。
通過實驗方式分析B細胞表位,耗時長,費用高,工作量大,本研究擬參考表位預測方法,綜合使用生物信息學軟件對11S球蛋白G2中A2鏈的B細胞結合表位進行預測,首先在NCBI GenBank數據庫查詢11S球蛋白G2中A2鏈的序列,在PDB數據庫中查詢11S球蛋白G2中A2鏈的同源蛋白,進而利用SWISS-MODEL在11S球蛋白G2中A2鏈同源蛋白的三級結構基礎上建立11S球蛋白G2中A2鏈的三級結構模型,并使用Deep View 4.1軟件對該三級結構模型的穩定性進行評估,為后期使用DiscoTope 2.0 Server軟件預測B細胞構象表位做準備,使用DNAStar、SOPMA、BepiPred和ABCpred等軟件綜合預測11S球蛋白G2中A2鏈的線性B細胞表位[3,20-22]。本研究將為后期開發適合檢測我國大豆過敏人群的食品大豆過敏檢測技術提供理論支持。
1.1.1 11S球蛋白G2中A2鏈的序列
登錄NCBI GenBank數據庫[3,20](https://www.ncbi.nlm.nih.gov/genbank/)查詢11S球蛋白G2中A2鏈的序列(編號gi|121277),得到含有278 個氨基酸殘基的序列:LRE QAQQNECQIQKLNALKPDNRIESEGGFIETWNPNNKPF QCAGVALSRCTLNRNALRRPSYTNGPQEIYIQQGNGIF GMIFPGCPSTYQEPQESQQRGRSQRPQDRHQKVHRFR EGDLIAVPTGVAWWMYNNEDTPVVAVSIIDTNSLENQL DQMPRRFYLAGNQEQEFLKYQQQQQGGSQSQKGKQ QEEENEGSNILSGFAPEFLKEAFGVNMQIVRNLQGENE EEDSGAIVTVKGGLRVTAPAMRKPQQEEDDDDEEEQP QCVETDKGCQRQSK。
1.1.2 11S球蛋白G2中A2鏈的同源蛋白
登錄PDB數據庫[20](http://www.rcsb.org/pdb/home/home.do)查找11S球蛋白G2中A2鏈的同源蛋白[23]。
1.1.3 11S球蛋白G2中A2鏈同源建模軟件及穩定性評價軟件
SWISS-MODEL為基于因特網的蛋白質三級結構自動比較建模的網絡服務器(https://www.swissmodel.expasy.org/)[3,20,24-25],Deep View 4.1軟件可以用來分析蛋白質PDB文件,評估SWISS-MODEL建立的蛋白質三級結構模型的穩定性[20,23]。
1.1.4 DNAStar
DNAStar[3,20]的子程序Protean,軟件版本為7.1.0。DNAStar的子程序Protean可以根據蛋白質的序列預測11S球蛋白G2中A2鏈的親水性、表面可及性、柔韌性和抗原指數[20,22]。親水性指數高的區域說明這些區域暴露在抗原表面的幾率較大,有極大可能為B細胞抗原表位;表面可及性表示抗原中氨基酸殘基被溶劑分子接觸的可能性,擁有表面可及性,才具有與抗體結合的可能;柔韌性區域易發生折疊和扭曲,有較大可能性形成表位,容易與抗體進行結合;抗原性區域有可能成為表面抗原[26]。此軟件考慮因素較多,準確性相對較高。
1.1.5 SOPMA
SOPMA[3,20,27](https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)軟件采用Levin同源預測、PredictProtein中的PHD、GOR、雙重預測和SOPMA 5 種方法預測蛋白質的二級結構,然后將結果優化組合,綜合整理成一個結果,SOPMA采用這些方法建立出已知二級結構的蛋白數據庫,庫中的每個蛋白質都經過了二級結構預測,然后便可用從庫中得到的信息來預測目標序列的二級結構[28-29]。因為無規則卷曲和β-轉角一般為凸出結構,所以常常暴露在抗原表面,與α-螺旋和β-折疊相比,它們更容易與抗體結合,有較大可能性成為過敏原表位[20]。
1.1.6 BepiPred 1.0 Server
BepiPred 1.0 Server[3,20,30](http://www.cbs.dtu.dk/services/BepiPred-1.0/)。BepiPred 1.0 Server使用隱馬爾可夫模型[31]和親水性參數評分來預測線性B細胞結合表位[20]。這種方法相對于只是依賴于分析氨基酸物理化學性質的技術來說,預測的準確性有了微小的提高[17]。
1.1.7 ABCpred
ABCpred[20,32](http://www.imtech.res.in/raghava/abcpred/ABC_submission.html)服務器可以利用人工神經網絡(artificial neural network,ANN)模型預測抗原序列中的B細胞表位[20]。在700 個B細胞的抗原基和700 個非抗原決定肽的非冗余數據集上,使用5 倍的交叉驗證測試,對前饋神經網絡和復發神經網絡進行評估[17]。對10~20 個氨基酸的輸入序列窗口進行測試,結果顯示通過對16 個氨基酸的重復神經網絡測試獲得了66%的準確度[17]。
1.1.8 DiscoTope 2.0 Server
DiscoTope 2.0 Server[20,33](http://www.cbs.dtu.dk/services/DiscoTope/)。DiscoTope服務器根據蛋白質的三維結構,利用新的表位傾向的氨基酸評分和表面可及性預測B細胞構象表位,最后的分數結合在空間接近的殘留物的傾向分數和接觸數來計算[18,19,34]。
1.2.1 11S球蛋白G2中A2鏈同源建模
選擇SWISS-MODEL服務器中的Alignment Mode,同時輸入11S球蛋白G2中A2鏈的序列和在PDB數據庫中找到的其同源蛋白的序列,注意輸入序列格式必須是FASTA、Clustal、Promod、普通字符串或一個有效的UniProtKB AC。對11S球蛋白G2中A2鏈進行同源建模。一般來說,僅當蛋白質的同源性達到30%以上時,使用已知蛋白的三維結構作為模板建立目標蛋白的三維結構模型才具有一定的可靠性[20]。
1.2.2 使用Deep View 4.1軟件進行評估
使用Deep View 4.1軟件對SWISS-MODEL服務器建成的11S球蛋白G2中A2鏈的三維結構模型進行穩定性評估。將SWISS-MODEL服務器得出的結果保存為PDB格式,在Deep View 4.1軟件直接打開,也可以點擊File→Import,出現對話框,在Name欄中鍵入PDB ID,再點擊“Grab from SERVER”下的“PDB File”,模型便會以棍狀形式出現。在菜單Select中點擊ALL,再在菜單Wind中點擊Ramachandran Plot,最后在Color中點擊Secondary Structure Succession就能得到Ramachandran圖。
1.2.3 DNAStar的使用
首先從EditSeq開始,點擊File→New→New Protein,然后輸入目標序列,保存,再點擊File→Send Sequence To→Protean即可得到結果。
1.2.4 SOPMA的使用
將11S球蛋白G2中A2鏈的序列輸入到SOPMA網絡服務器,設定“Number of conformational states”為4(Helix, Sheet, Turn, coil),“Output width”為70,“Similarity threshold”為8,“Window width”為17。
1.2.5 BepiPred的使用
打開BepiPred網頁后提交FASTA格式的11S球蛋白G2中A2鏈序列即可。
1.2.6 ABCpred的使用
打開ABCpred服務器,提交11S球蛋白G2中A2鏈的序列,設定“Threshold”為0.7,“window length”為10,“overlapping filter”為on。
1.2.7 DiscoTope 2.0 Server的使用
打開DiscoTope 2.0 Server服務器,選擇本地磁盤中擁有同源建模PDB格式的結果的文件,接下來為抗原表位的鑒定選擇DiscoTope閾值,較高的值對應更高的特異性[18,34]。分數與靈敏度、特異性關系見表1。0.75特異性表示非表位殘余的25%被預測為表位的一部分,0.47的靈敏度表示表位殘基的47%被預測為表位的一部分,可根據自己的需求來選擇,本研究中選擇默認值-3.7[34]。

表1 分數與靈敏度、特異性的關系[18,34]Table 1 Relationship between score and sensitivity and specificity
在PDB數據庫中找到11S球蛋白G2中A2鏈的17 種同源蛋白,其中相似度最高的為1FXZ(大豆球蛋白A1aB1b三聚體),同源性達到了69%,選擇該蛋白為模板,將11S球蛋白G2中A2鏈與1FXZ的蛋白序列對比輸入到SWISS-MODEL軟件的Target-Template Alignment模式,對11S球蛋白G2中A2鏈的三級結構進行預測,結果如圖1所示。將SWISS-MODEL中得到的結果提交到Deep View 4.1中,對所做出的11S球蛋白G2中A2鏈的三級結構進行穩定性評估,得到Ramachandran Plot,如圖2所示。

圖1 11S球蛋白G2中A2鏈的三級結構Fig. 1 Tertiary structure of the A2 chain of 11S globulin G2

圖2 11S球蛋白G2中A2鏈三級結構的Ramachandran PlotFig. 2 Ramachandran Plot of the tertiary structure of the A2 chain of 11S globulin G2
Ramachandran Plot是以φ為橫坐標,ψ為縱坐標,規定φ,ψ角允許的構象區域的一個圖形[35]。φ,ψ角為α碳的兩面角,φ表示一個肽單位中α碳左邊C—N鍵的旋轉角度,ψ表示α碳右邊C—C鍵的旋轉角度,理論上C—N鍵和C—C鍵可以自由旋轉,但實際中由于分子中各個基團的空間障礙和作用力的影響,Ramachandran Plot就出現了允許出現的區域和不允許出現的區域[35]。Ramachandran Plot包含3個區域:允許區、最大允許區和不允許區。如圖2所示,黃線區域內為允許區,該區構象可以穩定存在。藍線區域內黃線區域外為不完全允許區,該區構象在立體化學中可以存在,但是不穩定。剩余區域為不允許區,該區構象不能存在。一般來說,落在允許區和不完全允許區的氨基酸殘基占所有氨基酸殘基的比例高于90%的,即可認為該模型的構象符合立體化學的規則[35]。由圖2可知該模型的構象符合立體化學的規則。

圖3 DNAStar預測11S球蛋白G2中A2鏈的親水性、柔韌性、抗原指數以及表面可及性Fig. 3 DNAStar prediction of the hydrophilicity, flexibility, antigen index, and surface accessibility of the A2 chain in 11S globulin G2
應用DNAStar的子程序Editseq和protean預測11S球蛋白G2中A2鏈的二級結構結果如圖3所示,當圖中區域滿足親水性和抗原指數大于0、同時表面可及性指數大于1時則該區域為抗原表位的優勢區域,關于柔韌性指數則其中有矩形覆蓋的部分為抗原表位的優勢區域,同時考慮這4個指標[3],便可預測出11S球蛋白G2中A2鏈的13 個線性抗原表位,如表2所示。

表2 DNAStar預測的抗原表位結果Table 2 Epitopes predicted by DNAStar
SOPMA預測的11S球蛋白G2中A2鏈二級結構如圖4所示,二級結構中有22.30%的氨基酸殘基構成α-螺旋,有19.42%的氨基酸殘基構成β-折疊,有8.99%的氨基酸殘基構成β-轉角,而49.28%的氨基酸殘基屬于無規則卷曲處。由二級結構預測理論可知,β-轉角和無規則卷曲屬于抗原表位的優勢區域[20],根據上述結論預測出11S球蛋白G2中A2鏈的16 個線性抗原表位如表3所示。

圖4 SOPMA預測結果Fig. 4 Results predicted by SOPMA

表3 SOPMA預測的抗原表位結果Table 3 Epitopes predicted by SOPMA
BepiPred 1.0 Server使用隱馬爾可夫模型和親水性參數評分預測出的10 個11S球蛋白G2中A2鏈的抗原表位結果如表4所示。

表4 BepiPred預測的抗原表位結果Table 4 Epitopes predicted by BepiPred
將11S球蛋白G2中A2鏈序列提交到ABCpred網絡服務器后,利用人工神經網絡模型預測出了11S球蛋白G2中A2鏈的13個線性抗原表位,如表5所示。

表5 ABCpred預測的抗原表位結果Table 5 Epitopes predicted by ABCpred
綜合DNAStar、SOPMA、BepiPred和ABCpred四種軟件的預測結果,如圖5所示,4 種軟件均包含的表位分別是37KPDNRIE43、79PSYTNGP85、114SQQRGRSQRP123,這些表位最可能是11S球蛋白G2中A2鏈的線性表位。此外,由3種軟件預測的共有表位有52WNPNNK57、196QQGGSQSQKGKQQE209、241QGENEEED248、267RKPQQEEDDDDEEEQ281、287TDKGC291。這些表位成為11S球蛋白G2中A2鏈抗原表位的可能性也比較大,可作為研究重點。

圖5 DNAStar、SOPMA、BepiPred和ABCpred預測結果Fig. 5 Results predicted by DNAStar, SOPMA, BepiPred and ABCpred

圖6 DiscoTope 2.0 Server預測的構象表位結果Fig. 6 Conformational epitopes predicted by DiscoTope 2.0 Server

圖7 11S球蛋白G2中A2鏈的構象表位示意圖Fig. 7 Schematic diagram of conformational epitopes of the A2 chain of 11S globulin G2
DiscoTope服務器根據11S球蛋白G2中A2鏈的三維結構,利用新的表位傾向的氨基酸評分和表面可及性預測得到的B細胞構象表位如圖6所示,在蛋白三維結構中構象表位的示意圖如圖7所示。可以發現這些構象表位的氨基酸殘基多位于無規則卷曲處。
本研究運用NCBI GenBank數據庫找到11S球蛋白G2中A2鏈的蛋白質序列,在PDB數據庫中找到目標蛋白的同源蛋白,使用SWISS-MODEL、Deep View 4.1等對目標蛋白進行同源建模與穩定性評估,使用DiscoTope 2.0 Server軟件預測B細胞構象表位,通過預測結果發現構象表位多位于無規則卷曲處。綜合運用DNAStar、SOPMA、BepiPred和ABCpred等生物信息學軟件對11S球蛋白G2中A2鏈的二級結構進行分析,這4種軟件基于不同的算法和數據庫,預測結果也不完全相同,僅僅通過一種軟件預測有較大的局限性,因此將其結果綜合分析以提高預測的準確率。最終定位了B細胞線性結合表位,有可能是11S球蛋白G2中A2鏈的線性表位有:37KPDNRIE43、79PSYTNGP85、114SQQRGRSQRP123、52WNPNNK57、196QQGGSQSQKGKQQE209、241QGENEEED248、267RKPQQEEDDDDEEEQ281、287TDKGC291。本研究縮小了檢測范圍,為后續的制肽、免疫等操作找出更準確的肽序,為找出更準確抗體來檢測食品中的大豆過敏原提供了便利。本研究將為后期開發適合檢測我國大豆過敏人群的食品大豆過敏檢測技術提供理論支持。