李雪嬌,李欣芮,范卓妍,張亞妮,車會蓮*
(北京食品營養與人類健康高精尖創新中心,中國農業大學食品科學與營養工程學院,北京 100083)
小麥蛋白在小麥籽粒中占10%~15%,是小麥籽粒中的重要營養物質,各蛋白質組分按其在不同溶劑中的溶解度不同分為4 類:清蛋白、球蛋白、醇溶蛋白、麥谷蛋白[1-2]。小麥致敏機制比較復雜,不同種類的小麥蛋白都有可能引起過敏反應,有不同的致敏性及發病機制,并呈現不同的臨床癥狀[3]。流行病學的調查結果顯示,近年來過敏性疾病的發病率逐年升高,世界0.4%人口受小麥過敏癥困擾[4]。北京協和醫院發布的中國過敏性休克誘因研究表明,超七成致敏源來自食物,其中以小麥居多[5]。小麥過敏會影響內臟、呼吸道與皮膚的健康,引起運動激發過敏癥、乳糜瀉、哮喘、鼻炎、接觸性蕁麻疹等[6]。
有研究表明,CM16是引起日本面包師哮喘的主要過敏原[7],并且可以引發剛攝入輔食的嬰幼兒發生口服性的過敏反應[8]。CM16分子質量17 kDa,由143 個氨基酸組成,屬于醇溶蛋白超家族中的大型谷物胰蛋白酶或α-淀粉酶抑制劑家族[9]。該家族蛋白質廣泛存在于谷類、豆類以及其他較高等植物中,對胰淀粉酶具有較強的抑制作用[10]。
B細胞表位是抗原中可被B細胞抗原受體或抗體特異性識別并結合的線性片段或空間構象性結構,其刺激機體產生B細胞介導的體液免疫應答,并產生效應分子(抗體)和效應細胞[11]。在免疫學中,表位才是抗原刺激機體免疫系統產生特異性免疫應答的真正部位[12]。B細胞表位預測是表位預測的一個重要組成部分,大多數研究是針對線性B細胞表位預測,通過組合抗原蛋白物理化學性質、結構性質、統計顯著性度量等特征屬性進行表位預測[13-14]。
通過生物信息學軟件分析抗原表位是目前常用的表位研究方法之一。其原理是對已知的線性B細胞表位特點進行歸納后,發現蛋白質序列中親水性和表面可及性高的區域更容易分布在分子表面,而可塑性高的區域容易發生折疊和扭曲,易與抗體接觸,可能產生抗原表位[15-17]。但該方法主要基于蛋白質的一級氨基酸序列,忽略了氨基酸之間的分子作用力,具有一定的局限性,需要結合抗消化實驗以及質譜分析加以驗證。
因此,本研究擬利用生物信息學法預測CM16線性B細胞表位,與質譜得到的抗消化肽段信息進行比對,以期證明抗消化性結合生物信息學分析鑒定過敏原線性B細胞表位的方法的可行性和應用性。
實驗用小麥粉為中糧香雪美味富強粉。
BCA蛋白定量試劑盒 上海碧云天生物技術有限公司;標準蛋白分子質量Marker 美國Thermo Fisher公司;牛血清白蛋白、胃蛋白酶(P7000)、胰酶(P3292) 美國Sigma公司;0.22 μm硝酸纖維素膜美國Whatman公司。
JB-3磁力攪拌器 上海富磁新徑儀器有限公司;TGL-16M臺式高速冷凍離心機 廣州廣一科學儀器有限公司;多功能酶標儀 美國Thermo Scientific公司;DYY-7C型電泳儀 北京市六一儀器廠;GenoSens 1850凝膠成像分析系統 上海勤翔科學儀器有限公司;CC-K6加熱制冷型恒溫水浴鍋 德國Huber公司。
1.3.1 小麥蛋白粗提物的制備
參考冼靜雯等[18]的方法提取小麥蛋白粗提物。稱取約100 g小麥粉,1∶5(g/mL)加入預冷丙酮于4 ℃去脂,至上清液澄清,通風櫥下干燥,稱質量,以1∶10(g/mL)的比例加入0.01 mol/L磷酸鹽緩沖液,提取12~24 h,10 000×g離心10 min,上清液即為蛋白粗提物溶液。
1.3.2 生物信息學方法預測小麥過敏原CM16線性B細胞表位序列
從Uniprot數據庫獲取小麥過敏原α-淀粉酶/胰蛋白酶抑制劑CM16的氨基酸序列。使用生物信息學軟件DNAStar Protean中Hoop-woods的氨基酸親水性分析方案、Emini-Surface Probability的表面可及性算法、Kparlus-Schuzl的可塑性分析和Jameson-Wolf的抗原指數分析方案,對蛋白質的一級序列性質進行分析,綜合分析這些參數預測結果的重疊部分后,得出過敏原的線性B細胞表位序列[19]。
1.3.3 生物信息學方法分析小麥過敏原CM16二級結構
使用DNAStar Protean載入NCBI中下載的FASTA格式的α-淀粉酶/胰蛋白酶抑制劑CM16氨基酸序列,使用Chou-Fasman和Garnier-Robson方案對蛋白質的二級結構進行預測分析。
1.3.4 基于生物信息學方法的小麥過敏原CM16同源建模
在PDB數據庫中使用BLAST搜索與過敏原α-淀粉酶/胰蛋白酶抑制劑CM16同源性較高,且已由實驗分析出高級結構數據的蛋白質序列。以相似度最高的蛋白質為模板,使用SWISS-MODEL在線網站進行相同結構區域的同源建模,根據分子動力學模擬和能量最小化原理優化得到最佳蛋白高級結構。使用Spdbv軟件對模擬結構的拉氏構象圖進行合理性分析,使用Pymol軟件對預測線性B細胞表位及抗消化肽段區域進行空間定位。
1.3.5 小麥蛋白粗提物抗消化肽段的質譜分析
分別取經過胃蛋白酶或胰酶消化60 min后的小麥粗蛋白消化產物,進行高效液相色譜-質譜聯用檢測,鑒定氨基酸長度多于4 個的抗消化肽段,并確定多肽所屬的蛋白質序列。
數據統計與圖表繪制工具主要為DNAStar軟件、Spdbv軟件version 4.1(http - //spdbv.vital-it.ch/)、Pymol軟件version 2.2(http-//www.pymol.org/)等。
小麥蛋白粗提物電泳結果顯示,小麥總蛋白具有5 條明顯的電泳條帶,其中分子質量在17 kDa的蛋白質含量最高,經灰度值分析,約占總蛋白含量的40%,其分子質量對應小麥過敏原α-淀粉酶/胰蛋白酶抑制劑CM16。由圖1可知,小麥蛋白粗提物主要是由17 kDa處的α-淀粉酶/胰蛋白酶抑制劑CM16和大于180 kDa的高分子質量谷蛋白低聚物組成,這兩種蛋白質具有熱穩定性,經37 ℃溫育60 min后,含量未發生明顯變化。在胃蛋白酶作用下,消化第30秒時,高分子質量谷蛋白低聚物迅速被降解,產生分子質量低于10 kDa的片段,而17 kDa處的α-淀粉酶/胰蛋白酶抑制劑CM16在第30秒時保持完整,第5分鐘時才被完全降解。隨著消化進行,低于10 kDa的抗消化片段直至消化結束時仍可被檢測。結果表明,高分子質量谷蛋白低聚物極易被胃蛋白酶消化,α-淀粉酶/胰蛋白酶抑制劑CM16易被消化,但小麥過敏原在消化過程中會產生消化抗性片段,具有潛在致敏活性。因此后續選取α-淀粉酶/胰蛋白酶抑制劑CM16進行線性B細胞表位與抗消化肽段之間關系的研究。

圖1 胃蛋白酶消化對小麥蛋白質粗提物的影響Fig. 1 Effect of pepsin digestion on WPE
一般認為,親水性和表面可及性高的區域易分布在蛋白質分子的表面,且柔性區域易于發生折疊和扭曲,容易產生表位與抗體結合[20]。如圖2所示,在氨基酸親水性分析中,親水性指數大于0表明親水性好,CM16的親水性區域分布較為均勻,其中親水性較高的區域分別為AA 88~100和AA 137~143。在可塑性分析中,發現AA 26~32、AA 39~51、AA 54~62、AA 64~67、AA 75~78、AA 89~98、AA 103~108、AA 130~132和AA 138~140區域具有一定的柔性,容易發生折疊、彎曲,易與抗體結合。在抗原指數分析中,以抗原指數大于0為篩選條件,結果顯示抗原指數較高的區域為AA 26~34、AA 42~63、AA 66~70、AA 71~84、AA 88~99、AA 100~111和AA 137~143,可能含有潛在的優勢抗原表位。最后對于CM16的表面可及性進行了分析,表面可及性指數大于1為篩選條件,結果顯示AA 47~50、AA 58~60、AA 62~65、AA 90~96和AA 138~143區域具有較好的表面可及性。綜合以上各參數,將同時滿足4 個參數篩選條件的表位預測為CM16可能的線性B細胞表位,如表1所示。

圖2 DNAStar對CM16一級氨基酸序列的分析Fig. 2 DNAStar analysis of the amino acid sequence of CM16

表1 DNAStar預測得到的CM16的線性B細胞表位Table 1 Predicted linear B-cell epitopes of CM16 by DNAStar

圖3 CM16的二級結構預測Fig. 3 Prediction of CM16 secondary structure
圖3 為使用DNAStar軟件中的Chou-Fasman和Garnier-Robson方案對CM16二級結構進行預測的結果[21]。分析可知,兩種方案在預測CM16的轉角區域時具有一定的相似性,但對于α-螺旋和β-折疊的預測具有基本相反的結果,還需要結合三級結構進行分析。總體來看,CM16蛋白質二級結構中有序的螺旋、轉角結構占據了主要優勢,反映了蛋白質具有良好的緊密結構。
使用PDB蛋白質結構數據庫,對小麥α-淀粉酶/胰蛋白酶抑制劑CM16的氨基酸序列進行BLAST檢索,共檢索到16 種已有空間結構數據的蛋白質序列,其中PDB檢索號為1bfa.1.A的重組玉米雙功能蛋白因子/淀粉酶抑制劑與CM16的序列相似性可達41.88%,具有較高的序列覆蓋率,模擬結構評分最高,因而被選為CM16建模的最佳模板。拉氏構象圖是α-碳與酰胺平面的交角圖,可以評價蛋白質結構中轉角的易變程度。通過了解氨基酸殘基的Φ和Ψ角信息,獲得拉氏構象圖的允許構象和不允許構象區域,如圖4所示。在空間上允許和不允許出現的區域用不同顏色的等高線表示,黃色封閉區域為允許區,構象最為穩定,在該區域內的任何成對二面角(φ,ψ)所規定的構象都是立體化學所允許的[22]。藍色封閉區域為臨界區,該區域內任何成對二面角所規定的構象雖然是立體化學所允許的,但不夠穩定,除此之外的區域為不允許區[23]。圖中每個點代表一個氨基酸殘基,紅色點為組成α-螺旋的氨基酸,黃色為β-折疊。由圖4可知,α-螺旋主要集中于第3象限的允許區域內,而β-折疊主要集中于第2象限的允許區域內。由此可證,CM16的二級結構主要由α-螺旋組成。只有6 個點位于不允許區域,8 個點位于藍色的臨界區域,其他多位于黃色的允許區域內,允許區域的氨基酸覆蓋率達88%,此結果表明,構建的CM16的三維結構在一定程度上具有合理性和穩定性。

圖4 拉氏構象圖Fig. 4 Ramachandran plot of three-dimensional model of CM16
利用Pymol軟件對生物信息學模擬的CM16線性B細胞表位在其空間結構上進行定位[24],將生物信息學模擬的4 條線性B細胞表位按不同顏色標注在三維結構圖上(圖5)。圖5A為卡通拓撲圖,彩色區域是不同抗消化肽段在其中的定位。CM16的空間結構是由4 個分子內的α-螺旋以及其他無序結構組成的,具有醇溶蛋白超家族典型的結構特性。由二硫鍵形成α-螺旋在維持蛋白質空間結構穩定性方面起到非常重要的作用,使CM16蛋白形成致密的球狀分子,為其致敏性提供了結構基礎。除標注為紅色的表位位于α-螺旋上以外,其他的3 個表位均位于無規卷曲處,構象上具有可塑性,容易與抗體接觸形成表位。圖5B顯示CM16表面分子暴露情況,4 個預測的線性表位均位于球狀結構表面,具有與抗體結合的表面可及性,可以形成線性B細胞表位。綜上可知,CM16的線性B細胞表位多位于無規卷曲處或是α-螺旋與無規卷曲的連接處,具有可塑性及表面可及性。

圖5 預測線性B細胞表位在CM16三維結構中的定位Fig. 5 Location of the predicted linear B-cell epitopes in CM16 3D structure
將小麥蛋白粗提物經胃蛋白酶消化60 min后的產物,通過高效液相色譜-質譜聯用進行鑒定。經過60 min的胃蛋白酶消化,共產生6 753 個二級質譜圖。根據Uniprot數據庫提供的小麥過敏原氨基酸序列構建檢索數據庫,使用pFind軟件搜索,共鑒定出23 條屬于過敏原蛋白的片段,且大部分來源于α-淀粉酶/胰蛋白酶抑制劑亞型和高分子質量谷蛋白亞基,α-淀粉酶/胰蛋白酶抑制劑亞型CM16的主要過敏原肽段如表2所示。

表2 胰酶消化質譜與小麥主要過敏原匹配的肽段Table 2 Matching of trypsin-digested peptides with wheat major allergens
將預測表位與抗消化肽段在過敏原CM16的一級氨基酸序列上分布進行標注,如圖6所示,預測表位和抗消化肽段主要分布于中部和C末端,而1、2號抗消化肽段與2、3號預測表位有部分序列重合,證明了預測表位的抗消化性,也體現了表位與抗消化肽段之間的聯系。

圖6 抗胰酶消化肽段及預測表位在CM16氨基酸序列的定位Fig. 6 Location of anti-trypsin-digested peptides and predicted epitopes in amino acid sequence of CM16
本研究首先對小麥蛋白質粗提物進行電泳分析,發現分子質量在17 kDa的小麥過敏原α-淀粉酶/胰蛋白酶抑制劑CM16量最高,約占總蛋白含量的40%。進一步進行體外模擬胃腸道分析,結果顯示小麥過敏原α-淀粉酶/胰蛋白酶抑制劑CM16在模擬消化過程中會產生消化抗性片段,提示其可能具有潛在的致敏活性。Posch等[20]使用雙方電泳法分離出小麥過敏原,經過氨基酸序列檢測,確定其主要過敏原為14~18、27 kDa和37 kDa處的蛋白,這與本研究結果一致。
為研究小麥中的醇溶蛋白超家族過敏原α-淀粉酶/胰蛋白酶抑制劑CM16的線性B細胞表位的結構特征,通過生物信息學方法對小麥過敏原CM16的線性B細胞表位進行探究。首先通過DNAStar對CM16一級氨基酸序列進行分析,通過篩選,最終確定了4 個CM16的線性B細胞表位。盡管近年來B細胞表位預測的方法得到了一定的發展和應用,但這些研究方法還存在一定的問題[25-26]。首先,所有預測表位的方法都缺乏評價標準,這使得各種預測方法的結果難以比較與評估[27]。其次,90%以上的表位為構象表位[28],然而大多數預測線性表位的方法都具有一定的局限性,它們僅僅是根據少數的幾個表位的特征(氨基酸的性質、殘基的表面可及性、空間分布、分子間接觸)預測表位[29-30]。有研究結果表明[31],僅根據氨基酸的性質來預測線性表位的方法并不可靠,要提高預測的準確性,需與非表位特征結合起來預測。
因此,本研究進一步通過生物信息學預測CM16的二級結構,并通過同源建模確定CM16的三級結構。在進一步完善線性B細胞表位預測研究的基礎上,深入研究了線性表位的構象分布。結果表明,CM16是由4 個α-螺旋以及無規卷曲組成的球狀結構,預測的線性B細胞表位則位于無規卷曲處或是α-螺旋與無規卷曲的連接處,且暴露于球狀結構的表面,具有表面可及性及結構可塑性。
為探究生物信息學方法預測線性B細胞表位的抗消化肽段的可行性,本研究利用生物信息學方法預測出CM16的4 條線性B細胞表位后,結合質譜得到的抗消化肽段信息進行比對分析,發現其中2 條肽段存在部分重合,含有線性B細胞表位的可能性更高,也證明了抗消化性結合生物信息學分析鑒定過敏原線性B細胞表位的方法的可行性和應用性。
小麥中的醇溶蛋白超家族過敏原α-淀粉酶/胰蛋白酶抑制劑CM16是由4 個α-螺旋以及無規卷曲組成的球狀結構,其線性B細胞表位則位于無規卷曲處或α-螺旋與無規卷曲的連接處,且暴露于球狀結構的表面,具有表面可及性及結構可塑性。探究小麥過敏原CM16線性B細胞表位有助于進一步認識小麥過敏原,對小麥過敏原的識別和檢測具有重要的參考和借鑒作用。