曾小飛 楊鈺歡 柳嘉瑋 魯 陳
1 贛南醫學院第一臨床醫學院,江西省贛州市 341000; 2 江蘇省腫瘤醫院藥學部; 3 贛南醫學院第一附屬醫院精準醫學中心
螨蟲是最常見的致敏物質之一,全球約有6 500萬~1.3億對其過敏的患者,在哮喘患者中螨蟲的過敏率高達50%[1-2]。迄今為止,已有40種不同組別的螨蟲過敏原,被鑒定且收錄在過敏原命名委員會數據庫中。粉塵螨Der f 38是在2021年被鑒定具有Toll樣受體4結合活性的溶菌酶樣蛋白,其在螨蟲過敏患者中的致敏率為60%~75%[3],是一個重要的過敏原分子。過敏原特異性免疫療法(AIT)有別于其他治療方法,其療效被多項臨床試驗證實[4]。傳統免疫治療中使用的螨蟲過敏原疫苗,是從螨蟲中提取的混合物質,成分變異大、標準控制難、容易出現不良反應[5]。重組過敏原及其低致敏活性的衍生物,展現出更有前景、更安全和有效的優勢[6],此類治療藥物或疫苗的開發,需要對過敏原的性質、結構和免疫優勢表位有充分的了解。本研究通過綜合生物信息學工具,對螨蟲過敏原Der f 38進行理化性質、結構特征、優勢B細胞表位和T細胞表位的預測分析,為進一步針對該過敏原的個體化免疫治療提供理論參考。
1.1 Der f 38蛋白的序列檢索以及理化性質分析 從世界衛生組織/國際免疫學會聯合會過敏原命名數據庫(http://www.allergen.org/)中檢索獲取Der f 38的氨基酸序列,該序列在GenBank中的登記號為QHQ72282.1。根據所獲得的Der f 38氨基酸序列信息,通過SignalP-5.0預測其信號肽序列(https://services.healthtech.dtu.dk/service.php?SignalP-5.0),使用ProtParam分析除去信號肽后的序列,獲取成熟蛋白質的分子量、氨基酸組成、正負電荷殘基、不穩定指數等理化性質。
1.2 Der f 38蛋白的二級與三級結構分析 Der f 38蛋白的二級結構預測主要通過DNAStar軟件完成。三級結構預測通過同源建模的SWISS-MODEL[7]和人工智能深度學習的AlphaFold2[8]兩種方法來實現。在SWISS-MODEL中 (https://swissmodel.expasy.org/),提交成熟Der f 38蛋白的氨基酸序列進行模型構建,在結果中選取序列覆蓋率最廣、序列一致性最強、全局模型質量評估(GMQE)最高的模型進行下一步分析。在AlphaFold2中,提交氨基酸序列后,選擇系統評分最佳的模型進行后續分析。
利用SAVES v6.0(https://saves.mbi.ucla.edu/)對不同方法構建的Der f 38模型進行準確性和有效性測試:通過PROCHECK評估模型結構的立體化參數[9],Verify3D評估蛋白結構的三維輪廓,與其自身氨基酸序列的匹配性[10],ERRAT評估特征原子間相互作用的分布方式[11]。根據評分結果,選擇最佳的模型,進一步利用GalaxyRefne服務器(http://galaxy.seoklab.org/)對模型進行優化。優化后的模型用上述評分系統進行驗證,最終將優化后的模型用Pymol(https://pymol.org/2/)展示,并分析Der f 38的結構特征。
1.3 Der f 38蛋白的優勢B表位預測分析 B細胞表位分為線性表位和構象表位,線性表位又稱連續性表位,一般由抗原表面幾個連續的氨基酸組成[12]。Der f 38蛋白的線性表位預測通過綜合3種不同的免疫信息學工具進行,即Bepipred 2.0、ElliPro、DNAStar protean。在Bepipred 2.0(http://tools.iedb.org/bcell/)、ElliPro(http://tools.iedb.org/ellipro/)中對蛋白進行線性表位預測,在得分中選取高于0.5的結果作為線性表位。在DNAStar Protean中,選擇同時滿足親水性、柔性、抗原性、可及性序列區域作為線性表位,綜合這三種工具篩選出的線性表位結果。
構象表位是由序列上不相連的氨基酸殘基通過折疊形成的空間結構。構象表位可通過DiscoTope 2.0線上網站預測,在DiscoTope 2.0 server (http://tools.iedb.org/discotope/)中,選擇結果>-3.7的氨基酸作為參與形成B細胞構象表位的關鍵性殘基。
1.4 Der f 38蛋白的T表位預測 Der f 38蛋白的T細胞表位預測主要通過TepiTool(http://tools.iedb.org/tepitool/)進行,選擇IDEB推薦的預測方法[13],從預測的結果中選擇具有活性的表位作為最終的MHC-Ⅱ表位。
2.1 Der f 38蛋白的序列和理化性質 根據螨蟲過敏原Der f 38的氨基酸序列信息,利用SignalP-5.0分析,顯示Der f 38在20位和21位氨基酸之間存在切割位點,信號肽的可能性為99.88%。對Der f 38蛋白序列理化性質分析,其分子量為13.99kDa,分子式為C622H935N187O177S4,理論等電點(pI)為9.08,氨基酸中帶負電荷的殘基(Asp+Glu)有7個,帶正電荷的殘基有11個(Arg+Lys)。不穩定指數(Ⅱ)為31.79,親水性指數(GRAVY)為-0.337,表明該蛋白具有一定的穩定性及親水性。
2.2 Der f 38蛋白的二級與三級結構優化 在SWISS-MODEL同源預測中,RipA蛋白(編號為3ne0.1.A)與Der f 38蛋白的序列一致性為40%,且序列覆蓋率高達83%,因此,以RipA蛋白為模板構建Der f 38蛋白的三級結構模型(見圖1a)。在AlphaFold2預測中,選擇置信度PLDDT最高的模型作為Der f 38蛋白的三級結構模型(見圖1b)。通過SAVES v6.0服務器對兩種方法預測出Der f 38的三級結構進行系統評分,SWISS-MODEL所得模型評分為96.85%,AlphaFold2所得模型評分為100%,即兩種模型中都有超過80%的氨基酸殘基,擁有>0.2的3D/1D值。ERRAT評分中SWISS-MODEL模型得分(92.308,見圖1d)較AlphaFold2模型(82.645,見圖1e)更佳。在PROCHECK的評分中,拉氏圖提示SWISS-MODEL模型在不被允許的區域內存在氨基酸殘基(見圖1g),而AlphaFold2模型的所有氨基酸殘基都落在優勢區域或允許區域內(見圖1h)。綜合評分結果,應選擇AlphaFold2模型進行結構優化。優化后的模型(見圖1c)再次通過SAVES v6.0進行評分,相較于未優化模型各評分均有提升,ERRAT提示優化后模型的評分為100(見圖1f),拉氏圖結果(見圖1i)提示優化后模型的所有氨基酸殘基均在允許區域內,且在最佳區域的氨基酸殘基增加,最終得到Der f 38蛋白的二級結構中含有4個α-螺旋結構和6個β-折疊結構。

圖1 Der f 38蛋白的模型與評分
2.3 Der f 38蛋白的B表位 過敏原蛋白的B細胞表位鑒定是針對該蛋白進行治療、疫苗設計與開發的重要環節。應用ElliPro、Bepipred 2.0、DNAStar protean三種方法預測線性B表位,DiscoTope 2.0預測構象B表位。通過輸入Der f 38的三級結構,ElliPro預測出6個線性表位,其氨基酸位置處于43-59、71-78、83-101、107-113、127-133、135-144。輸入Der f 38的氨基酸序列后,Bepipred 2.0輸出4個線性表位,分別為:40-59、75-78、85-100、132-142,在DNAStar protean中,綜合蛋白的親水性、抗原性、表面可及性、柔韌性(見圖2),預測出2個線性表位:98-101和126-136。將上述三種方法預測出的B表位取交集,收集至少兩種方法預測出的氨基酸序列作為Der f 38最終的線性B表位,其位置分別為43-59、75-78、85-101、127-142(見表1)。DiscoTope 2.0預測出該蛋白中含有8個參與構象表位的氨基酸殘基(見表2),在這8殘基中,除了第34位氨基酸,剩余7個殘基同時位于線性B表位區域,B表位在Der f 38蛋白的模型中的位置見圖3。

表1 Der f 38線性B表位的氨基酸序列

表2 Der f 38參與形成構象B表位的關鍵氨基酸序列

圖2 DNAStar分析的Der f 38蛋白的四種性質

圖3 B細胞表位在Der f 38蛋白空間結構中的位置
2.4 Der f 38蛋白的T表位 在TepiTool中,選擇DP、DR、DQ位點中最常見的26個等位基因與Der f 38蛋白的多肽進行結合,得出11個符合設定閾值的肽鏈,其中有8個與至少2條等位基因相結合,其氨基酸序列為21-35、66-80、72-86、77-91、103-117、108-122、113-127、136-150,具體的氨基酸序列以及與其結合的等位基因信息見表3。

表3 Der f 38的T表位篩選結果
螨蟲是主要的致敏物質之一,可誘發敏感患者產生一系列的過敏癥狀[14]。重組過敏原的發現,促進了基于分子水平免疫治療方法的發展,相較于傳統的螨蟲浸提物形式的治療策略,基于過敏原單體及其衍生物進行個體化的給藥,具有更好的安全性[15]。例如基于B細胞表位融合大分子的Der p 23低致敏疫苗表現出顯著降低的致敏活性,并具有較好的免疫調節能力[16];使用B表位或T表位多肽片段是一種新的多肽免疫治療策略[17]。因此,對過敏原的性質、結構和表位的分析,在新型脫敏治療疫苗的開發中尤為必要。
螨蟲中Der f 38是近年來發現的一類具有Toll樣受體4結合活性的重要過敏原,其過敏率可達到60%[3]。在本研究中,首先根據螨蟲Der f 38過敏原氨基酸序列分析其理化性質,表明該Der f 38屬于親水且穩定的堿性蛋白。為了進一步分析Der f 38的B細胞表位,使用經典SWISS-MODEL進行Der f 38三維結構的同源構建,同時也利用新型基于人工智能工具AlphaFold2進行同步比較[18],最終構建和評價結果也表明AlphaFold2更具有優勢,該策略也為其他過敏原疫苗構建過程提供了新的基于人工智能方法的啟發。Der f 38自身具有的Toll樣受體4結合活性使其具有促炎癥細胞浸潤的作用[3],因此預測并分析Der f 38的表位有助于構建低不良反應的過敏原疫苗。根據Der f 38的氨基酸序列和AlphaFold2構建的三維結構模型,綜合預測工具結果得到了4條位于Der f 38蛋白表面的B表位,同時預測得到的8個參與形成構象表位的關鍵殘基,其中7個殘基位于線性表位當中,這些結果為進一步組合構建Der f 38提供了重要的依據。為了避免過敏原疫苗中T細胞表位可能引起過敏原特異性T細胞活化的遲發性不良反應[19],T細胞的預測分析尤為重要。在TepiTool中分析得到8條候選T細胞表位,可幫助在設計B細胞表位疫苗時選擇合適的多肽區域,達到進一步降低不良反應的目的。
綜上所述,本研究通過對塵螨過敏原Der f 38的理化性質、B細胞和T細胞表位的分析,為其表位、多肽或融合蛋白疫苗的構建提供理論基礎和設計方向,用于達到提高免疫治療療效、降低疫苗不良反應目的。