鄒淑慧,李金亮,廖莎莎,張麗琴,劉聰
(贛州市人民醫院檢驗科,江西 贛州 341000)
至2015年5月以來,寨卡病毒 (Zika Virus,ZIKV)在美洲區域的傳播不斷升級,疫情逐步惡化,甚至有城市化和全球化傳播趨勢,對國際公共衛生造成嚴重威脅[1]。2016年2月,我國出現首例輸入性寨卡病毒感染,隨后國內陸續出現多例ZIKV感染病例,引起我國政府和衛生部門的廣泛關注[2]。
寨卡病毒屬黃病毒屬,為單股正鏈RNA,長約11kb,分為亞洲型和非洲型[3],在系統發生樹上與同為黃病毒屬的登革熱病毒、Spondweni病毒、日本腦炎病毒、西尼羅病毒非常相近[4]。寨卡病毒基因編碼多聚蛋白,包括病毒衣殼蛋白C,膜前體蛋白PrM,包膜蛋白 E和7個非結構蛋白(NS1、NS2A、NS2B、NS3、NS4A、NS4B、NS5)。 E 蛋白是病毒表面的主要蛋白,參與調節結合以及膜融合等方面。非結構蛋白中的NS5是病毒中最大的蛋白,含有RNA-依賴RNA聚合酶和甲基轉移酶,負責病毒基因組RNA的合成及加帽[5,6]。本研究將從生物信息的角度分析ZIKV E蛋白和 NS5蛋白序列特征,為進一步挖掘其基因信息,研究其致病機制提供分子依據,從而預防和控制寨卡病毒的感染與流行。
1.1 序列來源 所有病毒株E和NS5核苷酸、氨基酸序列均來源于GenBank中已登記的黃病毒屬相關參考序列。
1.2 ZIKV E、NS5核苷酸與氨基酸同源性比較 用Clustal X和Bioedit軟件對ZIKV不同地理株系及同屬成員的E、NS5基因及編碼蛋白序列進行比對,計算核苷酸與氨基酸同源性。
1.3 ZIKV E、NS5蛋白二級結構分析 選取中國首例分離的ZIKV基因組序列(登陸號:KU744693.1)為研究對象[2],獲取E、NS5基因及氨基酸序列。通過蛋白結構在線預測網站Predict Protein Server(https://www.predictprotein.org/)分析 E、NS5 蛋白的二級結構,對E、NS5蛋白的氨基酸組成以及蛋白序列可能存在的蛋白結合區、α螺旋區、β折疊區以及卷曲結構區域進行分析,同時預測蛋白結構中可能的暴露區域和隱藏區域。
1.4 ZIKV E、NS5蛋白的跨膜區結構分析 利用在線 軟 件 TMHMM v2.0 (http://www.cbs.dtu.dk/services/TMHMM/)對E、NS5蛋白氨基酸序列進行跨膜拓撲結構的預測,從而分析跨膜段、膜內段和膜外段的氨基酸序列。
1.5 ZIKV E、NS5蛋白的信號肽分析 應用Anthe-Pro軟件分析E、NS5蛋白氨基酸序列中可能存在的潛在信號肽結構。
1.6 ZIKV E、NS5蛋白B細胞抗原表位的預測 運用 Bepipred(http://tools.iedb.org/bcell/)在線服務器程序預測E、NS5蛋白中可能的B細胞線性表位,得分大于0.350(軟件默認值)則預測為優勢線性B表位。
2.1 ZIKV E、NS5核苷酸與氨基酸同源性分析 通過比較ZIKV不同地理株系及同屬成員的E、NS5蛋白核苷酸和氨基酸的同源性,結果顯示不同地理株的ZIKV E蛋白核苷酸和氨基酸同源性分別為87.1%~100%和94.2%~100%,跟同黃病毒屬其他成員比較,發現與Spondweni病毒更接近,氨基酸同源性最高達72.8%(表1)。不同地理株的ZIKV NS5蛋白核苷酸和氨基酸同源性分別為88%~99.9%和95.5%~100%,跟同黃病毒屬其他成員比較,也是與Spondweni病毒更接近,氨基酸同源性最高達77.5%(表2)。
2.2 ZIKV E、NS5蛋白二級結構 E蛋白編碼504個氨基酸,可能的蛋白結合位點有14個,主要位于 1~13、55~161、232~394aa 區段;α 螺旋區主要集中在 406~418、436~501aa區段,占 15.28%;β 折疊片主要在 2~73、91~143、165~216、236~401aa 區段,占33.93%;無規則卷曲占50.79%;此外,在蛋白中還可能包含兩個跨膜結構區域 (461~479aa、483~501aa)。整個蛋白暴露區域和隱藏區域均勻相間分布,見圖1。NS5蛋白編碼903個氨基酸,可能的蛋白結合位點有22個,主要位于6~119、247~418、518~744、895~899aa 區段;多聚核苷酸結合位點有兩個,位于741aa和856aa;α螺旋區主要集中在 2 ~67、158 ~288、350 ~444、545 ~575、611 ~627、753~888aa區段,占36.88%;β折疊片主要在74~146、578~606、702~743aa 區段,占 11.52%;無規則卷曲占51.60%;整個蛋白暴露區域和隱藏區域均勻相間分布,見圖1。
2.3 ZIKV E、NS5蛋白的跨膜區結構 TMHMM預測E蛋白有兩個跨膜區域,分別為455~477aa、484~503aa,膜外區域為 1~454aa,膜內區域為 478~483aa,見圖2。整個NS5蛋白均位于膜外,無跨膜區域,見圖3。
2.4 ZIKV E、NS5蛋白的信號肽 E和NS5蛋白均存在潛在信號肽結構,其信號肽斷裂位點分別位于 501aa 和 152aa,見圖 4、圖 5。
2.3 ZIKV E、NS5蛋白的B細胞抗原表位 運用Bepipred法預測B細胞線性表位,結果顯示E蛋白平均抗原性指數為0.062,分子內有多個可能的抗原表位區域。其中分值最高的表位區域為317~342aa,分值達1.919(閾值0.350);其次為155~181、66~89、226~238、380~384aa (按分值高低排列),見圖6。NS5蛋白平均抗原性指數為0.107,分值最高表位區域為100~114aa,分值達2.297;其次為 360~372、148~159、688~707aa,見圖 7。

表1 E蛋白核苷酸和氨基酸的同源性比較

表2 NS5蛋白核苷酸和氨基酸的同源性比較

圖1 E蛋白二級結構(1A)及組成成分(1B)、NS5蛋白的二級結構(1C)及組成成分(1D)

圖2 E蛋白跨膜區域預測

圖3 NS5蛋白跨膜區域預測

圖4 E蛋白信號肽結構預測

圖5 NS5蛋白信號肽結構預測
ZIKV屬于黃病毒科黃病毒屬的一種蟲媒病毒,且是一種人獸共患病毒。寨卡病毒可引起嚴重的神經系統損害,包括格林巴利綜合征(GBS)及新生兒小頭畸形,已經成為威脅全球人類健康的潛在因素[7]。目前尚無針對性的預防性疫苗和治療性藥物,因此開發相關疫苗迫在眉睫。

圖6 Bepipred工具預測E蛋白的線性B細胞表位

圖7 Bepipred工具預測NS5蛋白的線性B細胞表位
在基因組和蛋白質組學時代,基于疫苗開發、單克隆抗體的制備以及快速檢測試劑盒的研制,運用生物信息學工具分析蛋白質序列已成為蛋白質研究的重要手段[8]。本文通過生物信息學分析發現不同地理株系的ZIKV E蛋白和NS5蛋白同源性都比較高,提示這兩段序列比較保守。跟同黃病毒屬其他成員比較,顯示與Spondweni病毒關系最近,但同源性也僅有70%多。說明ZIKV雖然與其他黃病毒發病癥狀相似,但可能已經發展出不同的致病機制。
蛋白質的二級結構對抗原表位影響很大,α螺旋、β折疊的化學鍵鍵能較高,成為蛋白質中心的“支架”,很難與合適的抗體嵌合,而β轉角和無規則卷曲常位于分子表面,利于抗體結合,成為抗原表位的可能。本研究通過Predict Protein Server分析發現ZIKV E蛋白和NS5蛋白二級結構中無規則卷曲含量最高,分別占50.79%和51.60%,推斷這些區域與B細胞表位有關。另外E蛋白和NS5蛋白中還包含有多個可能的蛋白質相互作用位點,提示可能參與多種蛋白或者其他分子之間的相互作用并在ZIKV感染過程中發揮重要作用,可對這些相關功能位點進行深入研究,進一步揭示ZIKV的浸染機制。外膜蛋白通過加強巨噬細胞對抗原的攝取,增強淋巴細胞活化,在免疫反應中表現出重要作用,常作為保護性疫苗候選抗原。跨膜區域預測分析結果顯示E蛋白有兩個跨膜區域,其中氨基酸1~454位于膜外,而NS5均位于膜外。研究表明抗原表位可能不在這兩個跨膜域中[9]。在跨膜蛋白的N端,有一段疏水性氨基酸序列,稱為信號肽,新合成的蛋白質通過該信號肽進入正常的分選途徑。軟件分析表明E蛋白和NS5蛋白含有信號肽,為分泌性蛋白。
抗原優勢表位的確定是疫苗研制和臨床應用的基礎。運用生物信息學方法預測蛋白質的抗原優勢表位,并通過體外合成肽段進行實驗驗證,已廣泛應用于蛋白質抗原表位的鑒定[10]。Bepipred方法是結合線性B細胞表位預測的一種經典算法。本研究通過該方法預測發現,ZIKV E蛋白平均抗原性指數為0.062,分子內有多個可能的抗原表位區域, 如:317~342aa、155~181、66~89、226~238、380~384aa。NS5蛋白平均抗原性指數為0.107,可能的表位區域有 100~114aa,、360~372、148~159、688~707aa。對于進一步確認E、NS5蛋白的優勢表位信息,需要通過體外試驗、動物模型等來進行驗證。本研究預測的相關線性表位將為進一步E、NS5蛋白抗原表位的確證及診療抗體的開發提供一定的參考依據。
總之,本研究對ZIKV E蛋白和NS5蛋白的生物信息學分析,成功預測到其基本的結構特征和潛在的線性B細胞表位。這將有助于對E、NS5蛋白的深入研究奠定理論基礎,為開發ZIKV快速檢測的膠體金試劑盒和治療性抗體提供研究基礎。