高 燦,趙曉彤,程 江,2
(1.石河子大學(xué)醫(yī)學(xué)院,新疆 石河子 832008;2.石河子大學(xué)醫(yī)學(xué)院第一附屬醫(yī)院檢驗科,新疆 石河子 832008)
結(jié)核病(TB)是一種由結(jié)核分枝桿菌(M.tb)引起的傳染性疾病[1,2]。目前,結(jié)核病的感染控制主要靠接種減毒牛分枝桿菌卡介苗(BCG)來實現(xiàn),但BCG并不能對各個年齡組都起到有效的防護作用[3]。分枝桿菌的耐藥性仍在不斷出現(xiàn)不斷增加,全球健康遭到了耐藥結(jié)核菌株的嚴(yán)重威脅,將促使開發(fā)替代治療方法。Rv0288(esxH)是分枝桿菌蛋白大家族ESAT-6 家族(ESAT6,ESX)的一名成員,編碼分泌蛋白TB10.4 蛋白[4]。研究發(fā)現(xiàn)[5],該基因的表達(dá)可以改變INH 和RIF 存在下分枝桿菌的生長,與結(jié)核病耐藥性存在潛在關(guān)聯(lián)。除此之外,TB10.4 蛋白有可能參與鐵/鋅攝取,這一過程在是結(jié)核分枝桿菌生長代謝中起重要作用[6,7]。另有研究發(fā)現(xiàn)[8],Rv0288 基因中的編碼蛋白TB10.4 能刺激機體產(chǎn)生細(xì)胞免疫,具有一定的免疫原性,使結(jié)核病人的免疫系統(tǒng)被識別。因此TB10.4 蛋白有可能成為候選抗原和候選疫苗,用于結(jié)核分枝桿菌感染的診斷[9,10]。本研究通過生物信息學(xué)技術(shù)對結(jié)核分枝桿菌TB10.4 蛋白的結(jié)構(gòu)和功能進(jìn)行預(yù)測,以探索TB10.4 蛋白的結(jié)核耐藥性機制,尋找其在結(jié)核病的藥物新靶點及預(yù)防方面的潛在應(yīng)用價值。
1.1 一般資料 TB10.4 蛋白氨基酸序列來自NCBI(https://www.ncbi.nlm.nih.gov/)網(wǎng)站。在GenBank 中檢索關(guān)鍵詞Rv0288,以獲取H37Rv 全基因組信息。RV0288 基因位于MTB 全基因組的區(qū)域,基因ID為 886603;它的編碼蛋白為TB10.4 蛋白(別名Cfp7,Low molecular weight protein antigen 7 EsxH,ESAT-6-Like protein EsxH),屬于分泌蛋白,在蛋白質(zhì)庫中的登錄號為CCP43018.1,在UniProt 中的登錄號為P9WNK3。通過NCBI 網(wǎng)站查詢,TB10.4 蛋白由96 個氨基酸序列組成,檢索的氨基酸序列如下:MSQIMYNYPAMLGHAGDMAGYAGTLQSLGAEIAV EQAALQSAWQGDTGITYQAWQAQWNQAMEDLVR AYHAMSSTHEANTMAMMARDTAEAAKWGG。
1.2 方法 使用NCBI 網(wǎng)址中的OFR Finder 軟件分析基因Rv0288 的開放閱讀框架;應(yīng)用在線軟件ProtParam、ProtScale 對TB10.4 蛋白進(jìn)行理化性質(zhì)及親疏水性分析。運用在線軟件SOSUI 及Signal IP 預(yù)測TB10.4 蛋白的信號肽和跨膜區(qū),在線軟件TMHMM、NerNGlyc、NetPhos 對TB10.4 蛋白的跨膜結(jié)構(gòu)域、糖基化及磷酸化位點進(jìn)行預(yù)測分析。運用PSORT、WoLF PSORT、CELLO 三個軟件分析TB10.4蛋白的亞細(xì)胞定位,在線軟件SOPMA 預(yù)測TB10.4蛋白的二級結(jié)構(gòu),SWISS-MODEL 預(yù)測TB10.4 蛋白的三級結(jié)構(gòu)并進(jìn)行同源建模。運用IEDB 軟件對TB10.4 抗原蛋白的B 細(xì)胞表位進(jìn)行預(yù)測蛋白的可塑性、線性表位、表面可及性、親疏水性、β-轉(zhuǎn)角、抗原性6 個方面并篩選的B 細(xì)胞表位;運用SYFPEITHI、RANKPEP 預(yù)測TB10.4 蛋白的輔助性T 細(xì)胞(Th)表位,SYFPEITHI、RANKPEP、NetMHC預(yù)測蛋白的CTL 細(xì)胞表位并進(jìn)行綜合分析;并使用STRING 預(yù)測TB10.4 蛋白的相互作用蛋白預(yù)測及富集分析。所用軟件具體網(wǎng)址見表1。

表1 使用的基因分析軟件及蛋白預(yù)測網(wǎng)站
2.1 Rv0288 基因開放閱讀框架 Rv0288 基因(ID:886603)位于MTB 全基因組的351848-352138 區(qū)域,全長291 bp,起始密碼子為ATG,終止密碼子為TAG,見圖1。

圖1 Rv0288 基因開放閱讀框
2.2 理化性質(zhì)及親疏水性 TB10.4 蛋白的理論等電點pI 為4.58,相對分子質(zhì)量為10 390.6;該蛋白由96 個氨基酸組成,含有18 種氨基酸,其中不含吡咯賴氨酸、苯丙氨酸、半胱氨酸、硒代半胱氨酸,而以丙氨酸(20.8%)、甘氨酸(9.4%)、谷氨酰胺(9.4%)、蘇氨酸(6.2%)4 種氨基酸的比例較高。其中有3 個殘基(Arg+Lys)帶正電荷,9 個殘基(ASP+GLU)帶負(fù)電荷。TB10.4 蛋白的分子式為C448H677N125O143S9,原子總數(shù)為1402,消光系數(shù)為29 450,280 nm 處的吸光度為2.834。當(dāng)TB10.4蛋白的N 端殘基為Met 時,它在哺乳動物網(wǎng)狀細(xì)胞中的半壽期為30 h,在大腸埃希菌體內(nèi)的半衰期大于10 h。TB10.4 蛋白為非穩(wěn)定蛋白,其不穩(wěn)定指數(shù)為50.36,脂肪族氨基酸指數(shù)為59.38,平均疏水性為-0.266。使用在線軟件ProtScale 分析TB10.4 蛋白為疏水性蛋白,第56 位氨基酸親水性得分最高為-1.744;第30、31 氨基酸疏水性得分最高為0.878,見圖2。

圖2 TB10.4 蛋白的親(疏)水性分析
2.3 信號肽、跨膜區(qū) 軟件顯示,TB10.4 蛋白是不含信號肽、沒有跨膜區(qū)域的可溶性蛋白;Signal IP 軟件顯示,該蛋白max.C 值為0.121,max.Y 值為0.150,max.S 值為0.263,mean S 值為0.170,其中mean S值<0.45,預(yù)測無信號肽,見圖3。

圖3 TB10.4 蛋白的跨膜結(jié)構(gòu)預(yù)測
2.4 糖基化和磷酸化位點 TMHMM 軟件顯示TB10.4 蛋白無跨膜螺旋結(jié)構(gòu),見圖4;NerNGlyc 軟件顯示該蛋白無糖化位點,見圖5;NetPhos 軟件顯示該蛋白有8 個磷酸化位點,其中磷酸化絲氨酸位點有5 個,分別位于2、27、41、73、74 位氨基酸;磷酸化蘇氨酸位點有2 個,分別位于氨基酸的24 位與88 位;磷酸化酪氨酸位點有1 個,位于氨基酸21位,見圖6。

圖4 TMHMM Server2.0 預(yù)測TB10.4 蛋白的跨膜螺旋

圖5 TB10.4 蛋白亞基糖基化位點分析

圖6 TB10.4 蛋白磷酸化位點分析
2.5 亞細(xì)胞定位 結(jié)果顯示,該蛋白的亞細(xì)胞被定位在細(xì)胞核內(nèi)。軟件PSORT 分析cyto-nucl:14,cyto:11,extr:6;軟件WoLF PSORT 分析extr:17,cyto:11,cyto_nucl:8.5,nucl:4;CELLO 分析此種蛋白位于細(xì)胞外。故TB10.4 蛋白可能定位于細(xì)胞外。
2.6 二級結(jié)構(gòu)及三級結(jié)構(gòu) 運用在線軟件SOPMA 預(yù)測TB10.4 蛋白的二級結(jié)構(gòu),α-螺旋(Hh)83 個,占86.46%;β-轉(zhuǎn)角(Tt)3 個,占3.12%;β-折疊(Ee)3個,占3.12%;7 個無規(guī)則卷曲(Cc),占7.29%,TB10.4 蛋白為不穩(wěn)定性蛋白,見圖7。

圖7 TB10.4 蛋白二級結(jié)構(gòu)預(yù)測
2.7 三級結(jié)構(gòu)同源建模 運用在線軟件SWISSMODEL 軟件預(yù)測TB10.4 蛋白的三級結(jié)構(gòu)并進(jìn)行同源建模,見圖8,SWISS-MODEL 軟件中,運用GMQE和QMEAN 評分進(jìn)行質(zhì)量評估。GMQE 評分分?jǐn)?shù)范圍是0~1 分,數(shù)字越接近1 分的質(zhì)量就越高;QMEAN 評分表示預(yù)測模型與期望值的一致程度,是基于對蛋白三級結(jié)構(gòu)的不同幾何特性的復(fù)合評估,評分范圍為0~4 分,待測蛋白越接近數(shù)字0 與模板蛋白就有更高匹配度。三級結(jié)構(gòu)的同源建模,見圖7。該模型的GMQE 評分為0.71,QMEAN 評分為(0.6±0.09)分,與模板2kg7.1.B 氨基酸序列一致性為100%。

圖8 TB10.4 蛋白三級結(jié)構(gòu)預(yù)測
2.8 B 細(xì)胞表位預(yù)測結(jié)果 運用IEDB 軟件對TB10.4抗原蛋白的B 細(xì)胞表位進(jìn)行預(yù)測,以1.0 作為柔韌性的參數(shù)基線。最終篩選出3 個B 細(xì)胞表位,見表2。
2.9 TB10.4 蛋白Th 表位、CTL 表位的預(yù)測分析結(jié)果
2.9.1 Th 表位 運用SYFPEITHI 和RANKPEP 在線軟件,選擇HLA-DR1*0101、HLA-DR1*0401、HLA-DR1*0701 和HLA-DR1*1101 作為HLA 亞型代表,得到5 條共同的強結(jié)合Th 抗原表位肽段,見表3。

表3 TB10.4 蛋白輔助性T 細(xì)胞表位分析結(jié)果
2.9.2 CTL 表位 運用RANKPEP 軟件對TB10.4蛋白進(jìn)行分析,分值較高的CTL 細(xì)胞抗原表位,見表4。CTL 表位分別為QAQWNQAME(55-63)、PAMMLGHAGD(9 -18),運 用 SYFPEITHI、RANKPEP、NetMHC 三種生物信息學(xué)軟件對TB10.4 蛋白進(jìn)行綜合分析,分值較高的CTL 細(xì)胞抗原表位,見表5。綜合分析得出的TB10.4 蛋白的CTL 表位數(shù)量主要集中分簇于HLA-A2 限制性T細(xì)胞表位,少部分位于HLA-A3,無多肽序列分布在HLA-B7 限制性T 細(xì)胞表位,推測其最佳候選CTL 表位可能位于IMYNYPAML(4-12)等aa 區(qū)段,見表6。

表4 RANKPEP 軟件預(yù)測TB10.4 蛋白CTL 表位

表5 不同軟件預(yù)測TB10.4 蛋白CTL 表位

表6 TB10.4 蛋白CTL 表位綜合分析
2.10 蛋白相互作用網(wǎng)絡(luò) 采用STRING 預(yù)測與TB10.4 相互作用的蛋白質(zhì),顯示其與等蛋白形成相互作用網(wǎng)絡(luò),有esxS、esxB、esxH、esxG、PPE4、PPE18、PE5、eccD3、eccC3、espG3,見圖9。

圖9 MTB H37Rv 相互作用蛋白
結(jié)核病作為一種肺部疾病,具有播散性傳播的潛力[11]。一直以來,對結(jié)核病的治療由于藥品副作用發(fā)生以及患者的依從性差,治療效果往往不佳[12],多重和廣泛耐藥(MDR 和XDR)結(jié)核分枝桿菌(MTB)對全球公共衛(wèi)生構(gòu)成了嚴(yán)重威脅[2,13]。因此,探索新的分枝桿菌藥物靶點對于在不久的將來有效解決抗結(jié)核藥物耐藥性和改善一般結(jié)核病控制至關(guān)重要[2]。接種BCG 疫苗可預(yù)防播散性嚴(yán)重的兒童肺結(jié)核,但在有效性和持久性上卻有著天壤之別[14]。研究表明[15],BCG 可能在所有試驗的早期可提供了高水平的保護,但在結(jié)核病持續(xù)高傳播的環(huán)境中,BCG可能提供很少(甚至為零)的長期保護。因此需要一種新疫苗來提供針對兒童和成人結(jié)核病的一致和持久的保護性免疫力[16]。ESAT6 由結(jié)核分枝桿菌RD1區(qū)編碼,是Mt 重要的毒力因子,也被認(rèn)為是現(xiàn)有的TB 疫苗卡介苗(Bacillus Calmette-Guerin,BCG)減毒的重要原因[17]。作為Mtb 分泌的細(xì)胞外蛋白,ESAT6 是保護性抗原的重要來源[18],對巨噬細(xì)胞的免疫反應(yīng)起調(diào)節(jié)作用,研究報道,ESAT6 能夠誘導(dǎo)巨噬細(xì)胞發(fā)生凋亡,且ESAT6 融合蛋白對巨噬細(xì)胞內(nèi)的Mtb 生存會產(chǎn)生顯著影響[19]。Rv0288(EsxH)屬于分枝桿菌蛋白大家族ESAT-6 家族(Esx)[20],大小約為100 個殘基,存在一個保守的中心WXG 基序,是分枝桿菌內(nèi)協(xié)調(diào)調(diào)節(jié)的基因?qū)Γ幋a分泌蛋白TB10.4 蛋白。
為了較為全面地預(yù)測TB10.4 蛋白的結(jié)構(gòu)與功能性質(zhì),本研究運用了多種生物信息學(xué)軟件對該蛋白進(jìn)行預(yù)測分析。該研究通過生物信息學(xué)手段分析TB10.4 蛋白,結(jié)果顯示該蛋白理論等電點pI 為4.58,且?guī)ж?fù)電荷氨基酸的殘基數(shù)多于帶正電荷氨基殘基數(shù),所以TB10.4 蛋白整體帶負(fù)電荷,與血漿白蛋白電性相同,提示該蛋白可能是通過入血從而發(fā)揮它的作用。TB10.4 蛋白脂肪族氨基酸如丙氨酸(20.8%)、甘氨酸(9.4%)、谷氨酰胺(9.4%)、蘇氨酸(6.2%)在氨基酸組成中所占比例較高,提示該蛋白可能和脂質(zhì)的運輸相關(guān)。TB10.4 蛋白在細(xì)胞中半壽期長達(dá)30 h,在細(xì)菌體內(nèi)半衰期大于10 h,提示該蛋白可能作為免疫抗原分子在體內(nèi)發(fā)揮持久作用。生物信息學(xué)分析顯示TB10.4 蛋白為疏水性蛋白,定位預(yù)測該蛋白可能位于細(xì)胞外,此外,該蛋白為不含信號肽的非跨膜蛋白,提示該蛋白可能于細(xì)胞質(zhì)基質(zhì)中合成從而運輸?shù)郊?xì)胞器中起作用。TB10.4 蛋白有8 個磷酸化位點,提示它可能參與細(xì)胞間信號傳導(dǎo)過程。預(yù)測結(jié)果顯示TB10.4 蛋白二級結(jié)構(gòu)中α-螺旋占86.46%,α-螺旋占比較高的蛋白大多為高度保守蛋白,表明該蛋白可能具有一定的功能。有研究表明,TB10.4 是結(jié)核分枝桿菌(Mtb)的一個重要的毒力蛋白抗原[21],CFP10-TB10.4(CT)融合蛋白與甘露聚糖和洛索里賓的結(jié)合物(CT-man-lox)能顯著增強小鼠的CFP10-TB10.4 融合蛋白特異性體液免疫和細(xì)胞免疫應(yīng)答,CT-man-lox 有可能成為一種有效的抗結(jié)核分枝桿菌蛋白疫苗[22]。預(yù)測分析顯示該蛋白與esxS、esxB、esxH、esxG、PPE4、PPE 18、PE5、eccD3、eccC3、espG3 等多種蛋白相互作用,提示該蛋白參與多種生物學(xué)過程。表位預(yù)測發(fā)現(xiàn)TB10.4 蛋白具有3 條B 細(xì)胞表位肽段,分別為QGDTGI、E、AA,同時,該蛋白具有多條與MHC-Ⅱ類分子結(jié)合的肽段,但它的具體功能還有待于進(jìn)行實驗研究進(jìn)一步驗證。
綜上所述,通過生物信息學(xué)技術(shù)預(yù)測TB10.4 蛋白具有多個B 細(xì)胞及T 細(xì)胞抗原表位,表明該蛋白可能具有抗原性,提示該蛋白在今后有可能作為抗結(jié)核疫苗的候選疫苗。