徐本錦,李卓禧,范 蕾,李 璟,嚴榮榮,杜 淼,宣 焱,門 杰,陳曉聰,湯文婷,侯艷香,宋彬妤,楊婭男,劉曉梁,余駿驍,劉 玲
(山西醫(yī)科大學汾陽學院 1.醫(yī)學檢驗系、2.基礎(chǔ)醫(yī)學部、3.山西省汾陽醫(yī)院檢驗科、4.科技中心,山西 汾陽 032200)
2019年,新冠病毒(SARS-CoV-2)的出現(xiàn)及其在世界范圍內(nèi)的迅速傳播造成了嚴重的全球公共衛(wèi)生安全事件[1]。截至2021年6月17日7時01分,全球累計確診病例超過17 778萬例,累計死亡病例384.8萬例。SARS-CoV-2是單股正鏈RNA病毒,顆粒呈球形或多形性,直徑80~120 nm,其核酸與核衣殼蛋白緊密包裝在病毒顆粒中,病毒膜表面有刺突[2]。人類感染該病毒后常表現(xiàn)為上呼吸道感染、干咳、中低度發(fā)熱、呼吸困難、肺炎、多臟器衰竭,嚴重者可致死。新冠肺炎疫情(COVID-19)在全球范圍的大肆傳播,迫切需要深入研究病毒傳播和感染的分子機制。
跨膜絲氨酸蛋白酶2(transmembrane serine proteinase 2,TMPRSS2)屬于II型絲氨酸蛋白酶(type II transmembrane serine protease,TTSPs)家族成員[3]。人類TMPRSS2基因定位于染色體21q22.3,N端有跨膜區(qū),C端有“催化三聯(lián)體”(絲氨酸-組氨酸-天冬氨酸)結(jié)構(gòu)域,此外,還包括低密度脂蛋白受體結(jié)構(gòu)域 (low-density lipoprotein receptor domain,LDLR)和清道夫受體結(jié)構(gòu)域(scavenger receptor domain,SR)[4]。人類TMPRSS2蛋白在呼吸道細胞表面大量表達,可切割ACE2蛋白(angiotensin-converting enzyme 2)和刺突蛋白(spike glycoprotein),對于冠狀病毒侵染宿主細胞起著至關(guān)重要的作用[5],是開發(fā)新冠病毒抑制劑和治療藥物的關(guān)鍵靶點。SARS-CoV-2的感染依賴于TMPRSS2的活性,高表達TMPRSS2的細胞在病毒侵染時會產(chǎn)生更高的病毒損傷[6]。TMPRSS2通過切割ACE2和S蛋白,激活了S蛋白,使SASR-CoV-2更容易進入細胞。研究發(fā)現(xiàn),TMPRSS2的關(guān)鍵殘基(H296、S441和S460)與SARS-CoV-2 S蛋白裂解位點的側(cè)翼殘基相互作用[1, 7],因此,TMPRSS2在SARA-CoV-2進入宿主細胞過程中發(fā)揮重要作用。TMPRSS2在肺和腸道中的高表達使得這兩個器官更容易受到SARS-CoV-2的侵襲[8]。
為進一步揭示TMPRSS2在病毒入侵過程中的作用機制及其結(jié)構(gòu)與功能特性,本文利用生物信息分析手段對TMPRSS2蛋白的生物學特性進行了系統(tǒng)分析,同時對該蛋白進行了同源性分析和進化分析,此外,還構(gòu)建了TMPRSS2蛋白的原核表達載體。本研究有助于闡明TMPRSS2在SARS-CoV-2侵染人體細胞中的作用機制,對于研發(fā)靶向該蛋白的抑制劑和抗病毒藥物具有重要意義。
1.1 材料質(zhì)粒pET-22b為本室保存,DNA分子量標準、感受態(tài)細胞及質(zhì)粒DNA提取試劑購自全式金;限制性內(nèi)切酶購自NEB;氨芐西林和IPTG等常規(guī)生化試劑購自國藥。
1.2 運用相關(guān)網(wǎng)站分析TMPRSS2蛋白的理化性質(zhì)、翻譯后修飾位點、信號序列、分子構(gòu)型及B/T細胞表位等功能特點。
1.3 多序列比對與進化分析從UniProt網(wǎng)站下載12條TMPRSS2蛋白序列,用Clustal×2及MEGA7.0進行序列比對及系統(tǒng)進化樹分析。
1.4 載體構(gòu)建及蛋白表達對質(zhì)粒pET-22b和TMPRSS2基因用XhoI與NdeI同步雙酶切,回收酶切產(chǎn)物,將目的基因與載體進行連接,將連接產(chǎn)物轉(zhuǎn)化Top10和BL21感受態(tài)細胞后進行PCR驗證。
2.1TMPRSS2蛋白的理化性質(zhì)TMPRSS2由492個氨基酸組成,其中酸性氨基酸(Asp+Glu)有35個,堿性的氨基酸(Arg+Lys)有39個,Ser含量最高(0.089),其次是Gly(0.087)(Tab 1),分子量53.86 ku,理論等電點8.12,是一個堿性蛋白。該蛋白分子式為 C2387H3654N650O709S33,原子總數(shù)為7 433,分子消光系數(shù)為118 145 L·mol-1·cm-1,不穩(wěn)定系數(shù)為41.94;在哺乳動物網(wǎng)織紅細胞中的半衰期約為30 h,在酵母中>20 h,在大腸桿菌內(nèi)>10 h,脂肪族氨基酸指數(shù)72.70,總平均親水系數(shù)-0.248。

Tab 1 Amino acid composition of TMPRSS2 protein
2.2TMPRSS2蛋白跨膜結(jié)構(gòu)預測結(jié)果顯示,該蛋白第M1-K83肽段位于細胞膜內(nèi),A84-W106肽段處于跨膜區(qū),K107-G492肽段位于細胞膜外。跨膜螺旋殘基數(shù)的期望值約21.818,N-term位于膜細胞質(zhì)側(cè)的總概率為0.948。因此TMPRSS2蛋白存在1個跨膜螺旋區(qū),屬于跨膜蛋白(Fig 1)。
2.3TMPRSS2蛋白卷曲螺旋預測結(jié)果顯示,基于3種不同的窗口寬度(14、21、28)沒有檢測到卷曲螺旋結(jié)構(gòu)(Fig 2)。
2.4TMPRSS2蛋白親/疏水性分析預測結(jié)果顯示,TMPRSS2蛋白的平均親水系數(shù)為-0.248,殘基E178,K340和T341的親水性最強,Score值為-2.733;殘基A98的疏水性最強,Score值為2.378,且親水遠多于疏水氨基酸。因此可以推測其蛋白為親水性蛋白(Fig 3)。
2.5TMPRSS2蛋白磷酸化位點預測預測顯示,TMPRSS2含有49個可能的磷酸化位點,其中Ser、Thr及Tyr磷酸化位點分別有25個、14個和10個(Fig 4),這些位點及其相應激酶如Tab 2。

Tab 2 Phosphorylation sites of TMPRSS2 protein and corresponding kinases

Fig 1 Transmembrane structure prediction of TMPRSS2 protein

Fig 2 Coiled coil analysis of TMPRSS2 protein

Fig 3 Hydrophilic/hydrophobic analysis of TMPRSS2 protein

Fig 4 Phosphorylation site of TMPRSS2 protein
2.6TMPRSS2蛋白糖基化位點預測結(jié)果顯示,TMPRSS2蛋白存在3個的N-糖基化,分別是N128,N213和N249(Fig 5A);有12個O-糖基化,分別是S5、S61、S71、S79、S163、S204、S232、S233、S250、T31、T67和T447(Fig 5B)。

Fig 5 Glycosylation sites prediction of TMPRSS2 protein
unsp indicates an undetermined kinase
2.7TMPRSS2蛋白的功能位點分析TMPRSS2蛋白有3個活性位點,分別是H296、D345和S441,它們構(gòu)成了一個電荷中繼系統(tǒng)。通過查閱文獻發(fā)現(xiàn),目前已報道多個人源TMPRSS2蛋白的突變位點(Tab 3)。

Tab 3 Mutation sites of TMPRSS2 protein
2.8TMPRSS2蛋白的亞細胞定位和信號序列預測亞細胞定位分析顯示,人源TMPRSS2蛋白主要表達在細胞的內(nèi)質(zhì)網(wǎng)膜(0.444)、線粒體(0.333)、細胞質(zhì)(0.111)和細胞核(0.111)。信號序列預測顯示,該蛋白不含信號序列,說明它不屬于分泌蛋白。
2.9TMPRSS2蛋白多序列對比在線檢索與人源TMPRSS2蛋白序列同源性較高的其它11種動物:大猩猩,黑猩猩,南方豚尾獼猴,東非狒狒,家貓,山羊,鴨嘴獸,袋熊,樹鼩,西班牙猞猁以及中華鱉。結(jié)果顯示,TMPRSS2蛋白在哺乳動物間的保守性很高,12條序列中完全相同的殘基(*標示)占0.329,性質(zhì)相似的(:標示)占0.128,性質(zhì)微弱相近的(.標示)占0.073。與人源TMPRSS2序列一致性最高的是黑猩猩,高達0.980,其次是大猩猩,為0.974;人與東非狒狒和南方豚尾獼猴的序列一致性分別為0.886和0.878,與中華鱉的序列一致性最低,為0.616(Fig 6)。
2.10 系統(tǒng)進化分析對上述“2.9”構(gòu)建進化樹,結(jié)果顯示,黑猩猩和大猩猩與人三者聚為一支,置信度為100;東非狒狒與南方豚尾獼猴聚為一支,置信度為100;家貓與西班牙猞猁聚為一支,置信度為100。山羊單獨聚為一支,與人的親緣關(guān)系最遠(Fig 7)。
2.11TMPRSS2蛋白的二級結(jié)構(gòu)預測TMPRSS2蛋白含有α-螺旋(Hh)80個,占0.162 6;延長鏈(Ee)124個,占0.252 0;β-轉(zhuǎn)角(Tt)65個,占0.132 1;無規(guī)卷曲(Cc)223個,占0.453 3(Fig 8)。
2.12TMPRSS2蛋白三級結(jié)構(gòu)建模利用相關(guān)構(gòu)建TMPRSS2蛋白的三級結(jié)構(gòu)模型,結(jié)果只顯示D144-D491位、G103-A490位,以及S167-R489位的三級結(jié)構(gòu)(Fig 9)。
2.13 B/T細胞抗原表位預測
2.13.1B細胞表位分析 B細胞表位分析有助于減少和合成多肽片段的范圍與數(shù)量,提高試驗效率。利用IEDB對該蛋白進行B細胞抗原表位預測,篩選閾值設(shè)定為0.50。結(jié)果顯示,可能含有13個B細胞抗原表位,分別為S5-K80、L105-S122、T125-P154、Y161-I256、A262-L263、E299-P305、Q317-A324、H334-N343、M372-L373、E388-S394,T407-L419,Q431-S441,G462-Y469(Fig 10)。
2.13.2T細胞表位分析 本文運用以下兩種方法對TMPRSS2蛋白的T細胞表位進行分析:其中HLA-A*02:01限制性CTL表位,閾值為25,檢測出1個限制性CTL表位;HLA-DRB1*0401輔助性T細胞表位,閾值設(shè)為26,檢測出6個HLA-DRB1*0401輔助性T細胞表位。
2.14TMPRSS2的蛋白-蛋白互體分析TMPRSS2與其他10個蛋白存在互作,分別是跨膜絲氨酸蛋白酶4(TMPRSS4)、血管緊張素轉(zhuǎn)化酶2(ACE2)、轉(zhuǎn)錄調(diào)節(jié)因子ERG(ERG)、ETS易位變異體4(ETV4)、ETS易位變異體1(ETV1)、雄激素受體(AR)、溶質(zhì)載體家族45成員3(SLC45A3)、同源框蛋白Nkx-3.1(NKX3-1)、DNA依賴性蛋白激酶催化亞基(PRKDC)和多聚腺苷二磷酸核糖聚合酶-1(PARP1)(Fig 11)。

Fig 6 Multi sequence comparison of TMPRSS2 protein

Fig 7 Phylogenetic tree based on TMPRSS2 protein sequence

Fig 8 Prediction of secondary structure of TMPRSS2 protein

Fig 9 Schematic diagram of tertiary structure and similarity waveform of homologous proteins

Fig 10 Prediction of B cell antigen epitopes of TMPRSS2 protein

Fig 11 Analysis of interaction network of TMPRSS2 protein
2.15 pET-22b-TMPRSS2原核表達載體的構(gòu)建
2.15.1質(zhì)粒pET-22b與TMPRSS2基因片段的酶切及菌落PCR驗證 對質(zhì)粒pET-22b單酶切(NddeⅠ)及同步雙酶切,反應體系為100 μL,電泳結(jié)果與預期相符(Fig 12A)。雙切酶TMPRSS2基因片段進行NdeⅠ和XhoⅠ雙酶切(Fig 12B),通過菌落PCR鑒定陽性克隆(Fig 12C)。
2.15.2pET-22b-TMPRSS2質(zhì)粒的驗證及轉(zhuǎn)化 用NdeI和XhoI對重組質(zhì)粒進行雙酶切,電泳檢測后結(jié)果符合預期(Fig 13A)。將重組質(zhì)粒轉(zhuǎn)化感受態(tài)細胞Top10,涂布LB平板(Amp+)后37 ℃培養(yǎng)12 h(Fig 13B左)。將驗證后的重組質(zhì)粒轉(zhuǎn)化感受態(tài)細胞BL21(Fig 13B右),用于表達目標蛋白。

Fig 12 Double enzyme digestion of pET-22b and TMPRSS2 gene fragment and colony PCR verification of positive clones

Fig 13 Double enzyme digestion verification and transformation of recombinant plasmid
SARS-CoV-2入胞的第一步是刺突蛋白S與受體ACE2識別,在宿主蛋白TMPRSS2的催化下完成病毒粒子與宿主細胞的膜融合。研究表明,SARS-CoV-2之所以不同于SARS-CoV,就在于它能更快地利用TMPRSS2。當SARS-CoV-2入侵時,TMPRSS2對S蛋白的S2亞基上進行酶切[1],這個切割點后露出一段疏水殘基,并迅速嵌入宿主細胞膜。隨后,伸展的S蛋白會折疊起來,像拉鏈一樣迫使病毒的外膜與細胞膜融合。
本文生信分析顯示,TMPRSS2為親水性跨膜蛋白,說明其可能作為膜受體或膜離子通道起作用。TMPRSS2由492個氨基酸組成,分子量53.86 ku,等電點8.12,是一個堿性蛋白,這與其含有較多正電荷殘基相契合。TMPRSS2蛋白的不穩(wěn)定性與親水性,為離子交換分離純化、體外探究該蛋白的功能奠定了理論基礎(chǔ)[11-12]。TMPRSS2蛋白在哺乳動物間保守性很高,與人源TMPRSS2序列一致性最高的是黑猩猩(0.980 0),次是大猩猩(0.974 0),暗示該蛋白在功能上的重要性。進化分析顯示,黑猩猩、大猩猩與人親緣關(guān)系最近,三者聚為一支,置信度為100;山羊單獨聚為一支,與人的親緣關(guān)系最遠。
糖基化和磷酸化是兩種重要的蛋白質(zhì)翻譯后修飾方式。TMPRSS2是抗病毒藥物設(shè)計的重要靶點蛋白,有3個潛在的N-糖基化位點和12個O-糖基化位點。高度親水的糖基,對于蛋白質(zhì)的理化性質(zhì)和生理功能具有重要影響。TMPRSS2蛋白糖基化位點的改造可進一步影響該蛋白的半衰期、靶向性、以及穩(wěn)定性,有助于研制針對TMPRSS2蛋白的抗病毒藥物。蛋白磷酸化修飾主要參與細胞內(nèi)信號轉(zhuǎn)導等生物學過程,而糖基化修飾可使不同蛋白質(zhì)擁有不同的標記,從而改變多肽的構(gòu)象,因此通過干預磷酸化和糖基化修飾位點將有望抑制病毒對宿主的侵染[13]。
TMPRSS2具有3個功能結(jié)構(gòu)域:N端LDL受體A類結(jié)構(gòu)域(C113-C148),其次是SRCR(G153-V246),最后是跨越I256-Q487的C端肽酶[7]。當TMPRSS2與ACE2共表達時,TMPRSS2能夠切割ACE2并激活S蛋白,促進S蛋白與ACE2相互識別從而介導病毒入侵[14],因此,TMPRSS2在病毒入侵過程中發(fā)揮了“助攻”作用,TMPRSS2與ACE2的高表達可提高SARS-CoV-2的入侵能力[15]。研究發(fā)現(xiàn)[1, 16],TMPRSS2抑制劑可明顯抑制SARS-CoV-2 S蛋白進入表達TMPRSS2的細胞系,而促進TMPRSS2的表達則可取消這種抑制作用,這就說明SARS-CoV-2 的S蛋白依賴于TMPRSS2啟動,TMPRSS2的表達能夠促進SARS-CoV-2的攝取[17]。
二級結(jié)構(gòu)預測發(fā)現(xiàn),TMPRSS2二級結(jié)構(gòu)中占比最高的是無規(guī)則卷曲,該結(jié)構(gòu)對TMPRSS2的整體構(gòu)象和活性有著極其重要的作用,是構(gòu)成酶活性部位和特異功能部位的重要結(jié)構(gòu)[18]。本研究還建立了TMPRSS2蛋白在D144-D491、G103-A490、S167-R489位點的三級結(jié)構(gòu)模型,為進一步設(shè)計和篩選TMPRSS2蛋白的潛在抑制劑和靶向藥物奠定了結(jié)構(gòu)基礎(chǔ)[3]。表位預測顯示,TMPRSS2蛋白具有13個B細胞抗原表位,這一結(jié)果對于找到有著相似免疫保護功能及抗原特異性卻無完整蛋白毒性的抗原片段,具有很大幫助。此外,TMPRSS2的T細胞表位,這有助于細胞免疫機制研究及基因疫苗或亞單位多肽的開發(fā)。
功能位點分析顯示,TMPRSS2蛋白有多個重要位點,例如R255、I256和S441,三者均處于預測的胰蛋白酶位點之內(nèi),同時I256和S441還位于Tryp-SPc位點之中。R255Q的突變會導致TMPRSS2徹底失去酶切活性[9]。此外,本研究結(jié)果顯示S441還是一個潛在的磷酸化位點,同時也是B細胞抗原表位的關(guān)鍵殘基。有報道稱,S441作為TMPRSS2的關(guān)鍵殘基與SARS-CoV-2 S蛋白裂解位點的側(cè)翼殘基具有相互作用[1, 7],S441R的突變會導致TMPRSS2活性喪失[9]。以上結(jié)果進一步印證了TMPRSS2蛋白協(xié)助病毒入侵的重要功能,同時為研發(fā)靶向TMPRSS2的抑制劑奠定了基礎(chǔ)。
綜上所述,本研究對TMPRSS2蛋白進行了全面的生物信息學分析和過表達載體構(gòu)建,研究結(jié)果為了解TMPRSS2的生物學功能、明確SARS-CoV-2入侵人體細胞的分子機制奠定了基礎(chǔ),同時有助于揭示和完善TMPRSS2蛋白的結(jié)構(gòu)和作用機理,對發(fā)掘其潛在抑制劑和研制靶向藥物具有重要意義。