吳珊珊,朱蕓,陳珊珊,何冰芳
(南京工業大學生物與制藥工程學院,江蘇 南京 211816)
隨著基因組學、蛋白組學以及生物信息學迅速發展,重組蛋白技術日漸成熟,重組蛋白已廣泛應用于生物、醫藥等領域。然而,大規模生產性狀確切的活性蛋白仍是重組蛋白技術中的瓶頸問題。重組蛋白質異源表達中有超過半數以上是以包涵體形式存在的。使用真核表達體系如酵母、昆蟲、哺乳類動物細胞表達體系是一種通用的解決方法,但是過程繁瑣,周期較長。而大腸桿菌以其背景清晰、生長快速、表達量大,易于操作仍為最常用的宿主。采用低溫誘導表達重組蛋白可以減少包涵體的形成,但是很多情況下并不適用。20世紀末,融合標簽技術的興起為重組蛋白質的生產帶來了福音。新融合標簽的開發和利用使融合標簽技術不僅局限用于蛋白質的純化和檢測,而且在提高重組蛋白質的可溶性表達中得到廣泛應用。
融合標簽能增加重組蛋白表達量或在蛋白質折疊過程起作用,增強重組蛋白質的可溶性表達[1],這些融合標簽大多是蛋白質,僅有少數是多肽片段(見表1)。研究表明某些高度可溶的蛋白質在與其它易形成包涵體的蛋白質融合后會促進融合蛋白質以可溶形式表達,這類蛋白主要有谷胱甘肽S-轉移酶(GST),麥芽糖結合蛋白(MBP),硫氧還蛋白A(TrxA),轉錄終止抗終止因子(NusA),蛋白二硫鍵折疊異構酶(DsbA)等(表1)。GST和MBP是發展最早的融合標簽,1988年 Smith等[2]和Duplay等[3]分別使用GST和MBP融合表達重組蛋白并使用親和層析實現一步純化。后續研究表明GST提高重組蛋白溶解性能力有限,導致不溶性的因素尚不清楚,而不溶性的蛋白融合 MBP后常以可溶形式表達[4]。研究者在平行比較中發現,大多數情況下,MBP提高重組蛋白溶解性能力是最強,NusA與 MBP提高溶解性能力相當[5-6],有些研究認為 TrxA也具有相當的提高重組蛋白溶解性的能力[5]。另外,對于一些含有二硫鍵的蛋白, DsbA能夠發揮很好的作用[1]。
近幾年來一些新的提高重組蛋白溶解性的融合標簽嶄露頭角。2004年,Malakhov等[7]研究發現SUMO(泛素相關小修飾蛋白)能夠促進蛋白正確折疊和結合穩定,從而提高蛋白溶解性。雖然SUMO不能作為純化標簽一步純化,但是其優勢在于它本身是一個專一性的蛋白酶,能將SUMO標簽除去。Invitrogen公司在2004年開發了一種新型的增強可溶性表達的多肽標簽(SET),該標簽可能是通過靜電排斥來防止新生多肽相互聚集[8]。同樣通過靜電排斥作用的超酸性融合標簽(yjgD,rpoD,和 msyB)被發現能作為分子內伴侶幫助蛋白質正確折疊,從而提高易發生聚集的牛腸激酶,煙草腐蝕病毒蛋白酶等蛋白溶解性[9]。另一值得注意的融合標簽是Lee等[10]報道的大腸桿菌磷酸甘油酸酯激酶的N域,融合易發生聚集的乘客蛋白后融合蛋白的溶解性增加,切除該標簽后乘客蛋白仍然表現出增強的可溶性。同年,Santner等[11]報道了以本質無序蛋白(intrinsically disordered proteins,IDPs)為基礎的新型提高重組蛋白可溶性表達的標簽。由于IDPs富含極性氨基酸,使得整個融合蛋白的可溶性氨基酸比例增加,同時蛋白之間形成間隙減少蛋白質的聚集。人工設計的具有IDPs特性的肽鏈表現出了比常用融合標簽GST、MBP、NusA優秀或是相當的特性。該研究為開發設計提高重組蛋白溶解性融合標簽提供了新方向。

表1 提高蛋白質產量和溶解性的融合標簽
蛋白質折疊是一個復雜的過程,盡管融合標簽技術的研究有了很大的進展,但是融合標簽在蛋白質折疊中的作用尚不明確[12-13]。目前對提高蛋白溶解性的機制已提出5種模型[12,14-15],從不同的角度闡述融合標簽在蛋白折疊中的作用。但是這些模型僅能夠解釋某些特定的融合標簽發揮作用的機制,并不適用于所有此類標簽[12]。這可能由于不同的融合標簽作用方式也有所不同,如MBP一般融合在N端才會很好地發揮作用,而SET-tag融合在C端才能起作用。
(1)“electrostatic shields”模型 通過帶電載客蛋白間的靜電排斥力減少乘客蛋白分子間的聚集[8],被稱作“electrostatic shields”。這些標簽通常帶有很強的負電荷,如 Invitrogen公司開發的多肽標簽 SET[8]以及一些超酸性融合標簽(如 yjgD,rpoD,和msyB)[9,16-17],因其富含酸性氨基酸而帶有大量負電荷,增加了新生肽之間的排斥力,使得蛋白與蛋白之間空間距離增大,聚集難以發生,從而使得乘客蛋白有足夠的時間正確折疊。Su等[18]在比較一組特殊的蛋白質融合標簽時發現蛋白酸度在增加目的蛋白溶解性中起著重要作用,酸性強的融合標簽提高蛋白溶解性的能力也更強。其實,這類標簽直接參與了幫助蛋白質正確折疊,也相當于具有一定的分子伴侶作用。
(2)“micelle”模型 融合蛋白因在細胞內形成以不完全折疊的以疏水性乘客蛋白為中心,親水性載客蛋白包裹在外的微囊體(micelle)而表現為可溶性蛋白。親水性載體蛋白保護疏水性乘客蛋白與溶劑接觸,防止乘客蛋白的聚集,但是在切除標簽后疏水性乘客蛋白是否能夠正確折疊而具有活性是未知的。研究表明,人體乳頭瘤病毒E6融合MBP表達形成了此類微囊體而以可溶性蛋白的形式表達[19],但是乘客蛋白人體乳頭瘤病毒 E6并沒有活性。
(3)“entropic-anchor”模型 載客蛋白作為一個錨定蛋白“entropic-anchor”,限制緩慢折疊的乘客蛋白運動,減少乘客蛋白的聚集,使乘客蛋白在適宜的熵環境下折疊[20]。根據此模型解釋,融合在蛋白N端或C端所產生的熵作用應當相近因此提高蛋白可溶性表達作用也相近,然而,融合在蛋白的不同末端的作用效果往往有很大差異。因此,這種模型并不能很好的解釋提高蛋白可溶性表達的機理。
(4)“chaperone magnet”模型 載客蛋白通過與分子伴侶相互作用,引導分子伴侶幫助乘客蛋白折疊,這種類似于磁體作用的融合標簽被稱作“chaperone magnet”。鐵蛋白重鏈(FTN-H)含有特殊的序列能被分子伴侶DnaK識別并結合,從而引導DnaK幫助乘客蛋白折疊[21]。
(5)“Chaperone-like”模型 融合標簽本身作為一種分子伴侶,與乘客蛋白作用。據報道麥芽糖結合蛋白(MBP)是一種分子伴侶型融合標簽[14]。由圖1所示,新生的融合蛋白其載客蛋白MBP已折疊而乘客蛋白未折疊,此時它有兩種不同的去向,如果乘客蛋白形成天然構象,就產生可溶性的融合蛋白;或者,乘客蛋白不完全折疊自我聚集形成不溶性包涵體。折疊中間態去向在很大程度上取決于細胞內濃度,高濃度容易產生聚集形成包涵體;而單分子折疊通常發生在低濃度條件下。麥芽糖結合蛋白(MBP)結合乘客蛋白形成隔離折疊中間態,通過折疊中間態和隔離折疊中間態的動態平衡調整細胞內濃度,阻止蛋白分子的聚合。據報道 Trx等[7,13,22]也是作為分子伴侶幫助蛋白質正確折疊從而提高蛋白質的溶解性,目前研究表明此類作用機制的標簽能夠較好地促進蛋白質的可溶性表達[5-6]。

圖1 MBP促進乘客蛋白正確折疊機制[14]
另外,mRNA的二級結構和蛋白質的翻譯起始在蛋白質表達中起著至關重要的作用,mRNA形成的發夾結構使得核糖體無法結合到對應的 SD序列,從而減緩翻譯起始速率。同時核糖體結合位點附近的 mRNA二級結構的穩定性使得蛋白質的表達量有很大差異[23]。融合標簽通常是可溶性表達量較高的蛋白質或是多肽,核糖體能有效的結合其mRNA,因此重組蛋白N端加上融合標簽有利于改變mRNA的二級結構使得核糖體能夠高效結合,從而提高重組可溶性蛋白的產量。研究表明大多N端標簽能增加重組蛋白的產量(見表1)。另一方面,N和C末端影響蛋白質的降解[24],融合標簽也可以通過減少蛋白質降解而增加產量。
單個融合標簽很難滿足大規模生產可溶性蛋白質過程中多方面的要求,組合標簽能使融合標簽技術發揮最大作用。組合純化標簽的使用極大地方便了許多沒有親和吸附能力或是親和力較弱的增溶性標簽(如TrxA,NusA,MBP)的純化[25];融合蛋白包含抗原表位或是綠色熒光蛋白串聯純化標簽His-tag常被用于評估重組蛋白的表達情況[26]。大分子晶體學實驗室(NCI Frederick)[27],伯克利的結構基因組學中心[28]和真核生物結構基因組學中心常組合His-tag和MBP融合表達生產蛋白質。MBP提高重組蛋白的產量和溶解性,His-tag則方便純化,融合蛋白通過兩次固定化金屬離子親和層析純化(IMAC)和帶組氨酸標簽的煙草蝕紋病毒蛋白酶(His6-TEV)酶切,最終得到高純度的目的蛋白。這個系統避免了切除標簽所使用的蛋白酶的污染(見圖2)。
串聯親和純化(TAP)是 1999年 Rigaut和Seraphin[29]開發了新型純化系統,經過兩步連續的親和純化得到更接近自然狀態的蛋白復合物。TAP包含2個親和標簽,鈣調蛋白結合肽(CBP)和蛋白A的IgG結合域(ProtA),中間由1個煙草蝕紋病毒(TEV)蛋白酶切位點連接。將目標蛋白與CBP端相連在細胞內融合表達在生理條件下目標蛋白和內源性與其相互作用的蛋白質形成復合體。首先使用免疫球蛋白 G(IgG)親和柱分離純化蛋白復合體,采用TEV蛋白酶切割標簽獲得含有CBP的目標蛋白復合體;再使用偶聯鈣調蛋白的親和柱結合 CBP標簽在過量螯合劑作用下純化得到復合體進一步分析鑒定。TAP方法首先在酵母細胞中獲得成功后迅速被應用到其他細胞和組織中。除了最早使用的 CBP-TEV-ProtA目前應用的串聯親和純化標簽還有S3S(串聯S-tag和Strep-tagⅡ)和PTP(串聯ProtC-TEV-ProtA)等[30]。

圖2 使用融合標簽His6-MBP表達蛋白的純化原理圖

表2 重組蛋白表達和純化常用酶切位點和蛋白酶
融合標簽可能會使蛋白質的結構和性質上產生某種不可預知的變化,因此,切除標簽對保證蛋白質的性質是必要的。常用的蛋白酶有腸激酶、煙草蝕紋病毒蛋白酶(TEV)、SUMO蛋白酶、凝血酶等(如表 2)。蛋白酶的位點專一性不同,有些蛋白酶位點專一性高,而有些蛋白酶可能發生非特異性切割,酶切效率通常可以通過使用更多的酶或更長的時間或在蛋白酶識別位點添加多個丙氨酸來改進。一些高位點專一性的蛋白酶,如TEV和人鼻病毒蛋白酶(PreScission)很大程度上減輕非特異性問題。但是通常目的蛋白上會留下幾個氨基酸殘基。許多蛋白質要獲得生物活性以及結構穩定性都需要特定的N端氨基酸,尤其是很多用于結構研究以及醫療用途的蛋白質。TEV的酶切位點左邊的甘氨酸可以換成其他氨基酸,但是會導致切割效率下降。Xa因子(IEGR/)和腸激酶(DDDDK/)酶切能夠形成蛋白質天然的N端結構,但是偶爾會在其他位置酶切[31-32]。在正確識別酶切位點的前提下,如何避免產生非天然N端氨基酸是很多蛋白酶使用過程中所面臨的一個挑戰。比起去除N端融合標簽,C端標簽問題更多。用來切除融合蛋白的所有蛋白酶的識別位點都在易于斷開鍵的左邊,因此切除C端標簽后,仍會留下4~6個氨基酸殘基。某些情況下,可以使用羧肽酶消化C端的短標簽,但羧肽酶的序列專一性還有待進一步改進。Chong等[33]使用不需要蛋白酶參與的內含肽系統表達重組蛋白,在有二硫蘇糖醇、β-巰基乙醇或半胱氨酸存在的條件下,能利用其可誘導的自切割活性將靶蛋白質從融合標簽上切除,切除后形成的蛋白質不帶有任何額外的非天然殘基。另外還有泛素修飾蛋白質(SUMO)以及泛素融合系統(Ub)利用蛋白酶識別三級結構切割得到天然結構的蛋白。
融合標簽技術的發展為可溶性蛋白質的生產包括一些難以表達的蛋白藥物表達提供了便利,許多融合標簽系統已作為實現可溶性表達和純化的常用方法。盡管如此,融合標簽的應用尚存在問題:①許多提高蛋白溶解性的融合標簽只適用于某些蛋白,對于不同的蛋白,提高溶解性的能力也不同,目前很難準確地預測融合標簽對某一易聚集的目的蛋白的作用,只有通過大量比較實驗而選擇,工作量較大;②許多融合標簽功能單一,很難滿足蛋白質大規模生產中多種需求;③融合標簽增加可溶性表達的機理尚未完全了解,很難有目的性地開發,改造和選用融合標簽。可以預見,在解決了以上 3個關鍵問題的基礎上,人們將得到高效多功能的融合標簽滿足蛋白質的可溶性表達和純化等多方面要求。這將為可溶性蛋白質的生產,特別是合成生物學的發展提供強大的支撐作用。因此開發高效的多功能融合標簽,探究融合標簽機理以及融合標簽技術的改進已是迫在眉睫。作者實驗室致力于開發新型的多功能融合標簽,目前研究表明該標簽具有提高蛋白可溶性表達的作用,并正對其純化方法和作用機理進一步研究。
[1]Young C L,Britton Z T,Robinson A S. Recombinant protein expression and purification:A comprehensive review of affinity tags and microbial applications[J]. J. Biotechnol.,2012,7(5):620-634.
[2]Smith D B,Johnson K S. Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase[J]. Gene,1988,67(1):31-40.
[3]di Guan C,Li P,Riggs P D,et al. Vectors that facilitate the expression and purification of foreign peptides in Escherichia coli by fusion to maltose-binding protein[J]. Gene,1988,67(1):21-30.
[4]Dyson M R,Shadbolt S P,Vincent K J,et al. Production of soluble mammalian proteins in Escherichia coli:Identification of protein features that correlate with successful expression[J]. BMC.Biotechnol.,2004,4(1):32.
[5]Dummler A,Lawrence A M,de Marco A. Simplified screening for the detection of soluble fusion constructs expressed in E. coli using a modular set of vectors[J]. Microl. Cell Fact.,2005,4(1):34.
[6]Schrodel A,Volz J,de Marco A. Fusion tags and chaperone co-expression modulate both the solubility and the inclusion body features of the recombinant CLIPB14 serine protease[J]. J.Biotechnol.,2005,120(1):2-10.
[7]Malakhov M P,Mattern M R,Malakhova O A,et al. SUMO fusions and SUMO-specific protease for efficient expression and purification of proteins[J]. J. Struct. Funct. Genomics,2004,5(1-2):75-86.
[8]Zhang Y B,Howitt J,McCorkle S,et al. Protein aggregation during overexpression limited by peptide extensions with large net negative charge[J]. Protein Expr. Purif.,2004,36(2):207-216.
[9]Zou Z,Cao L,Zhou P,et al. Hyper-acidic protein fusion partners improve solubility and assist correct folding of recombinant proteins expressed in Escherichia coli[J]. J. Biotechnol.,2008,135(4):333-339.
[10]Song J A,Lee D S,Park J S,et al. The N‐domain of Escherichia coli phosphoglycerate kinase is a novel fusion partner to express aggregation‐prone heterologous proteins[J]. Biotechnol. Bioeng.,2012,109(2):325-335.
[11]Santner A A,Croy C H,Vasanwala F H,et al. Sweeping away protein aggregation with entropic bristles:Intrinsically disordered protein fusions enhance soluble expression[J]. Biochemistry,2012,51(37):7250-7262.
[12]Raran-Kurussi S,Waugh D S. The ability to enhance the solubility of its fusion partners is an intrinsic property of maltose-binding protein but their folding is either spontaneous or chaperone-mediated[J].PLOS ONE,2012,7(11):e49589.
[13]Nallamsetty S,Waugh D S. Solubility-enhancing proteins MBP and NusA play a passive role in the folding of their fusion partners[J].Protein Expr. Purif.,2006,45(1):175-182.
[14]Kapust R B,Waugh D S. Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of polypeptides to which it is fused[J]. Protein Sci.,1999,8(8):1668-1674.
[15]Nallamsetty S,Waugh D S. Mutations that alter the equilibrium between open and closed conformations of Escherichia coli maltose-binding protein impede its ability to enhance the solubility of passenger proteins[J]. Biochem. Biophys. Res. Commun.,2007,364(3):639-644.
[16]Zou Z,Fan Y,Zhang C. Preventing protein aggregation by its hyper-acidic fusion cognates in Escherichia coli[J]. Protein Expr.Purif.,2011,80(1):138-144.
[17]Sangawa T,Tabata S,Suzuki K,et al. A multipurpose fusion tag derived from an unstructured and hyperacidic region of the amyloid precursor protein[J]. Protein Sci.,2013,22(6):840-850
[18]Su Y,Zou Z,Feng S,et al. The acidity of protein fusion partners predominantly determines the efficacy to improve the solubility of the target proteins expressed in Escherichia coli[J]. J. Biotechnol.,2007,129(3):373-382.
[19]Nomine Y,Ristriani T,Laurent C,et al. Formation of soluble inclusion bodies by HPV E6 oncoprotein fused to maltose-binding protein[J]. Protein Expr. Purif.,2001,23(1):22-32.
[20]Fox J D,Kapust R B,Waugh D S. Single amino acid substitutions on the surface of Escherichia coli maltose‐binding protein can have a profound impact on the solubility of fusion proteins[J]. Protein Sci.,2001,10(3):622-630.
[21]Ahn J-Y,Choi H,Kim Y-H,et al. Heterologous gene expression using self-assembled supra-molecules with high affinity for HSP70 chaperone[J]. Nucleic Acids Res.,2005,33(12):3751-3762.
[22]Jurado P,de Lorenzo V,Fernández L A. Thioredoxin fusions increase folding of single chain fv antibodies in the cytoplasm of Escherichia coli:Evidence that chaperone activity is the prime effect of thioredoxin[J]. J. Mol. Biol.,2006,357(1):49-61.
[23]Kudla G,Murray A W,Tollervey D,et al. Coding-sequence determinants of gene expression in Escherichia coli[J]. Science,2009,324(5924):255-258.
[24]Flynn J M,Neher S B,Kim Y I,et al. Proteomic discovery of cellular substrates of the ClpXP protease reveals five classes of ClpX-recognition signals[J]. Mol. Cell.,2003,11(3):671-683.
[25]Cabrita L D,Dai W,Bottomley S P. A family of E. coli expression vectors for laboratory scale and high throughput soluble protein production[J]. BMC Biotechnol.,2006,6(1):12.
[26]Liu H,Naismith J H. A simple and efficient expression and purification system using two newly constructed vectors[J]. Protein.Expr. Purif.,2009,63(2):102-111.
[27]Tropea J E,Cherry S,Nallamsetty S,et al. A generic method for the production of recombinant proteins in Escherichia coli using a dual hexahistidine-maltose-binding protein affinity tag[J]. Methods Mol.Biol.,2007,363(1):1-19.
[28]Nguyen H,Martinez B,Oganesyan N,et al. An automated small-scale protein expression and purification screening provides beneficial information for protein production[J]. J. Struct. Funct. Genomics,2004,5(1-2):23-27.
[29]Rigaut G,Shevchenko A,Rutz B,et al. A generic protein purification method for protein complex characterization and proteome exploration[J]. Nat. Biotechnol.,1999,17(10):1030-1032.
[30]Walls D,Loughran S T. Tagging recombinant proteins to enhance solubility and aid purification[J]. Methods Mol. Biol.,2011,681(9):151-175.
[31]Liew O W,Ching Chong J P,Yandle T G,et al. Preparation of recombinant thioredoxin fused N-terminal proCNP:Analysis of enterokinase cleavage products reveals new enterokinase cleavage sites[J]. Protein Expr. Purif.,2005,41(2):332-340.
[32]Jenny R J,Mann K G,Lundblad R L. A critical review of the methods for cleavage of fusion proteins with thrombin and factor Xa[J].Protein Expr. Purif.,2003,31(1):1-11.
[33]Chong S,Mersha F B,Comb D G,et al. Single-column purification of free recombinant proteins using a self-cleavable affinity tag derived from a protein splicing element[J]. Gene,1997,192(2):271-281.
[34]LaVallie E R,DiBlasio E A,Kovacic S,et al. A thioredoxin gene fusion expression system that circumvents inclusion body formation in the E. coli cytoplasm[J]. Biotechnology(N Y),1993,11(2):187-193.
[35]Davis G D,Elisee C,Newham D M,et al. New fusion protein systems designed to give soluble expression in Escherichia coli[J].Biotechnol. Bioeng.,1999,65(4):382-388.
[36]Sabin E A,Lee-Ng C T,Shuster J R,et al. High-level expression and in vivo processing of chimeric ubiquitin fusion proteins in Saccharomyces Cerevisiae[J]. Nat. Biotech.,1989,7(7):705-709.
[37]Chatterjee D K,Esposito D. Enhanced soluble protein expression using two new fusion tags[J]. Protein Expr. Purif.,2006,46(1):122-129.
[38]Zhang Y,Olsen D R,Nguyen K B,et al. Expression of eukaryotic proteins in soluble form in Escherichia coli[J]. Protein Expr. Purif.,1998,12(2):159-165.
[39]Thapa A,Shahnawaz M,Karki P,et al. Purification of inclusion body-forming peptides and proteins in soluble form by fusion to Escherichia coli thermostable proteins[J]. BioTechniques,2008,44(6):787-796.
[40]Carter P,Wells J A. Engineering enzyme specificity by“substrate-assisted catalysis”[J]. Science,1987,237(4813):394-399.
[41]Kapust R B,Tozser J,Fox J D,et al. Tobacco etch virus protease:Mechanism of autolysis and rational design of stable mutants with wild-type catalytic proficiency[J]. Protein Eng.,2001,14(12):993-1000.
[42]Cordingley M G,Callahan P L,Sardana V V,et al. Substrate requirements of human rhinovirus 3C protease for peptide cleavage in vitro[J]. J. Biol. Chem.,1990,265(16):9062-9065.
[43]Karpeisky M,Senchenko V N,Dianova M V,et al. Formation and properties of S-protein complex with S-peptide-containing fusion protein[J]. Febs. Letters,1994,339(3):209-212.