令狐梅,韓來闖,周哲敏,2,崔文璟,2*
1(江南大學 生物工程學院,江蘇 無錫,214122) 2(工業生物技術教育部重點實驗室(江南大學),江蘇 無錫,214122)
枯草芽孢桿菌(Bacillussubtilis)作為革蘭氏陽性菌的模式菌,在食品、醫藥、飼料、紡織等工業領域具有重要的應用價值[1-2]。隨著基因工程技術和蛋白工程技術的發展,B.subtilis憑借其清晰的遺傳背景,良好的生物安全性,豐富的遺傳操作工具以及成熟的發酵工藝等優勢,逐漸發展成為一種成熟的合成生物學底盤[3-5]。不僅實現了一批工業和食品用酶的高水平制備,如蛋白酶,淀粉酶,脂肪酶,角質酶等,而且成功合成多種生物基平臺化合物。
異源蛋白在原核細胞,如Escherichiacoli和B.subtilis中,蛋白表達受到轉錄和翻譯兩個水平的調控。因此,大多數研究將異源蛋白在宿主中表達水平歸于重組表達元件的性能上。如啟動子的強度對mRNA合成速率的影響,核糖體結合位點的強度對翻譯起始頻率的影響,以及終止子的效率對mRNA穩定性的影響等[6-8]。基于這些理論,在B.subtilis中進行異源基因表達的策略也相應地從啟動子改造、核糖體結合位點(ribosomebinding site,RBS)調控、密碼子優化、終止子等角度出發[9-11]。ZHANG等[12]利用雙串聯啟動子PHpaⅡ-PamyQ提高胞外蛋白β環糊精轉移酶、α環糊精轉移酶和普魯蘭酶產量。GUIZIOU等[13]設計一個包括啟動子庫、RBS和蛋白質降解標記的基因工具箱,實現了枯草芽孢桿菌中基因的精確調節。基因異源表達時,密碼子偏愛性對翻譯效率的影響機制已有報道[14-16]。利用轉運稀有密碼子的tRNA過表達策略,可以提高蛋白表達[17]。
然而,近期研究發現,核糖體與mRNA結合或占用率的增加能夠提高mRNA的穩定性[18]。并且mRNA穩定性和RBS強度之間存在顯著且普遍的相關性,在RBS翻譯效率相差87倍時對應的mRNA水平有4.3倍的增加[19]。這些模塊化的基本元件,如啟動子、UTR(非編碼區)、RBS、終止子在與異源基因進行組合時,功能會受到特定遺傳環境的影響,如mRNA的二級結構[18]。這種結構通常會在轉錄后水平影響翻譯的起始效率。具體體現在mRNA分子的5′-UTR區域內存在的二級結構對翻譯水平的影響[19]。近期,研究同樣發現mRNA轉錄后參與的對翻譯起始效率的調節作用還表現在異源基因5′-UTR與編碼區5′端數個核苷酸之間形成的二級結構上,這些二級結構能夠從影響mRNA穩定性,蛋白質翻譯速率等方面對蛋白的表達進行調節[20]。最新研究同樣發現,mRNA分子中,編碼蛋白質N端的序列與核糖體在這一區域覆蓋的序列發生互作形成的二級結構能夠抑制翻譯的速率[21]。當mRNA二級結構位于起始密碼子下游+1~+13,與mRNA的編碼區重疊時,翻譯起始顯著受到抑制,并且5′端RNA結構折疊自由能與mRNA的翻譯效率之間存在定量關系[21]。由于不同的異源基因轉錄后產生各種不同序列的5′編碼區,在與標準化的合成生物學元件匹配后產生的二級結構也具有極大的不確定性。難以通過單純改造表達元件的方法來普遍提升不同異源基因對表達元件的相容性。然而,這種異源基因轉錄出mRNA分子后,5′UTR與翻譯起始區域的編碼序列之間相互作用的特征和規律尚不明確。因此,難以有針對性地開發有效的手段來消除這種mRNA分子內部的相互作用給異源蛋白翻譯帶來的負面效應。目前解決此類問題的一個新的思路是利用絕緣序列(insulator)從空間上隔絕關鍵元件之間的相互作用,從而消除給轉錄和翻譯帶來的不利效應[22]。
本研究前期發現,赤擬谷盜Triboliumcastaneum來源的L-天冬氨酸-α-脫羧酶(PanD)在強啟動子和強RBS調控下表達水平仍然極低,推測造成這一問題的原因是由于RBS序列與panD基因mRNA編碼區5′端的核酸序列相互作用形成了二級結構,導致翻譯抑制。因此,基于這一問題,本實驗深入探討panD基因轉錄后水平的調節影響蛋白質翻譯效率的機理,同時探索利用在PanD蛋白N端融合肽段作為絕緣序列,緩解蛋白質翻譯抑制現象。這一結果能為提升異源蛋白的表達提供一種通用、可靠的新策略。
1.1.1 菌種、質粒和引物
大腸桿菌(Escherichiacoli) JM109和枯草芽孢桿菌B.subtilis168,分別用于質粒構建以及目的蛋白的表達,均為本實驗室保藏。大腸桿菌-枯草芽孢桿菌穿梭質粒由本實驗室構建和保藏;實驗涉及的質粒見表1。所用到的引物及序列見表2。

表1 本研究所用質粒Table 1 Plasmids used in this study
注:括號里表示質粒的縮寫,6表示RBS206, W表示啟動子PsigW, H表示啟動子PspovG, P表示PanD,G表示sfGFP,M表示mCherry。
1.1.2 主要試劑
十二烷基硫酸鈉(sodium dodecyl sulfate,SDS)、質粒小提試劑盒、PCR產物純化試劑盒,購于天根生化科技有限公司;酵母提取物、胰蛋白胨、抗生素、DNA Marker、蛋白質分子質量標準(Broad)、Prime STAR MIX DNA聚合酶、DpnI DNA消化酶,購于TaKaRa;衍生試劑苯異硫氰酸酯(PITC),購于Sigma公司;L-天冬氨酸鈉、β-丙氨酸、磷酸吡哆醛(PLP)、0.45 μm、0.22 μm無菌針頭式有機濾膜,購買于上海生工生物工程公司;K2HPO4、KH2PO4、瓊脂粉,購于國藥集團化學試劑有限公司。
1.1.3 儀器與設備
基因擴增(PCR)儀、凝膠成像儀、蛋白電泳儀,美國伯樂有限公司;超聲波細胞破碎儀,美國SONICS公司;立式高壓蒸汽滅菌器,上海博迅實業醫療設備廠;HYG-A全溫搖瓶柜,江蘇太倉實驗設備廠;KQ-100超聲波清洗器,昆山市超聲儀器有限公司;磁力攪拌器漩渦振蕩器,IKA公司;電子天平、pH計,梅特勒-托利多儀器(上海)有限公司;UV-1800PC型紫外可見分光光度計,上海美譜達有限公司;多功能酶標儀,BioTeck公司(美國);高效液相色譜儀,安捷倫(Agilent)公司。

表2 本研究中使用的引物Table 2 Primers used in this study
1.1.4 培養基
LB培養基(g/L):酵母粉 5.0,蛋白胨 10.0,NaCl 10.0。固體培養基添加20 g/L瓊脂粉。抗性篩選時補加終質量濃度為100 mg/L的氨芐青霉素(Ampicillin)或 50 mg/L的卡那霉素(Kanmycin)。
1.1.5 主要溶液
高效液相色譜(high performance liquid chromatography,HPLC)流動相:A液:體積分數為80%的乙腈-水溶液;B液:體積比為97 ∶3的0.1 mmol/L醋酸鈉-乙腈溶液。使用前用0.22 μm有機濾膜抽濾去除雜質。
β-丙氨酸衍生試劑:0.1 mmol/L PITC-乙腈:取1 mL 苯異硫氰酸酯(phenyl isothiocyante,PITC)充分溶解于83 mL色譜純乙腈溶液中。1 mmol/L三乙胺-乙腈∶14 mL色譜純三乙胺溶液與86 mL色譜純乙腈溶液充分混勻。密封、避光低溫保存。
1.2.1 重組質粒的構建與轉化
L-天冬氨酸-α-脫羧酶表達質粒的構建:實驗室前期克隆并鑒定了強啟動子PsigW(縮略為W)和PspovG(縮略為H),并且利用在線預測軟件(RBS Calculator)為這兩個啟動子配置強RBS序列,RBS206 (序列為TCGAACATCATATTTAAAGTAAAGGAGGTCCACAT,縮略為6)。編碼綠色熒光蛋白基因sfgfp的E.coli-B.subtilis穿梭載體pBsigW206-sfgfp(縮略為6WG)和pBspovG206-sfgfp(縮略為6HG)為本實驗室構建并保存。以質粒6WG和6HG為模板,用引物PB-H-1/ PB-206-2(表2)擴增質粒骨架。將密碼子優化合成后的赤擬谷盜來源的panD基因用引物PanD-1/ PanD-H-2(表2)擴增。PCR產物加入Dpn I酶消化2 h,純化后進行Gibson組裝[23],然后轉化大腸桿菌感受態細胞并提取質粒測序驗證。重組質粒命名為pBsigW206-panD(縮略為6WP)和pBspovG206-panD(縮略為6HP)。將正確的重組質粒用化學轉化方法轉化入枯草芽胞桿菌168中[24],獲得基因工程菌進行搖瓶檢測。
L-天冬氨酸-α-脫羧酶C末端融合sfGFP質粒的構建:分別以質粒6WG和6HG為模板,用引物PB-206-2/ PG-1(表2)擴增質粒骨架,引物PanD-1/ PanD-2(表2)擴增panD基因,分別得到重組質粒pBsigW206-panD-sfgfp(縮略為6WPG)和pBspovG206-panD-sfgfp(縮略為6HPG)。
L-天冬氨酸-α-脫羧酶N末端融合sfGFP質粒的構建:分別以質粒6WG和6HG為模板,以PB-H-1/ sfGFP-2為引物擴增質粒骨架,以PanD-1/ PanD-H-2為引物克隆panD基因,利用Gibson組裝的方法,將panD基因插入到sfgfp基因下游,分別得到重組質粒pBsigW206-sfgfp-panD(縮略為6WGP)和pBspovG206-sfgfp-panD(縮略為6HGP)。
為了探討panD基因5′端翻譯起始區域mRNA序列對翻譯水平的影響,采用截斷策略,從panD基因mRNA 5′端起始密碼子后依次截去9、18、27、36、45和54 nt,構建出PanD酶N端不同長度截斷片段的突變體。為了使用膠上熒光監測(In-gel) SDS-PAGE的方法檢測融合蛋白,PanD酶的C端融合sfGFP。構建方法:以6HPG為模板,以D3-1, D6-1, D9-1, D12-1, D15-1, D18-1/ 206-2為引物,PCR擴增帶有同源臂到的片段,55 ℃反應50 min進行片段組裝,之后產物轉化E.coliJM109感受態,獲得6種含有N端截斷長度逐個遞增的融合蛋白突變體質粒:pBspovG206-D3-panD-sfgfp(D3-6HPG), pBspovG 206-D6-panD-sfgfp(D6-6HPG), pBspovG206-D9-panD-sfgfp(D9-6HPG), pBspovG206-D12-panD-sfgfp(D12-6HPG), pBspovG206-D15-panD-sfgfp(D15-6HPG)和pBspovG206-D18-panD-sfgfp(D18-6HPG)。測序驗證后保存備用。
為了對融合肽長度進行精簡,根據sfGFP和mCherry的蛋白質序列和蛋白結構,以N端含有的β折疊或α螺旋的不同長度結構域作為短融合肽,保留sfGFP N端前50、91和143個氨基酸分別與PanD進行N端融合表達,進行以下構建:以6HGP為模板,以G50-2, G91-2, G143-2/ PanD-1為引物,構建質粒pBspovG206-sfgfp50-panD(G50P), pBspovG206-sfgfp91-panD(G91P)和pBspovG206-sfgfp143-panD(G143P)。保留mCherry N端前62和144個氨基酸分別與PanD進行N端融合表達。以6HP為模板,以PanD-1/ PB-206-2為引物擴增質粒骨架,以M-1/M-2,M62-2,M144-2為引物擴增mcherry基因,通過組裝的方法構建質粒pBspovG206-mcherry-panD(6HMP), pBspovG206-mcherry62-panD(M62P)和pBspovG206-mcherry144-panD(M144P)。
1.2.2 sfGFP熒光水平的測定
將包含正確質粒的B.subtilis菌株在終質量濃度50 mg/L的卡那霉素LB平板上劃線,37 ℃培養長出單菌落。再接種單菌落到5 mL的LB試管培養基37 ℃,200 r/min過夜培養。再以1%的接種量接種到終質量濃度為50 mg/L的卡那霉素的50 mL LB液體培養基中擴大培養,37 ℃,200 r/min培養24 h。取200 μL發酵液至96孔板,檢測OD600和sfGFP熒光強度(fluorescence intensity,FI)。在激發光495 nm,發射光525 nm處進行檢測。
1.2.3 PanD酶活水平的測定
酶活水平檢測方法:參考之前相關報道[25],取200 μL細胞破碎后PanD粗酶液,加入終濃度為100 mmol/L的L-天冬氨酸溶液和0.1 mol/L PLP,50 mmol/L磷酸鹽緩沖液補加到1 mL, 37 ℃反應30 min。反應結束后將反應體系于100 ℃滅活10 min,12 000 r/min離心5 min,取上層溶液進行衍生。
β-丙氨酸的衍生:由L-天冬氨酸和β-丙氨酸在進行HPLC檢測時較難分離,因此參考文獻[26],在檢測前用PITC進行衍生。衍生方法為取500 μL反應液,加入250 μL 1 mol/L三乙胺-乙腈溶液和250 μL 0.1 mol/L PITC-乙腈溶液,振蕩混勻,避光反應1 h。待衍生結束后,700 μL正己烷,振蕩30 s萃取出殘余的衍生試劑,靜置,待反應液有明顯分層后吸取下層溶液,用0.22 μm針頭式有機濾膜過濾。
HPLC檢測β-丙氨酸生成:選擇C18色譜柱La Chrom C18(5 μm 4.6×250 mm),參考相關文獻[27],用梯度洗脫的方法進行檢測。A流動相為體積分數80%的乙腈溶液,B流動相為體積比97∶3的0.1 mol/L乙酸鈉-乙腈溶液;梯度洗脫條件為:0~35 min,B流動相由95%降至65%;35~40 min,B流動相由65%升至95%;40~45 min,B流動相濃度不變。檢測溫度為40 ℃,檢測波長為254 nm。
酶活定義:在37 ℃,pH 7.0的條件下,每小時轉化L-天冬氨酸生成1 mmol β-丙氨酸所需酶量為一個酶活力單位1 U。
1.2.4 蛋白表達水平檢測
SDS-PAGE:取培養24 h的發酵液1 mL, 2 000 r/min離心5 min收集菌體,PBS緩沖液洗滌3次,再用含有200 μg/mL溶菌酶的500μL的TE緩沖液Buffer懸浮,37 ℃溫育30 min,未完全裂解的菌液用超聲適當破碎;取100 μL細胞裂解液,加入25 μL 5 ×上樣緩沖液,沸水浴10 min。使用5%的濃縮膠和12%的分離膠進行蛋白分離,考馬斯亮藍R250染色顯示條帶。
In-gel[28]檢測:取100 μL裂解好的細胞破碎液,加入25 μL 5×上樣緩沖液混勻。用不含SDS的蛋白膠進行分離,凝膠成像儀在紫外燈下成像,可特異性地顯示目的蛋白,過濾掉其他不發光的背景蛋白。
為了實現赤擬谷盜L-天冬氨酸-α-脫羧酶在B.subtilis中的高效表達,對實驗室前期構建的PsigW-206和PspovG-206啟動子-RBS強表達元件介導sfGFP表達的6WP和6HP表達水平在B.subtilis168中進行SDS-PAGE檢測,結果如圖1-A,含有206的2個啟動子均介導sfGFP的高水平表達。隨后將密碼子優化后的panD基因克隆到這2個表達元件的下游,進行重組表達驗證。結果如圖1-B所示,在PsigW-206和PspovG-206這2種表達元件介導的PanD重組表達系統中,PanD蛋白的理論分子質量62 kDa處均沒有明顯條帶,這一結果表明,這2種高效表達元件并不能介導PanD在B.subtilis168中的高水平表達。綜合圖1-A和圖1-B的結果,推測PanD表達量低是由于翻譯抑制引起的。

A-PsigW-206與PspovG-206介導sfGFP表達;B-PsigW-206與PspovG-206介導PanD表達;圖1 SDS-PAGE檢測啟動子-RBS組合介導PanD和sfGFP的表達水平Fig.1 SDS-PAGE analysis to measure the expression levels of PanD and sfGFP mediated by promoter-RBS combination注:M-蛋白Marker;168-對照;W-啟動子PsigW;H-啟動子PspovG;G-sfGFP;P-PanD;黑色箭頭所指位置為目的條帶位置。
為了闡明PanD翻譯抑制的機理,著重探討panD基因轉錄后的mRNA 5′編碼區與5′-UTR之間相互作用形成的二級結構對翻譯的影響。因此,從起始密碼子AUG開始,以每次缺失9 bp(3個氨基酸殘基)的方式逐步截斷mRNA 5′端序列,構建一系列5′端序列逐步縮短的突變體。為了使用In-gel方法對蛋白進行檢測,以編碼融合蛋白PanD-sfGFP的panD-sfgfp基因(6HPG)為模板,構建mRNA 5′端分別缺失9 nt (D3-6HPG), 18 nt (D6-6HPG), 27 nt (D9-6HPG), 36 nt (D12-6HPG), 45 nt (D15-6HPG)和54 nt (D18-6HPG)的截斷突變體。隨后轉入B.subtilis168宿主,確定各突變體表達水平。SDS-PAGE和In-gel檢測結果如圖2-A,圖2-B所示,5′端缺失9 bp后對應重組融合蛋白D3-6HPG的表達水平相比野生型6HPG有提升。與此類似,突變體D12-6HPG、D15-6HPG和D18-6HPG均有不同程度的提升。而D6-6HPG和D9-6HPG的表達水平相對于野生型融合蛋白沒有明顯提升。In-gel與SDS-PAGE結果一致,如圖2-C所示。

A-SDS-PAGE檢測;B-In-gel檢測;C-截斷融合蛋白熒光水平檢測;D-酶活性檢測圖2 panD-sfgfp基因5′端序列的梯度截斷突變體表達量的檢測Fig.2 Detection of mutants expression of the panD-sfgfp gene 5′-terminal sequence gradient truncation注:M:蛋白marker;6HPG:PspovG-206介導C端融合蛋白PanD-sfGFP的表達;D3-6HPG、D6-6HPG、D9-6HPG、D12-6HPG、D15-6HPG和D18-6HPG:panD-sfgfp序列5′端依次截去9、18、27、36、45和54 nt后的突變體;黑色箭頭所指位置為目的條帶位置。
這一結果表明,panD轉錄本中mRNA 5′端結構是影響重組蛋白表達水平的一個重要因素。對各突變體的酶活水平進行檢測,結果如圖2-D所示,突變體D3-6HPG酶活水平相較于野生型有所提升,與突變體蛋白質表達水平一致。而D6-6HPG、D9-6HPG和D12-6HPG突變體酶活水平有所降低,這一結果與蛋白表達水平也趨于一致。但D15-6HPG和D18-6HPG酶活水平與野生型無顯著差異,結合圖2-B中蛋白表達水平的結果,提示這2個經過截斷的突變體雖然蛋白質表達水平有所提升,但對酶活性有一定影響。
為進一步揭示mRNA轉錄本中5′-UTR區域和翻譯起始覆蓋的編碼區域之間的相互作用對翻譯水平的影響,通過RNAfold在線軟件分析野生型panD和截斷突變體mRNA 5′端二級結構的特征。結果如圖3-A~圖3-G所示,在轉錄出的野生型panD的mRNA(6HPG)二級結構中,RBS序列形成一個小發卡結構,同時起始密碼AUG下游12 nt的序列形成了較穩定的發卡結構,推測這種較穩定的雙發卡結構阻礙了翻譯起始過程中核糖體的結合,從而對PanD的表達造成極大的抑制。

圖3 panD-sfgfp基因5′端序列的梯度截斷突變體的mRNA二級結構及最小自由能ΔG值Fig.3 mRNA secondary structure and minimum free energy ΔG value of gradient truncation mutants of the panD-sfgfp gene 5′-terminal sequence注:黑體標注為RBS序列AAAGGAGGU;斜體標注為起始密碼子AUG。
為了驗證這一推測,對5′端截斷的突變體基因序列進行進一步分析。結果表明,與6HPG相比,刪除起始密碼子下游9 pb (D3-6HPG)后,5′-UTR中RBS序列所在的發卡結構被消除,與核糖體緊密結合的保守序列AAGGAG序列處于有利于核糖體結合的延展狀態。而蛋白表達相對較低的D6-6HPG和D9-6HPG的mRNA 5′端序列則半覆蓋或完全覆蓋在發夾結構中,并且其二級結構的最小自由能ΔG值也相對較低,表明這種抑制性的結構穩定。同時D12-6HPG和D15-6HPG mRNA的RBS序列只有2個或3個堿基存在于發夾莖的基部。D18-6HPG mRNA的RBS雖然完全覆蓋在發夾莖結構中但是ΔG值相對較高。因此,結合圖2-B,這一結果表明,mRNA 5′端編碼序列通過與5′-UTR中的核糖體結合位點相互作用形成的二級結構,影響核糖體結合,并最終導致對mRNA的翻譯效率的抑制。值得注意的是mRNA二級結構與mRNA的蛋白編碼區重疊且最小自由能最低的D6-6HPG突變體的蛋白表達水平和酶活也是最低的,說明蛋白編碼序列與5′-UTR形成的二級結構能夠顯著抑制翻譯效率,并且這種抑制效應與最小自由能相關。
為了降低mRNA編碼區序列與5′-UTR形成的二級結構對蛋白質翻譯起始效率的影響,研究選取能夠適用于大多數表達元件或系統的且蛋白結構解析清楚的sfGFP作為N端融合肽,構建N端融合蛋白6WGP和6HGP。同時與PanD C端融合sfGFP的6WPG和6HPG的表達水平進行比較。SDS-PAGE檢測結果如圖4-A、圖4-B所示,N端融合蛋白6HGP的表達水平明顯高于N端融合蛋白6WGP、C端融合蛋白6WPG和C端融合蛋白6HPG。In-gel與SDS-PAGE結果一致,如圖4-C所示。這一結果表明N端融合sfGFP可以有效解除翻譯抑制效應,顯著提升蛋白表達水平。為進一步考察融合策略對酶活性的影響,測定融合蛋白的酶活水平,結果如圖4-D所示,C端融合蛋白6WPG與6HPG相比較,酶活水平有所降低,這一差異與蛋白表達水平相關。N端融合蛋白6HGP與6WGP比較,酶活水平提升8倍,但融合蛋白的熒光表達水平提升17.5倍。結果表明,雖然N端融合sfGFP可以使蛋白質表達水平有大幅度的提升,但可能會對酶分子的空間結構有一定影響,造成酶活性不同程度的降低。

A-SDS-PAGE檢測;B-In-gel檢測;C-融合蛋白熒光水平檢測;D-酶活性檢測圖4 PanD與sfGFP融合蛋白表達量的檢測Fig.4 Detection of fusion protein expression of PanD and sfGFP注:M-蛋白marker;6WPG和6HPG:C端融合sfGFP;6WGP和6HGP:N端融合sfGFP;黑色箭頭所指位置為目的條帶位置。
為了保證N端融合sfGFP在提高蛋白質表達水平的同時又減少對融合蛋白酶活性的影響,我們采用精簡sfGFP和mCherry兩種蛋白的N端策略,保留N端含有的β折疊或α螺旋的不同長度的結構域作為融合肽段,分別與PanD進行N端融合,構建新的融合蛋白。不同融合肽段的長度如圖5-A、圖5-B豎向箭頭所指位置。在圖5-A豎向箭頭所指位置,分別保留sfGFP N端前50(G50)、91(G91)和143(G143)個氨基酸與PanD進行融合,構建G50P、G91P和G143P融合蛋白突變體;在圖5-B豎向箭頭所指位置,分別保留mCherry N端的前62(M62)和144(M144)個氨基酸與PanD進行N端融合,構建M62P和M144P融合蛋白突變體。SDS-PAGE和In-gel檢測蛋白質表達水平,結果如圖5-C所示,保留sfGFP N端前50個氨基酸后對應重組融合蛋白G50P的表達水平相比野生型6HP有的提升。與此類似,突變體G91P和G143P隨著保留結構域長度的增加表達水平均有不同程度提升。保留mCherry N端前62個氨基酸后對應重組融合蛋白M62P的表達水平相比野生型6HP有提升。M144P表達水平雖也有提升但沒有M62P高。綜上,通過對融合肽長度的縮短,構建含有結構域的短融合肽的融合蛋白,可以提高蛋白質的表達水平。
本研究揭示了一種影響赤擬谷盜L-天冬氨酸-α-脫羧酶PanD在枯草芽孢桿菌中重組表達水平機制。編碼L-天冬氨酸-α-脫羧酶的基因panD在含有人工強核糖體結合位點元件的表達框架中受mRNA 5′-UTR和5′-編碼區序列相互作用形成的二級結構的調控,這種調控發生在轉錄后水平和翻譯起始階段。在這種機制調控下,PanD即使在強啟動子和強RBS序列的介導下也呈現低表達。這一問題極大限制了重組酶在B.subtilis中的高效制備。同時,PanD是一種重要的工業酶,可用來構建β-丙氨酸的生物催化途徑或代謝途徑[29]。傳統上用于提升異源基因在B.subtilis中表達水平的策略集中于改造天然啟動子,增強轉錄水平,設計強核糖體結合位點提升翻譯起始效率等[13,30]。然而,高效的順式作用元件對異源蛋白的適配性有一定的局限,許多異源蛋白的基因序列內部存在一些制約重組表達的天然因素。其中,最重要的一類就是異源基因mRNA 5′端形成的二級結構[21]。這種作用會導致核糖體結合位點被全部或部分封閉在由5′編碼區與5′-UTR相互作用形成的發卡或莖環等二級結構中[22]。

A-sfGFP的蛋白序列;B-mCherry的蛋白序列;C-SDS-PAGE檢測圖5 保留sfGFP和mCherry的不同長度結構域與PanD進行N端融合表達Fig.5 The N-terminal fusion expression of different length domains of sfGFP and mCherry with PanD注:灰色箭頭代表β折疊;黑色矩形代表α螺旋;豎向箭頭所指位置表示縮短后的融合肽序列;斜向箭頭所指位置為目的條帶位置。M-蛋白marker;168-對照;6HP-PspovG-206 介導PanD的表達;M62P和M144P-mCherry N端前62和144個氨基酸分別與PanD的N端融合;6HMP-PspovG-206介導mCherry-PanD的表達;G50P, G91P和G143P-sfGFP N端前50、91和143個氨基酸分別與PanD的N端融合;6HGP-PspovG-206介導sfGFP-PanD的表達
本研究發現PsigW-206和PspovG-206這兩種高強度表達組件沒有產出高水平的PanD重組酶。然而,在PanD的N端融合了sfGFP后,融合蛋白的表達水平顯著提升。通過進一步對截斷融合蛋白mRNA 5′端核酸序列二級結構的分析,我們發現使用強核糖體結合位點后,panD基因mRNA 5′端編碼區序列通過與5′-UTR的核糖體結合位點形成不同程度的包含RBS序列的二級結構,從而不同程度地抑制翻譯起始,并且這種抑制效應與mRNA中核糖體結合位點和起始密碼子形成二級結構的最小自由能和相對位置有密切的關系。
如何使高效基因表達組件能夠兼容更多的異源基因,產出合理的表達水平對于合成生物學和代謝工程的研究具有至關重要的作用。并且在面對各種異源基因多樣化的mRNA 5′末端序列以及其可能和核糖體結合位點等關鍵組件形成二級結構的這些問題時,采用何種更為通用的策略能夠消除翻譯抑制,提升異源基因的表達量對構建人工基因線路和代謝途徑尤為重要。本研究采用融合蛋白策略,逐步篩選與人工表達組件兼容性好的融合肽段與PanD酶融合,以期緩解或消除由于5′端編碼區參與形成的二級結構對翻譯的抑制效應。為此,研究選取普適性較好sfGFP作為N端融合肽,證明了在PanD的N端存在sfGFP能夠極大消除翻譯的抑制。結果充分證明了這一策略的合理性和適用性。并且通過逐步縮減融合肽的長度,最大程度降低融合肽對PanD酶活性的影響。有效平衡了融合蛋白表達水平和酶活性兩方面的指標。這種類似于融合“絕緣子”的策略近年在構建高穩定性、高正交性的基因轉錄元件中使用較多[31],而直接將肽段作為“絕緣子”,依賴編碼肽段的序列不與5′-UTR產生二級結構的特性消除翻譯抑制的策略尚無報道。本研究通過構建基于sfGFP和mCherry的融合肽段,考察了不同長度的融合肽段對PanD表達水平的影響,篩選出了具有成為“絕緣子”應用潛能的肽段,驗證結果同時表明,全長的sfGFP介導的PanD蛋白表達水平最高,但保留sfGFP的N端143個氨基酸的肽段后融合蛋白的表達效果也能達到與之相當的水平。而在利用mCherry的融合體中,全長的mCherry介導的融合蛋白表達水平均高于N端為不同長度肽段的融合蛋白的表達水平。這表明融合肽段的選擇對于這一策略具有重要的影響。研究中僅選取了兩種蛋白作為融合肽段的來源,今后的研究還可以利用這種策略設計全人工短肽序列,進一步擴展肽段“絕緣子”的適用范圍。因此,這一策略有望被開發成為一種便捷的技術平臺,用于系統提升不同異源基因在底盤細胞中的表達水平,為合成生物學和代解途徑的構建提供通用型解決方案。