王小琴 黃銀萍 王蔚倩 吳萍 全舒
(1. 華東理工大學生物反應器工程國家重點實驗室,上海 200237;2. 中國科學院上海高等研究院國家蛋白質科學設施上海 張江實驗室,上海201210)
MLL3是人體細胞內一種組蛋白H3K4甲基轉移酶,其功能異常會導致多種疾病的發生,甚至引發癌癥[1-3]。SET是MLL3具有甲基轉移酶催化功能的結構域,但其自身基本沒有甲基轉移酶活力,必須與ASH2L、RBBP5(AR)等輔助蛋白形成復合物,才能發揮完整的甲基轉移酶活力[4-5]。明確MLL3SET如何被AR調控,對于新藥物研發至關重要。
盡管有報道認為調控因子AR與MLL3SET結合后誘導MLL3SET從低活性的“open”構象轉變為高活性的“close”構象[6-7],然而 Li等[8]解析了單獨的MLL3SET結構和MLL3SET結合AR后復合物的晶體結構,發現二者幾乎沒有區別,從而提出了MLL3SET可能始終在兩種構象之間震蕩的假說。由此推測,AR通過影響MLL3SET的構象動態性而調節其催化活力。因此,以實驗手段驗證MLL3SET是否處于“open”和“close”狀態不斷震蕩的動態過程,對進一步揭示MLL3SET的調控機制,尋找藥物靶點具有重要作用。單分子熒光共振能量轉移技術(single-molecule fluoresce energy transfer,smFRET) 可 直 接 觀 測MLL3SET動態過程,該技術依賴于化學反應實現在特定氨基酸位點標記上熒光染料[9-12]。
常用的蛋白標記手段是標記半胱氨酸和非天然氨基酸[13-14]。Ryu 等[15-19]開發出以 C321.ΔA.exp 為宿主菌的含非天然氨基酸的系統,該系統利用aaRS-tRNA的正交性,將非天然氨基酸插入到合適的位置。對MLL3SET結構分析發現,可選取活性口袋兩側的4 819位和4 905位氨基酸殘基分別進行編碼半胱氨酸的密碼子和琥珀密碼子替換,以特異性引入熒光染料標記。然而,MLL家族SET結構域蛋白很不穩定,在此制備蛋白樣品方面存在巨大的挑戰。
本文通過改造C321.ΔA. exp基因組以表達pET-28b(+)質粒,構建pET28b-his-sumo-mll3setC4883S S4819C N4905X(X:TAG終止密碼子),以克服制備困難,純化到His-SUMO-MLL3SET*蛋白(*:非天然氨基酸PrK),為后續的smFRET實驗奠定基礎。
大腸桿菌BL21(DE3)和TransT1購自北京全式金生物科技有限公司;大腸桿菌C321. ΔA. exp購自美國菌種保藏中心(ATCC)。引物由生工生物工程(上海)股份有限公司合成;pKD4、pKD46、pCP20質粒為本實驗室保藏;pET28b-his-sumomll3set質粒由國家蛋白質科學中心(上海)友情提供。pEVOL-pylRS質粒為Edward A. Lemke實驗室友情提供。異丙基硫代半乳糖苷(IPTG)、阿拉伯糖(L-ara)等試劑均購自生工生物工程(上海)股份有限公司;N-炔丙基-賴氨酸(N-propargyl-lysine,PrK)購自上海柘智生物科技有限公司。重組蛋白的核苷酸序列測定由金唯智生物科技有限公司完成。
1.2.1 C321. ΔA. exp基因組的改造 第一步:構建中間態細胞 C321.ΔA. exp lacZ∷(T7p07+Kan)。以pKD4質粒為模板,以Kan-F 和Kan-R為引物,PCR制備出Kan基因。與此同時,以BL21(DE3)基因組為模板,以T7p07-F 和T7p07-R為引物,PCR擴增出T7p07基因。然后將PCR產物分別進行膠回收,回收后的兩個基因以(T7p07+Kan)-F和(T7p07+Kan)-R為引物進行重疊PCR,得到T7p07+Kan片段,所用引物如表1所示。T7p07+Kan基因片段通過乙醇沉淀,制備出高濃度的線性片段,然后將此片段通過電轉化導入含有pKD46的C321.ΔA. exp感受態細胞中,pKD46質粒將T7p07+Kan片段整合到細菌基因組上,以替換lacZ基因。隨后,利用pKD46在30℃環境中可穩定存在于細菌中,37℃環境下則會丟失的熱敏性特征去除pKD46質粒。C321.ΔA. exp lacZ∷(T7p07+Kan)中間態細胞構建完成。第二步:構建目的細胞C321.ΔA. exp lacZ∷T7p07。制備 C321.ΔA. exp lacZ∷(T7p07+Kan)電轉感受態細胞,隨后轉入pCP20質粒以剪切掉Kan基因。同理,利用pCP20的熱敏性特征去除pCP20質粒,最后通過測序確保Kan基因被去除。至此,基因組改造完成。
1.2.2 原核表達載體的構建 利用快速定點突變的方法構建突變體質粒pET28b-his-sumo-mll3setC4883S。以野生型pET28b-his-sumo-mll3set質粒為模板,用正向引物F1和反向引物R1通過PCR擴增后,產物經Dpn I限制性酶消化模板質粒,再轉入TransT1感受態細胞。待從平板上長出單克隆后,送金唯智生物科技有限公司進行測序鑒定。利用上述同樣的方法,以鑒定正確的突變體質粒pET28b-hissumo-mll3setC4883S為模板,F2為正向引物,R2為反向引物,成功構建pET28b-his-sumo-mll3setC4883S S4819C質粒。在此基礎上,以F3為正向引物,R3為反向引物,最終構建pET28b-his-sumo-mll3setC4883S S4819C N4905X質粒。所用引物如表1所示。

表1 PCR反應引物序列Table 1 Primer sequences of PCR reactions
1.2.3 MLL3SET*蛋白的誘導表達 先制備C321.ΔA.exp lacZ∷T7p07感受態細胞,將pEVOL-pylRS質粒轉化其中。然后制備含pEVOL-pylRS質粒的C321.ΔA. exp lacZ∷T7p07感受態細胞,再將pET28b-hissumo-mll3setC4883S S4819C N4905X質粒轉入上述感受態細胞。準備4 mL液體LB培養基,加入終濃度為 100 μg/mL 卡那霉素和 34 μg/mL 氯霉素,將得到的陽性克隆接種其中,37℃培養12 h。次日,準備4 mL 新鮮LB培養基,加入上述相應濃度抗生素,另外再加入20 μL 50 mmol/L PrK溶液,按1%接種量接種過夜培養液,37℃培養。待OD600值達到0.6時,冷卻降溫至16℃,依次加入4 μL 20% L-(+)-阿拉伯糖,0.2 mmol/L IPTG,培養12-16 h。
1.2.4 MLL3SET*蛋白的可溶性表達測試 取1 OD培養12-16 h的菌液離心棄上清,用100 μL緩沖液(50 mmol/L Tris pH 7.5、1 mmol/L EDTA)重懸,加1 μL 100×PIC(蛋白酶抑制劑)混合均勻,再加1 μL 10 mg/mL溶菌酶冰浴10 min。將以上體系置于液氮中速凍5 min,然后放入水中至融化,重復3-4次以使細胞完全破裂。向細胞裂解液中加0.5 μL DNase I、1.5 μL 0.5 mol/L CaCl2和 MgCl2冰 浴 10 min, 再 經18 000 r/min離心15 min,分離上清和沉淀。樣品分別與蛋白上樣緩沖液混合均勻,電泳檢測蛋白可溶性表達。
1.2.5 MLL3SET*蛋白的純化 將1 L菌液3 800 r/min離心13 min收集菌體,重懸于緩沖液(50 mmol/L Tris pH 8.0、400 mmol/L NaCl、10% glycerol) 中 超聲破碎。細胞破碎液經12 000 r/min離心,上清液在Ni-NTA層析柱中進行親和層析。洗滌Ni-NTA上的雜蛋白后,用含300 mmol/L 咪唑的洗脫緩沖液洗脫并收集目的蛋白。將目的蛋白濃縮至8 mL,12 000 r/min離心20 min蛋白樣品除去沉淀,通過HiLoad 16/600 Superdex 75pg凝膠層析柱分離目的蛋白和雜蛋白,根據出峰位置以及SDS-PAGE分析收集目標蛋白。為判斷His-SUMO-MLL3SET*蛋白的分子量, 用 aprotinin(6.5 kD)、ribonuclease(13.7 kD)、carbonic anhydrase(29 kD)、ovalbumin(44 kD) 和conalbumin(75 kD)5種蛋白作為標準品蛋白,繪制標準曲線。借助國家蛋白質科學設施(上海)質譜系統對純化得到的His-SUMO-MLL3SET*蛋白進行了檢測。簡單描述如下:蛋白樣品經變性后由胰蛋白酶消化為肽段,之后通過納流液相色譜串聯質譜(nano LC-MS/MS)檢測分子量,所得原始數據對含有目標蛋白的自定義數據庫進行肽段搜索,并通過定義特殊蛋白修飾的方法檢索目標位點是否含有非天然氨基酸PrK。
1.2.6 MLL3SET*蛋白的活性測定 利用多酶級聯反 應檢測 MLL3SET甲基轉移酶 活性( 圖 1)[20]。MLL3SETAR會將S-腺苷甲硫氨酸(SAM)上的甲基轉移到底物H3多肽上,生成S-腺苷-L-高半胱氨酸(SAH),SAH在多種催化劑作用下,最終生成在515 nm(A515)處有吸光度的物質即N-(4-安替比林)-3-氯-5-磺酸酯苯醌-單亞胺,通過分光光度計檢測產物吸光度的變化,即可分析是否具有酶活。如果具有酶活性,則隨著時間延長吸光度不斷升高,直至反應完全,吸光度不再變化。如果將酶加入反應體系后,吸光度無變化,說明此酶無活性。在本文中,100 μL反應體系含25 mmol/L Tris pH 8.0的緩沖液,固定SAM濃度為200 μmol/L,H3多肽濃度為800 μmol/L,MLL3SETAR 濃度為 1 μmol/L,檢測 A515吸光值隨時間的變化情況。另外,以測試緩沖液(25 mmol/L Tris pH 8.0)代替His-SUMO-MLL3SET*,其余條件均相同作為為陰性對照;以His-SUMO-MLL3SET代替His-SUMO-MLL3SET*,其余條件均相同,作為陽性對照。

圖1 多酶級聯反應測定MLL3SET*活性的原理圖Fig. 1 Diagram of the multi-enzyme coupling reaction for determining MLL3SET* activity
由于C321.ΔA. exp不含有T7 RNA聚合酶基因(T7p07),無法表達pET-28b(+)質粒,故首先將基因組中的lacZ替換為T7p07。經基因測序和序列比對后可知,C321.ΔA. exp大腸桿菌基因組中lacZ基因已替換成T7p07基因。構建完成后,進一步驗證是否可以順利表達pET-28b(+)質粒。將pET28b-his-sumo-mll3set質粒分別轉化 C321.ΔA. exp、C321.ΔA. exp lacZ∷T7p07以 及 BL21(DE3) 進 行表達測試。結果(圖2)表明,pET28b-his-sumomll3set質粒轉入C321.ΔA. exp后,無論是否誘導,均不能表達His-SUMO-MLL3SET蛋白;轉入C321.ΔA.exp lacZ∷T7p07中后,未誘導條件下沒有表達His-SUMO-MLL3SET蛋白,而在誘導條件下成功表達,表達量約為BL21(DE3)宿主菌中表達量的25%。這表明基因組改造成功,可以利用此菌株表達pET28bhis-sumo-mll3setC4883S S4819C N4905X質粒。

圖2 基因組改造表達測試Fig. 2 Expression test after genomic modification
氨基酸序列和結構分析發現MLL3SET結構域中總共含有6個半胱氨酸(圖3-A)。其中4個(C4851、C4899、C4901和C4906)形成較穩定的鋅指結構,一個(C4855)朝向蛋白內部,可以忽略對染料標記產生干擾。然而,第4 883位的半胱氨酸側鏈巰基朝向外部水環境,很可能會對標記產生干擾。因此利用快速定點突變的方法將第4 883位半胱氨酸突變為絲氨酸。基因測序表明,編碼4 883位氨基酸的密碼子由原來的TGT突變成AGT,成功構建pET28b-his-sumo-mll3setC4883S表達質粒。在此基礎上,由于單分子熒光共振能量轉移實驗的前提是標記上熒光供體和受體,選取4 819位采用突變成半胱氨酸的方式標記熒光供體,4 905位采用突變為非天然氨基酸的方式用于標記熒光受體。因此將4 819位和4 905位氨基酸殘基分別進行編碼半胱氨酸的密碼子和琥珀密碼子替換(圖3-B),從而實現定點標記熒光供體和受體染料。

圖3 MLL3SET結構信息(A)和表達質粒圖譜(B)Fig. 3 MLL3SET structural information(A)and the map of the expression plasmid (B)
為確保后續活性口袋兩側氨基酸突變后能純化得到MLL3SET蛋白,故先檢測His-SUMO-MLL3SETC4883S突變蛋白表達情況。以pET28b-his-sumomll3setC4883S為實驗組,pET28b-his-sumo-mll3set為對照組,分別在37℃和16℃進行誘導表達,探究最佳誘導表達溫度以及蛋白表達是否受突變影響。結果(圖4)表明His-SUMO-MLL3SETC4883S表達量與His-SUMO-MLL3SET相似,且均在16℃誘導表達時蛋白可溶性含量更高,C4883S突變對MLL3SET蛋白表達幾乎沒有影響。因此,可以在C4883S突變的基礎上再進行雙點突變實驗。

圖4 pET28b-His-sumo-mll3set C4883S質粒的表達測試Fig. 4 Expression test of the pET28b-His-sumo-mll3set C4883S plasmid
通過快速定點突變的方法構建pET28b-his-sumomll3setC4883S S4819C N4905X質粒。基因測序表明,編碼4 819位氨基酸的密碼子由原來的AGT成功突變成TGT,編碼4 905位氨基酸的密碼子由原來的AAT突變成琥珀密碼子UAG,成功構建pET28bhis-sumo-mll3set C4883S S4819C N4905X表達質粒。隨后,將其與pEVOL-PlyRS質粒共轉化C321.ΔA.exp lacZ∷T7宿主菌中進行表達測試。以pET28bhis-sumo-mll3set在BL21(DE3)中表達作為陽性對照,制備好全菌蛋白樣品后,分別進行SDS-PAGE和Western blot分析檢測。結果(圖5)表明細胞可溶性組分中含有His-SUMO-MLL3SETC4883S S4819C N4905X(簡寫為:His-SUMO-MLL3SET*),可以進行純化。

圖5 表達His-SUMO-MLL3SET*分析Fig. 5 Analysis of expressed His-SUMO-MLL3SET*
檢測His-SUMO-MLL3SET*蛋白的甲基轉移酶活性,其前提是可以純化得到高純度的His-SUMOMLL3SET*蛋白。本文首先通過Ni-NTA親和層析獲得His-SUMO-MLL3SET*蛋白(圖6中泳道8),得到的目的蛋白含有較多雜質,純度較低。因此,再通過凝膠過濾層析進一步分離目的蛋白(圖7)。球形蛋白分子量 MW與保留體積Ve存在如下關系:Ve/V0= -a log10MW+ b。根據此公式,分別代入標準蛋白的分子量,繪制蛋白分子量與保留時間的標準曲線,得到公式 Ve/V0= -0.669 6 log10MW+ 2.925 1,R2為0.991 4。代入V0(排空體積)44.37 mL,His-SUMOMLL3SET*蛋白分子量31.78 kD(圖7),最后計算得到單體對應的保留體積Ve為85.11 mL,二聚體對應的保留體積Ve為76.17 mL。因此凝膠圖譜中80-90 mL對應位置為目的蛋白,收集濃縮后分裝保存于-80℃待用。

圖6 純化His-SUMO-MLL3SET*分析Fig. 6 Analysis of purified His-SUMO-MLL3SET*

圖7 凝膠過濾色譜分離His-SUMO-MLL3SET*Fig. 7 Separation of His-SUMO-MLL3SET* by gel filtration chromatography
運用nano LC-MS/MS質譜法分析純化得到的His-SUMO-MLL3SET*蛋白。當第4 905位氨基酸殘基N(132.12 Da)替換為非天然氨基酸PrK(228.25 Da)后,理論分子量增加96.13 Da。圖8為IPCHCGAVNCR肽段的二級質譜圖,結果發現IPCHCGAVNCR肽段的N增加96.06 Da,與理論增加分子量相差0.07 Da,誤差非常小,可信度高,表明重組蛋白MLL3SET蛋白4 905位氨基酸由原來的天冬酰胺N成功替換為非天然氨基酸PrK。

圖8 IPCHCGAVNCR肽段二級質譜圖Fig. 8 MS/MS diagram of the IPCHCGAVNCR peptide
為確保后續smFRET實驗結果有意義,蛋白樣品必須保持部分原有的甲基轉移酶活性。將蛋白與AR組裝成His-SUMO-MLL3SET*AR(M*AR)復合物,驗證His-SUMO-MLL3SET*蛋白樣品是否具有甲基轉移酶活性。在多酶級聯反應體系中,以不加His-SUMO-MLL3SET*為陰性對照,加入相同濃度即 1 μmol/L His-SUMO-MLL3SET(MAR) 代 替 His-SUMO-MLL3SET*為陽性對照。實驗結果(圖9-A)表明,不加His-SUMO-MLL3SET*蛋白時,在515 nm處的吸光度(A515)值基本無變化;加入His-SUMOMLL3SET時,OD值在3 min后達到最大值2,并趨于平緩;而加入His-SUMO-MLL3SET*時,OD值緩慢上升,6 min后達到1.8,并趨于平緩。
為了量化催化生成的SAH,在計算酶促反應速率之前,首先建立SAH濃度與A515之間的關系。即分 別 用 0 μmol/L、3.125 μmol/L、6.25 μmol/L、12.5 μmol/L、25 μmol/L 的SAH代替MAR復合物,直接加到反應體系中,測量各個濃度SAH反應體系的吸光值,經擬合可得到SAH濃度與吸光值的標準曲線 Y=0.048 91X+0.058 59,R2=0.992 4(圖 9-B)。根據此標準曲線計算可得,v0(M*AR)為0.098 14 μmol/(L·s),v0(MAR) 為 0.229 7 μmol/(L·s),此結果表明His-SUMO-MLL3SET*有活性,且活性約為His-SUMO-MLL3SET的43%,可進行后續標記實驗和smFRET實驗。

圖9 多酶級聯反應測His-SUMO-MLL3SET*活性Fig. 9 Activity of His-SUMO-MLL3SET* measured by a multi-enzyme coupling reaction
組蛋白甲基化與基因表達調控相關,在造血、胚胎干細胞發育及神經發育方面具有重要作用,是表觀遺傳領域的主要研究內容之一[21]。MLL3作為一種重要的組蛋白H3K4甲基轉移酶,其異常表達調控會導致多種疾病[22-24]。明確其活性如何被AR調控有助于新藥物研發,而smFRET可以直接觀測MLL3動態過程以研究MLL3催化機制。為了制備充足的蛋白用于smFRET研究,可使用高效表達的pET-28b(+)作為表達載體。該表達載體含有T7啟動子,而C321.ΔA. exp不含有T7 RNA聚合酶基因(T7p07),故首先要改造細菌基因組,將lacZ替換為T7p07。前期也嘗試直接利用pTrc質粒作為表達載體,其優勢在于無需改造基因組,然而MLL3蛋白非常不穩定,即使通過對多種表達條件進行優化,表達量仍很低(數據未顯示),無法制備出足夠蛋白樣品,因此最終選用pET-28b(+)作為表達載體。
smFRET實驗通常需要用到熒光標記技術,該技術將熒光染料(供體和受體)以共價鍵的形式連接到被觀測的蛋白分子上。目前最常用也最成熟的方法是將熒光分子與蛋白表面的兩個半胱氨酸殘基相連接。然而,這種標記方式具有隨機性,即每個位點被標記上的熒光標簽種類(供體或受體)隨機,可能出現同時標記上供體或同時標記上受體的情況。為實現定點標記熒光供體和受體,本研究利用一個半胱氨酸和一個非天然氨基酸實現定點標記熒光供體和受體。通過分析MLL3SET晶體結構,發現活性口袋兩側第4 819/4 820、4 904/4 905位氨基酸殘基可分別進行半胱氨酸和非天然氨基酸突變,以引入熒光染料標記。S4819或Q4820突變成半胱氨酸用于標記熒光供體,V4904或N4905替換成非天然氨基酸PrK用于熒光受體標記,從而實現定點標記熒光染料。前期構建4個兩兩組合的雙點突變質粒進行蛋白表達測試,結果表明S4819C(標記熒光供體)和N4905X(標記熒光受體)這對氨基酸殘基突變蛋白表達量和溶解性最高(數據未顯示)。因此,最終選擇該兩處位點氨基酸突變的質粒進行表達純化以獲得待標記樣品蛋白。
在C321.ΔA. exp宿主菌中表達含非天然氨基酸的蛋白時,需要pEVOL質粒表達外源aaRS-tRNA,還需要pET-28b(+)表達MLL3SET蛋白。在進行雙質粒轉化時,采用同時轉化雙質粒的方案效率非常低,甚至可能不能獲得同時含有pEVOL-pylRS和pET28b-his-sumo-mll3setC4883S S4819C N4905X雙質粒的陽性克隆。采用分兩步轉化的方式,先轉化其中一種質粒,然后把轉化該質粒的細菌做成感受態細胞,再轉入另一種質粒,效率高。本文采用上述兩步轉化法,先轉入pEVOL-pylRS質粒,再轉入pET28b-his-sumo-mll3setC4883S S4819C N4905X,最終成功構建雙質粒表達系統,避免了只轉入一種質粒、效率低等技術性問題。
綜上,本研究制備出了充足的具有酶活性的His-SUMO-MLL3SET*蛋白,該蛋白可在較溫和的條件下進行染料標記,為后續的單分子熒光共振能量轉移實驗研究、揭示MLL活性調控機制奠定了基礎。
本實驗成功將C321.ΔA. exp基因組中的lacZ替換為T7p07,并構建了pEVOL-pylRS和pET28b-hissumo-mll3setC4883S S4819C N4905X雙質粒系統。在該系統中,本研究成功表達和純化了含非天然氨基酸PrK的His-SUMO-MLL3SET*蛋白。最后,通過多酶級聯反應測量出純化后的蛋白具有一定酶活,可用于后續的熒光染料標記以及單分子熒光共振能量轉移實驗。