魯彥伽,孫 虹,吳振芳,雷 鳴
上海交通大學醫學院附屬第九人民醫院上海精準醫學研究院,上海 200125
端粒是真核細胞線性染色體末端的保護性結構,由特定的DNA重復序列和蛋白質組分構成,在維持基因組的穩定中發揮重要作用[1]。Shelterin復合物是一種結合在端粒DNA上的復合物,由多種亞基構成。它與不同的復合物相互作用,通過精細的調控,使得端粒長度始終維持在穩定的狀態[2]。人源Shelterin復合物由TRF1(telomeric repeat binding factor 1)、TRF2、TⅠN2(TRF1-interacting nuclear factor 2)、RAP1(repression/activation protein 1)、 TPP1 (adrenocortical dysplasia protein homolog,又稱ACD)、POT1(protection of telomeric protein 1)6種組分構成,這些組分通過廣泛的相互作用,抑制多種DNA損傷應答反應,調節端粒酶與端粒DNA的結合,維持端粒的穩態[3]。除此之外,Shelterin復合物還會配合細胞周期的進程,保證端粒DNA復制的正常進行[4]。由于Shelterin復合物在維持端粒穩態方面的重要性,其組分結構和功能上的異常,都會導致疾病的發生。例如在人類的乳腺癌細胞中發現Shelterin復合物的各種組分表達異常增高[5],在其他多種腫瘤細胞中檢測到Shelterin組分的突變[6],這些變化大多會造成Shelterin復合物與DNA鏈之間或是Shelterin組分之間的相互作用遭到破壞,最終導致染色體脫帽,端粒DNA暴露在含有端粒酶以及多種損傷響應因子的環境中,促使癌癥的發生[5,7]。
對Shelterin復合物結構的清晰認識能夠極大地推進對慢性淋巴細胞白血病(chronic lymphocytic leukemia,CLL)[8]、先天性角化不良(dyskeratosis congenita,DKC)[9]等由Shelterin 組分功能異常導致的端粒相關疾病的認識,以及相應治療手段的研究進展。有研究表明,Shelterin 組分之間的相互作用是通過一種高度保守的“domain-peptide”(結構域對肽段)的機制來達成的[10-11],即一種Shelterin組分可以通過同一結構域中的保守殘基與多種蛋白質相互作用。這種相互作用機制不僅利于小分子藥物的設計和開發[12],更是賦予了Shelterin 復合物較高的進化可塑性[11]。 裂殖酵母(Schizosaccharomyces pombe,S. pombe) 在進化上相對緩慢,相較于芽殖酵母(Saccharomyces cerevisiae)來說,還留有許多后生生物的特性。正因如此,裂殖酵母在染色體的保護機制上與高等哺乳動物具有較高的同源性[13-14]。裂殖酵母的Shelterin 復合物由Taz1(telomere length regulator taz1)、Rap1、Poz1 (Pot1-associated protein Poz1)、Ccq1 (coiled-coil quantitatively-enriched protein 1)、Tpz1(telomere-protecting protein)、Pot1 6 個組分組成,在結構和功能上與人源Shelterin復合物都高度保守[15]。近年來也有不少以裂殖酵母的Shelterin復合物為研究對象,進行相關疾病起源的研究以及藥物研發的實例。基于裂殖酵母Tpz1-Pot1 之間和人源TPP1-POT1之間相互作用的保守性,通過Tpz1-Pot1生化和結構特性的研究結果,推測人類黑色素瘤相關的POT1 突變(A532P)位于TPP1-POT1 界面,該突變引起的TPP1-POT1相互作用缺失可能是導致端粒異常延長的原因[16];利用人源POT1以及裂殖酵母Pot1結構的高度相似性,以裂殖酵母Pot1 與單鏈DNA 結合復合物為對象進行藥物篩選,成功篩選到了一種能打斷Pot1與單鏈DNA 相互作用的小分子抑制劑[17]。這些治療手段與抑制端粒酶活性的治療方式聯合,能夠在一定程度上克服癌細胞對藥物的耐受性,有望顯著提高藥物對多種癌癥的治療效果[18]。
近20 年來Shelterin 復合物中多種蛋白質-蛋白質以及蛋白質-DNA 相互作用的高分辨率晶體結構已獲得解析[19-24]。然而,Shelterin復合物在體內具有高度的異質性——各亞基間可能形成不同組合的亞復合物,參與不同的調控反應[25];同時,Shelterin 復合物的結構具有較大的可變性,這些因素都極大地阻礙了完整Shelterin復合物高分辨率結構的解析。本實驗室之前的工作已解析了裂殖酵母Shelterin三元復合物(Rap1-Poz1-Tpz1)的晶體結構[19],在此基礎上本研究采用在體外重組并表達裂殖酵母Shelterin復合物的方法,通過兩步親和層析、凝膠過濾層析等蛋白質純化流程、負染技術、電子顯微鏡(電鏡)以及單顆粒重構技術,最終獲得了裂殖酵母Shelterin五元復合物Rap1-Poz1-Tpz1-Ccq1-Pot1 的低分辨率三維結構模型,為解析高分辨率的Shelterin復合物結構奠定了堅實的基礎,對理解整個復合物的組裝方式及其發揮功能的分子機制具有重要的意義,同時也將為相關疾病的治療提供新的思路和潛在靶點。
1.1.1 表達質粒與菌株 pGEX-6P1 以及pET-28ASm2 克隆載體均由本實驗室保管,其中pET-28AS-m2為本實驗室基于pET-28a(+)改造的質粒——用編碼小分子泛素相關修飾物蛋白(small ubiquitin related modifier,SUMO) 序列替換原pET-28a(+) 中的ACTGGTGGACAGCAAATGGGTCGC 序列。用于質粒擴增的大腸埃希菌(E. coli)DH5α 以及用于蛋白質表達的E.coliBL21(DE3)菌株由本實驗室保管。
1.1.2 主要試劑以及儀器 LB 培養基購于青島生工生物科技有限公司,鎳離子金屬螯合親和層析介質(Ni-NTA)購于德國Qiagen 公司,谷胱甘肽瓊脂糖凝膠(glutathione sepharose 4B)購于美國GE 公司,甲酸雙氧鈾購于美國TED PELLA 公司,氨芐青霉素、 卡納霉素、 氯化鈉(NaCl)、 甘油(glycerol)、異丙基-β-D-硫代半乳糖苷(isopropylbeta-D-thiogalactopyranoside,ⅠPTG)、苯甲基磺酰氟(phenylmethylsulfonyl fluoride,PMSF)、亮抑肽酶(leupeptin)、三羥甲基氨基甲烷(Tris)、二硫蘇糖醇(dithiothreitol,DTT)均購于生工生物工程(上海)股份有限公司,考馬斯亮藍G250 購于上海碧云天生物技術有限公司。本實驗使用的His-ULP1(帶組氨酸標簽的SUMO 蛋白酶)以及谷胱甘肽巰基轉移酶3C酶(GST-3C)均由實驗室表達、純化及保存。
高壓細胞破碎儀(FB-110X)購于上海勵途超高壓設備有限公司,高速離心機(Beckman Avanti JXN26)購于美國Beckman Coulter 公司,超聲波清洗器(SB-5200DTN)購于寧波新芝生物科技有限公司,垂直電泳儀(Mini-PROTEAN Tetra Cell)購于Bio-Rad(中國)公司,控溫振蕩培養箱(YR101)購于上海西雷生物有限公司,快速蛋白質液相色譜(fast protein liquid chromatography, FPLC) 系統(?KTATMpure)和SuperoseTM6 10/300 GL 層析柱購于美國GE 公司,普通碳支持膜(BZ1102XX)購于北京中鏡科儀有限公司,透射電子顯微鏡(Talos L120C)購于美國FEⅠ公司。
1.2.1 質粒構建 從Shelterin復合物各亞基間的相對位置關系(圖1A),復合物各組分之間的相互作用情況(圖1B),以及本實驗室已發表的實驗數據來看,Poz1全長蛋白質中的71~83位肽段不利于蛋白質穩定純化[19];我們在本次構建中去除了這段序列(本文仍簡稱Poz1),并在Poz1的羧基端引入編碼融合蛋白質柔性連接——(GGS)2肽段的序列,再利用該連接將Poz1的C端與Rap1PBM(Rap1上與Poz1相互作用的區域,氨基酸殘基:465~491)的氨基端相連,構建出融合蛋白質Poz1-Rap1PBM[相對分子質量(Mr)30 000]。同樣地,通過從氨基端到羧基端依次排列Tpz1PⅠM(Tpz1 上與Pot1 相互作用的區域,氨基酸殘基:167~240)、Tpz1CBM-Tpz1PBM(Tpz1 上與Ccq1 相互作用的區域-Tpz1 上與Poz1 相互作用的區域,氨基酸殘基:425~509),構建Tpz1ⅠNT(Mr17 000),2個片段用(GGS)2肽段連接。將Pot1FL(Pot1全長蛋白質,Mr61 000)、Poz1-Rap1PBM和Ccq1TAD(Ccq1上與Tpz1相互作用的區域,氨基酸殘基:123~439,Mr34 000)3 段序列分別構建于pET-28AS-m2 克隆載體,使它們各自氨基端帶上His-SUMO純化標簽;Tpz1ⅠNT構建于pGEX-6P1 克隆載體,使其氨基端帶上谷胱甘肽巰基轉移酶(GST)純化標簽(圖1C)。

圖1 裂殖酵母Shelterin復合物各組分重組質粒的構建Fig 1 Construction of recombinant plasmids of each component of S.pombe Shelterin complex
1.2.2 蛋白質表達與純化 將Tpz1ⅠNT與Pot1FL共同轉化進E. coliBL21 (DE3),Poz1-Rap1PBM以及Ccq1TAD單獨轉化進BL21(DE3)。挑取單個菌落至對應抗性的LB 液體培養基,于37 ℃活化12 h。將活化好的菌體轉接至1 L 對應抗性的LB 液體培養基。接種比例為菌種∶培養基=1∶100。每次搖菌6 L,包括3 L Tpz1ⅠNT和Pot1FL共表達菌、2 L Poz1-Rap1 融合蛋白質表達菌和1 L Ccq1TAD表達菌。
在37 ℃下培養至吸光度值為0.8,降溫至18 ℃后,加入ⅠPTG(終濃度為0.2 mmol/L)誘導蛋白質表達18 h。然后以3 990×g、25 ℃離心15 min,收集菌體。用lysis buffer吹懸菌體,直至無細菌團塊。向懸液中添加終濃度為1 mmol/L 的PMSF、1 μg/mL 的亮抑肽酶并混勻,于高壓均質機中徹底裂解并取樣。裂解后的樣品立刻于39 190×g、4 ℃離心45 min,收集上清液并取樣。然后,將收集的上清液與Ni-NTA于4 ℃低轉速結合1 h。離心收集Ni-NTA 于層析柱,收集流穿液并取樣。之后用wash buffer Ⅰ清洗雜蛋白質并取樣。洗雜期間,用考馬斯亮藍G250 實時監測雜蛋白質的洗脫情況,待考馬斯亮藍G250 幾乎不再變藍后,用elution buffer Ⅰ洗脫并收集目的蛋白質,取樣。然后立刻用His-ULP1 于4 ℃酶切處理洗脫液,去除所有蛋白質氨基端的His-SUMO標簽。
在His-ULP1酶切進行6 h后,取樣。直接加入谷胱甘肽瓊脂糖凝膠進行第2 步的親和層析,于4 ℃低速旋轉結合4 h。4 h 后,將谷胱甘肽凝膠轉移至層析柱,收集流穿液,并取樣。然后用wash buffer Ⅱ徹底清洗雜蛋白質,將谷胱甘肽凝膠轉移至干凈的50 mL管,于4 ℃下用GST-3C 酶低轉速過夜處理谷胱甘肽瓊脂糖凝膠,將Tpz1 蛋白質氨基端GST 標簽以及GST-3C 酶與目的蛋白質完全分開。將目的蛋白質留在流穿液里,而將GST 標簽和酶留在谷胱甘肽凝膠上。10 h 后200×g離心收集上清液并取樣,將純化各步驟留取的樣品行十二烷基磺酸鈉-聚丙烯酰胺凝膠電泳 (sodium dodecyl sulfate polyacrylamide gel electrophoresis,SDS-PAGE)。檢查純化各步驟樣品蛋白質組成的變化情況。
在目的蛋白質樣品中加入DTT (終濃度為2 mmol/L),用截留Mr為100 000 的超濾濃縮管將蛋白質體積濃縮至1 mL,并于21 130×g離心10 min 后,取上清液,使用SuperoseTM6 10/300 GL 與FPLC buffer,以0.4 mL/min 的流速分離純化蛋白質。根據出峰情況,利用SDS-PAGE檢測出峰位置對應收集管內的蛋白質組成狀況。上述緩沖液配方見表1。

表1 緩沖液配方Tab 1 Buffer recipes
1.2.3 電鏡樣品制作、觀察以及數據處理 將銅網碳膜覆蓋面向上,經過真空放電親水化處理后使用。取5 μL 稀釋后的蛋白質樣品滴于銅網中心(碳膜面朝上),等待樣品吸附1 min,用濾紙邊緣吸走多余的液體。將3 個5 μL 0.75%(質量體積濃度)甲酸雙氧鈾染液滴置于疏水薄膜,銅網碳膜面朝下蘸取染液,并立刻吸走多余染液,重復2 次。最后,吸取5 μL 染液靜置染色1 min,用濾紙吸取多余的染液。然后將銅網碳膜朝上置于濾紙上,65 ℃照射5 min,至銅網完全干燥。將干燥的樣品用120 kV 透射電鏡觀察,放大倍數設置為92 000 倍,欠焦值為-2~-1 μm,選擇襯度好、顆粒分散性好、形態均一、濃度合適的區域收集數據。每張照片拍攝的位置的中心應間隔至少2 μm,以確保每張照片的視野沒有重疊的區域,收集到的顆粒均不重復。將收集的原始圖片數據用EMAN2 軟件進行顆粒抽取,然后從EMAN2 軟件中將抽取顆粒的圖像和位置信息全部導入RELⅠON3.0 軟件,經過對采集數據的處理最終產生一個目的復合物的三維重構模型。
1.2.4 Shelterin復合物結構初步分析 將獲得的三維重構模型與已發表的裂殖酵母亞復合物高分辨率結構進行擬合。亞復合物Rap1PBM-Poz1-Tpz1PBM(PDBⅠD:5XXF)、Ccq1TAD-Tpz1CBM(PDB ⅠD:7CUJ)、Pot1OB3-Tpz1PⅠM(PDB ⅠD:7CUⅠ)、Pot1OB1-OB2(PDBⅠD:7CUH)高分辨率結構均由PDB 數據庫檢索獲得。將上述結構導入USFC Chimera 軟件,與我們所獲得的重構模型進行擬合,以推測各組分在整個Shelterin復合物中大致的分布以及取向情況。
E. coli體系經18 ℃誘導,能大量表達目的蛋白質。經過Ni-NTA 親和層析,除去了大量雜蛋白質,但可以看出,洗脫后的樣品純度依然不高。之后,經過His-ULP1處理以及谷胱甘肽瓊脂糖凝膠親和層析,可以獲得純度較高的樣品(圖2A)。為獲得性質均一的蛋白質樣品,我們又將獲得的樣品濃縮至1 mL后,以0.4 mL/min 的流速進行SuperoseTM6 10/300 GL 凝膠過濾層析,最終得到了性質均一,并且組分齊全、比例合適的樣品,目的蛋白質在SuperoseTM6 10/300 GL分子篩上大量被洗脫的體積為15.16 mL(圖2B),經SDS-PAGE 檢測對應出峰位置的蛋白質樣品組成情況,可以證明蛋白質樣品純度較高、組分齊全且比例合適(圖2C)。

圖2 裂殖酵母Shelterin復合物的體外表達與純化Fig 2 Expression and purification of S.pombe Shelterin complex in vitro
從120 kV 電鏡的視野下觀察被甲酸雙氧鈾覆蓋的樣品,可以看見,蛋白質顆粒的形態被染鹽襯托得較為清晰,顆粒與顆粒之間的距離合適。顆粒直徑約為15 nm,結合凝膠過濾層析結果,推測所純化出的復合物為二聚體。在視野中能看見存在不同角度投影的形態信息,這說明蛋白質顆粒的多角度數據都能被收集(圖3A)。可以通過后期的數據計算,獲得較為立體的顆粒結構信息。在92 000倍的放大倍數下,每張照片采集間隔2 μm 的距離,收集到負染圖片83 張,用EMAN2 軟件[26]挑選了18 659 個顆粒,然后使用Relion3.0 軟件[27]對所有的顆粒進行2D 分類(圖3B)、初始模型構建、以及3D 分類和3D 優化處理獲得Shelterin五元復合物的負染三維結構模型。使用USCF Chimera 軟件對計算出的模型進行評測,可以看出目的蛋白質顆粒結構特征明顯,三維重構效果良好(圖3C),挑選出的顆粒角度分布均勻(圖3D)。
3D 分類后的每個分組的顆粒個數基本均勻,選擇其中結構形態各部分過渡最均勻的為模版進行優化處理,最終獲得一個分辨率為17 ?(1 ?=0.1 nm)的三維模型(圖4A),整個蛋白質復合物大小為145 ?×120 ?×110 ?(圖4B)。然后我們利用UCSF Chimera軟件[28]將PDB 數據庫[29]中已有的裂殖酵母相關高分辨率Shelterin亞復合物的結構與我們獲得的模型進行擬合和匹配。
根據近年來發表的多種裂殖酵母Shelterin 亞復合物的結構信息可以得知:①Rap1PBM-Poz1-Tpz1PBM可以通過Poz1 的N 端前2 個α 螺旋形成反向平行的二聚體[19]。②在Ccq12-439-Tpz1406-508-Poz1FL復合物中通過基于雙琥珀酰亞胺亞砜(disuccinimidyl sulfoxide,DSSO)的交聯質譜分析鑒定出Ccq1 的N端(氨基酸殘基:2~439)與Poz1 之間有廣泛的相互作用[30],并且在Tpz1 組分中與Ccq1 以及Poz1 產生相互作用的2 個結構域Tpz1CBM、Tpz1PBM緊密相鄰。這說明,Ccq1 與Poz1 組分在空間位置上相近。③有相關的負染電鏡結果表明,在Ccq12-439-Tpz1406-508-Poz1FL二聚體中,2 個Ccq1 組分由于缺失C 端結構域,會采取相對自由的取向[30]。所以,在我們進行匹配的模型中,將2 個Poz1-Tpz1PBM組分放在空間結構上接近的位置,2 個Ccq1TAD分別放在與2 個Poz1 相近的位置。然后,由于Tpz1PⅠM和Tpz1CBM通過(GGS)2肽段連接,所以在匹配過程中我們將與Tpz1PⅠM有相互作用的Pot1OB3-Tpz1PⅠM,以及與Tpz1CBM有相互作用的Ccq1TAD-Tpz1CBM放置在相近的位置。最后,將Pot1OB1-OB2組分放置在整個結構中相對獨立、占比大、且有對稱傾向的“三角形”的兩邊。從分子對接結果可以說明所有高分辨率結構與重構模型匹配情況良好,進而大致確定了各亞基在重構模型中的相對位置(圖4C)。

圖4 Shelterin復合物三維重構模型和各亞基的分子對接情況Fig 4 3D reconstruction of the Shelterin complex and docking of solved structures into the overall envelope
Shelterin 復合物是結合在真核生物端粒區域,維持基因組穩定的重要復合物[2]。它保護端粒,防止其被識別為雙鏈DNA 而發生斷裂,并能夠調控端粒酶的結合[3],保證端粒DNA 復制正常進行[4]。正由于Shelterin復合物在端粒末端保護方面的重要性,其組分缺失、突變[31]或是復合物組分間相互作用的破壞[16]都會造成端粒功能紊亂,導致基因組穩定性被嚴重破壞,進而導致疾病的發生。
最近幾十年以來,研究人員已經從進化上、功能上、結構上對多種生物的Shelterin復合物開展了廣泛的研究[3,11,32]。這些研究的成果對幫助我們理解端粒末端穩態調控的具體機制提供了寶貴的理論依據。但是到目前為止,由于Shelterin復合物分子量巨大,并且在結構上具有高度的可變性,所以尚未有完整的復合物的結構被解析出來。而Shelterin復合物行使調控端粒異染色質形成[33]以及端粒酶結合等功能[34],都要依賴于復合物的正確組裝。所以,對Shelterin復合物整體結構的解析,將會更全面地闡明其與端粒DNA 結合的情況,解釋Shelterin 整體復合物的組裝機制,從而便于從整體上來認識Shelterin 復合物的功能。
我們之前的工作解析了裂殖酵母Shelterin三元復合物(Rap1-Poz1-Tpz1)的晶體結構[19],本研究在此基礎上采用在體外表達并重組裂殖酵母Shelterin復合物的方法,首次獲得了一個裂殖酵母Shelterin五元復合物(Rap1-Poz1-Tpz1-Ccq1-Pot1)的低分辨率結構。我們對已有的高分辨率復合物組裝方式進行分析,并將這些高分辨率結構與我們獲得的重構模型進行分子對接,大致確定了各組分在整個復合物中的分布情況。另外,我們的凝膠過濾層析結果與結構模型直接說明了該復合物是一個二聚體,這對復合物高分辨率結構的解析和組裝機制的揭示有重要的意義,也對理解Shelterin 復合物發揮功能的分子機制提供了重要線索。但為了解析復合物組分間具體的相互作用情況,我們還需要獲得更高分辨率的結構信息。接下來,我們還需要著手篩選適合冷凍觀察Shelterin 復合物的條件,用冷凍電鏡來分析裂殖酵母Shelterin 復合物的結構,獲得復合物的高分辨率信息,以更加精細地揭示Shelterin 復合物發揮各項調節作用的結構基礎。