蔡啟忠,周良云,劉 露,劉長征,王 浩,鐘 磊,楊 全
廣東藥科大學中藥學院 國家中醫藥管理局嶺南藥材生產與開發重點研究室 國家中藥材產業技術體系廣州綜合試驗站廣東省南藥規范化種植與綜合開發工程技術研究中心,廣東 廣州 510006
糖基化是自然界中廣泛存在的重要修飾反應之一。糖基轉移酶(glycosyltransferase,GT,EC 2.4.x.y)是催化糖基化反應的一類酶[1],在生物體內廣泛存在的超基因家族[2],在酶催化反應中具有高效性和立體選擇性[3],對植物的各種生命活動及次生代謝產物的形成上都具有重要影響[4]。隨著植物糖基轉移酶及催化底物譜的不斷探索與發現,糖基化工具酶庫不斷擴充,反應類型不斷豐富,糖基化反應將變得更綠色與經濟,甚至使某些化學法難以糖基化的反應得以實現[5]。在糖基轉移酶的研究與開發利用中,針對不同糖基酶的催化特點,有針對性的對其底物識別的特異性進行探索,從而發現特異性催化的糖基轉移酶,系統性的總結其催化特點,進而建立糖基化的新方法,與化學合成進行優勢互補,取長補短,以低成本、更綠色的手段來合成糖苷類化合物。
何首烏Polygonum multiflorumThunb.為蓼科多年生草本植物,主要以塊根入藥,是我國著名的傳統中藥。何首烏中含二苯乙烯類、蒽醌類、黃酮類、磷脂類、多糖類主要活性化學成分[6]。目前何首烏的單組分藥理研究主要集中在對二苯乙烯苷的研究上。研究表明二苯乙烯苷具有抗衰老、抗動脈粥樣硬化、抗高血脂、抗腫瘤、抗炎、清除自由基、保肝等方面的生物活性[7-8]。
目前,從何首烏中分離得到了多種以二苯乙烯類結構為母核的糖苷,在何首烏中主要以2,3,5,4′-四羥基二苯乙烯-2-O-β-D-葡萄糖苷的形式存在,是二苯乙烯苷元側鏈結合一個單糖基,這意味著何首烏中存在相應的糖基轉移酶參與何首烏二苯乙烯苷的糖基化修飾,且主要在2 位上形成O-糖苷。研究催化特定位點糖苷化的酶,不僅能闡述何首烏中二苯乙烯苷的O-糖基引入機制,也有助于闡明何首烏中活性成分的生物合成途徑。迄今為止尚未有將何首烏中獲得的糖基轉移酶作為工具酶用于結構多樣的糖苷化合物生物合成的報道。因此,挖掘并研究何首烏糖基轉移酶并應用于多種結構類型的天然產物特定位點糖苷的酶法合成,具有重要的理論研究與實際應用價值。
何首烏植物采自廣東省肇慶市德慶縣大橋村,經廣東藥科大學楊全教授鑒定為蓼科植物何首烏P.multiflorumThunb.。取其根、莖、葉組織樣品,液氮速凍后置-80 ℃保存備用。
原核表達載體pET-28a(+)由實驗室傳代凍存;克隆和表達大腸桿菌Transl-T1、Transetta(DE3)與無縫連接試劑盒pEASY-Uni Seamless Cloning and Assembly Kit 均購自北京全式金生物技術有限公司;BamH I 限制性內切酶購自NEB 公司;植物多糖多酚總RNA 提取試劑盒購自北京天根生化科技有限公司;KOD-Plus-高保真酶購自日本TOYOBO 公司;PrimeScript? II 1st Strand cDNA Synthesis Kit、膠回收試劑盒、PrimeScript? RT reagent Kit with gDNA Eraser、TB Green?Premix Ex Taq? II 均購自日本TaKaRa 公司;引物合成及基因片段測序由廣州擎科生物技術有限公司完成。
取-80 ℃凍存的根、莖、葉組織樣品,按照植物多糖多酚總RNA 提取試劑盒(Tiangen)操作說明提取何首烏總RNA,利用Nano-100 微量分光光度計檢測RNA 濃度和純度,1.0%瓊脂糖凝膠電泳檢測RNA 的完整性。
本研究基于實驗室已獲得的何首烏轉錄組數據[9]篩選了4 條PmUGTs基因序列(Gene ID 分別為Unigene0051938、Unigene0017806、Unigene0027873與Unigene0034969),基于無縫克隆原理設計以上序列的特異性擴增引物(引物序列見表1)。按照KOD-Plus-Neo 擴增試劑盒說明(TOYOBO)進行,以反轉錄產物為模板,擴增PmUGTs基因片段。擴增反應體系為:cDNA 1 μL,KOD-Plus-Neo(1 U/μL)1 μL,10×PCR Buffer for KOD-Plus-Neo 5 μL,dNTPs(2 mmol/L)5 μL,MgSO4(25 mmol/L)3 μL,上、下游引物(10 μmol/L)各1.5 μL,ddH2O 補足至50 μL。反應程序:94 ℃預變性2 min;94 ℃變性30 s,60 ℃退火30 s,72 ℃延伸40 s,35 個循環后;72 ℃延伸10 min。1.0%瓊脂糖凝膠電泳檢測PCR 產物,膠回收PCR 產物。按照無縫克隆說明,將PCR 產物與BamH I 限制性內切酶酶切后的pET-28a 載體連接;轉化到Transl-T1 菌株中,在含卡那霉素抗性的平板上進行篩選,挑取單菌落進行菌落PCR 檢測,選取5 個陽性菌液送廣州擎科公司測序驗證。

表1 引物序列Table 1 Primer sequences
使用EMBOSS 在線軟件與CodonW 1.4.2 軟件對PmUGTs核苷酸序列進行密碼子偏好性參數分析,包括同義密碼子相對實用度(relative synonymous codon usage,RSCU)、密碼子使用頻次、密碼子適應指數(codon adaptation index,CAI)、有效密碼子數(effective number of codons,ENC)、GC 含量百分比、密碼子末尾 GC 含量百分比(GC3s);利用ExPASy Proteomics Server 在線軟件Protparam 對4 個PmUGTs基因編碼蛋白分子式組成、蛋白質分子質量、理論等電點及穩定性等理化性質進行分析;Cell-PLoc 2.0 進行亞細胞定位;使用 SignalP 5.0 sever 預測跨膜結構域;通過EXPASY-SOPMA 在線預測蛋白質的二級結構;利用SWISS-MODEL 在線軟件構建PmUGTs 蛋白的三級結構模型;使用Autodock 4.2.3 軟件對推測底物進行分子對接模擬實驗;將PmUGTs編碼的氨基酸序列在NCBI 中進行蛋白BLAST 分析,利用DNAMAN軟件與其他物種的UGT 氨基酸序列進行同源性分析;并通過 MEGA 6.0 軟件構建neighbor-joining 系統進化樹,采用泊松校正法計算進化距離,Bootstrap 重復次數為1000 次。
挑選測序驗證后的轉化子,過夜培養,提取pET-28a-PmUGTs重組質粒,轉化Transetta(DE3)感受態大腸桿菌中培養,在含卡那霉素抗性的平板上進行篩選,挑取單菌落進行菌落PCR 檢測,選取5 個陽性菌液送廣州擎科公司測序驗證。挑選序列正確菌株,按1∶100 比例加入到適量含有50 μg/mL卡那霉素的LB 液體培養基中,37 ℃,200 r/min振蕩培養至600 nm 吸光度(A600nm)達0.6~1.0;加IPTG 至終濃度0.4 mmol/L,20 ℃,200 r/min 培養12 h,誘導產生PmUGT 重組蛋白。經誘導表達的培養物,以5 500 r/min 離心15 min 收集菌體,用ddH2O 清洗菌體2 次后,將菌體懸浮于緩沖液(50 mmol/L Tris-HCl,1 mmol/L EDTA,10%甘油,1 mmol/L PMSF)中,超聲破碎(750 W 功率,超聲5 s,間歇5 s,工作5 min)。細胞破碎液于4 ℃,13 000 r/min,離心15 min,去除細胞碎片。取上清加入6×loading buffer 混勻,沸水浴5 min,13 000 r/min 離心5 min,上樣10 μL 進行10% SDS-PAGE電泳,電泳結束后將膠置于考馬斯亮藍中染色1 h,用脫色液將背景色脫去,檢測蛋白表達情況。
利用qRT-PCR方法檢測何首烏PmUGTs基因在不同組織中的表達水平。取-80 ℃凍存的根、莖、葉組織樣品,每個器官取3 個生物學重復,提取其總RNA,用反轉錄試劑盒PrimeScript? RT reagent Kit with gDNA Eraser(TaKaRa 公司)將以上總RNA反轉錄生成單鏈cDNA。使用TB Green?PremixEx Taq? II(TaKaRa),在CFX96 Touch(BioRad)儀上進行擴增。選取何首烏PP2A基因[9]作為目標基因定量表達的內參基因,通過primer BLAST 在線設計擴增引物,引物序列見表1。擴增體系中含10 μL SYBR?Green Pro Taq HS Premix(2×)、上下游引物(10 μmol/L)各0.4 μL、cDNA 2 μL,ddH2O補至總體積為20 μL,每個體系設3 次技術重復。反應程序:95 ℃預變性30 s;95 ℃、5 s,60 ℃、30 s,40 個循環后,進行溶解曲線分析。采用2-ΔΔCt方法進行相對定量分析,用SPSS 23.0 進行各組間方差分析,并用GraphPad Prism 7.0 作圖。
以逆轉錄cDNA 為模板進行擴增后,4 條基因的擴增產物在2000~1000 bp 內,如圖1所示。構建的pET-28a-PmUGTs重組載體經測序結果顯示,克隆的目的片段與何首烏轉錄組數據中的基因序列一致,基因分別命名為PmUGT1、PmUGT2、PmUGT3、PmUGT4。

圖1 PmUGTs 基因PCR 擴增產物Fig.1 PCR amplified production PmUGTs
3.2.1 PmUGTs 密碼子偏好分析及其蛋白理化性質分析、亞細胞定位、跨膜區域分析 運用EMBOSS在線軟件與CodonW 1.4.2分析PmUGTs進行密碼子偏好參數分析,結果見表2、3,得出PmUGT1、PmUGT2、PmUGT3、PmUGT4的ENC 值分別為57.242、49.211、51.597、56.674,均值為53.681(遠大于20 而偏向61),表明該密碼子偏好性較弱;此外,所得的CAI 值分別為0.350 0、0.351 0、0.408 3、0.324 2,均值為0.358 4(遠低于1.0),進一步說明PmUGTs對密碼子的偏好性較弱;PmUGTs的GC與GC3s 含量均大于50%,表明該開放閱讀框(ORF)序列中AT 含量小于GC 含量,且PmUGTs偏好使用以G/C 結尾的密碼子。PmUGTs密碼子RSCU 值分析如表3所示,其中24 個密碼子RSCU 值大于1,是PmUGTs的偏好密碼子;GCC、AUC、AGG、AGC、ACC、UAC 的RSCU 值大于1.5,即為高頻率密碼子;其中ACC(2.12)的RSCU 值大于2,表明PmUGTs對該密碼子具有極強偏好性。

表2 PmUGTs 核苷酸序列特征分析Table 2 Analysis of nucleotide sequence of PmUGTs from P.multiflora

表3 PmUGTs 密碼子RSCU 值分析Table 3 RSCU value analysis for PmUGTs from P.multiflora
使用在線軟件Protparam 分析PmUGTs 的蛋白理化性質,結果如表4所示,得出PmUGT1、PmUGT2、PmUGT3、PmUGT4 的相對分子質量分別在56 940、54 780、54 305 和54 620;等電點(PI)分別在5.97、5.30、5.73、5.91;且均為親水性蛋白;除PmUGT3 外(不穩定系數=32.84<40),其他蛋白皆為不穩定蛋白(不穩定系數>40)。使用亞細胞定位軟件Cell-PLoc 2.0 預測出PmUGT1、PmUGT4定位于細胞膜中,PmUGT2、PmUGT3 則定位于細胞膜與葉綠體中。SignalIP 5.0 sever 在線軟件分析得出PmUGTs 均不存在跨膜區域。

表4 PmUGTs 蛋白理化性質分析Table 4 Physicochemical property of PmUGTs protein from P.multiflora.
3.2.2 PmUGTs 蛋白二級和三級結構分析 預測結果如表5所示,PmUGTs 蛋白的二級結構由大部分的無規則卷曲(random coil)與α-螺旋(α-helices)組成,推測兩者為蛋白主要二級結構元件;延伸鏈(extended strand)和β-折疊(β-turn)則分布于整個蛋白中。根據同源建模的原理,使用SWISS-MODEL對蛋白三維結構進行預測,三維結構如圖2所示。PmUGT1、PmUGT2、PmUGT3、PmUGT4 蛋白同源建模使用的模板分子及其同源性分別為2pq6.1.A[10],36.19%;6l8x.1.A[11],33.93%;2pq6.1.A,52.22%;6lzx.1.A[12],27.86%。

圖2 PmUGTs 蛋白的三級結構Fig.2 Tertiary structure prediction of PmUGTs

表5 PmUGTs 蛋白的二級結構Table 5 Secondary structure of PmUGTs protein from P.multiflora.
3.2.3 PmUGTs 氨基酸序列與系統進化樹分析 將PmUGTs 氨基酸序列在BLASTP 中進行比對后,選擇相似性高的氨基酸序列在DNAMAN 8.0 軟件中進行多重序列比對,結果如圖3所示,PmUGTs 與其他物種UGT 相似性為42.26%,N 端同源性較C端低。供比對的UGTs 都存在一段由44 個氨基酸組成 的 PSPG 盒 (plant secondary product glycosyltransferase box),其中還包含一段高度保守的氨基酸序列HCGWNS。選擇不同植物的UGT 構建系統發育樹分析,結果如圖4所示,PmUGT1、PmUGT3 聚在同一支,PmUGT2 獨在一支,三者與擬南芥的糖基轉移酶蛋白距離較近;而PmUGT4與蒺藜苜蓿距離則較近。

圖3 PmUGTs 與其他植物糖基轉移酶序列比對結果Fig.3 Multiple sequence alignment of PmUGTs and UGT from other plant species

圖4 PmUGTs 蛋白氨基酸序列的系統發育樹Fig.4 Phylogenetic tree of amino acid sequence of PmUGTs
3.2.4 PmUGTs 蛋白與底物分子對接 根據SWISS-MODEL 進行同源建模可知,PmUGT1 和PmUGT3、PmUGT2、PmUGT4 分別以蒺藜苜蓿的UGT85H2、羅漢果的UGT74AC1、垂序商陸的PaGT3 作為模板構建蛋白三維模型。使用autodock 4.2.3 對PmUGT1 和PmUGT3、PmUGT2、PmUGT4分別與其分子模板主要的反應底物(鷹嘴豆芽素A、羅漢果醇以及白藜蘆醇)進行分子對接模擬實驗。結果表明(圖5),鷹嘴豆芽素A 與PmUGT1 的Ser191、Ile84 [(抑制常數,Ki)=44.07 μmol/L,(結合自由能,ΔGbind)=-5.94]和PmUGT3 的ASN78、ASP80(Ki=8.59 μmol/L,ΔGbind=-6.91)通過氫鍵對接實現互相作用(氫鍵鍵程都在0.25 nm以內),推測以上殘基可能是PmUGT1、PmUGT3識別鷹嘴豆芽素A 并作用的關鍵殘基;羅漢果醇對PmUGT2 的ILE260、ASP244 與ASN484(Ki=9.94 μmol/L,ΔGbind=-6.82)通過5 個氫鍵對接(氫鍵鍵程在0.28 nm 以內),同理,以上殘基可能為PmUGT2 識別羅漢果醇的關鍵殘基;白藜蘆醇對PmUGT4 的PRO422、GLY398 與GLY424(Ki=22.48 μmol/L,ΔGbind=-6.34)通過3 個氫鍵連接(氫鍵鍵程在2.3A 以內),即以上殘基可能為白藜蘆醇與PmUGT4 相互作用的關鍵殘基。

圖5 PmUGTs 與相應化合物配體的分子對接Fig.5 Molecular dockings of PmUGTs and relevant ligands
使用pET-28a 作為原核表達載體,利用同源重組原理構建pET-28a-PmUGTs 重組表達載體,轉化到Transetta(DE3)感受態大腸桿菌中誘導相關表達蛋白。SDS-PAGE 結果如圖6所示,pET-28a-PmUGTs 經誘導后,與含目的基因的未誘導蛋白以及不含目的基因的空白載體誘導蛋白進行對比,在50 000~70 000 誘導樣品6~10 皆存在明顯的蛋白條帶,與所預測PmUGT1、PmUGT2、PmUGT3、PmUGT4 的相對分子質量56 940、54 780、54 350和54 620 結果相近,所以圖6中紅色箭頭所指4 個蛋白條帶分別為PmUGT1、PmUGT2、PmUGT3 與PmUGT4 的重組蛋白。

圖6 PmUGTs 重組蛋白SDS-PAGE 電泳圖Fig.6 SDS-PAGE analysis of the expression of recombinant PmUGTs
利用qRT-PCR 分析PmUGTs基因在何首烏根、莖、葉中的相對表達水平。結果如圖7所示,PmUGT1、PmUGT3 與PmUGT4中均呈現葉表達水平最高,莖次之,而根則最低的趨勢。根據顯著性差異分析得出,PmUGT1 與PmUGT3基因在莖與根的相對表達量相對于葉均下調,且具有顯著性差異(P<0.05);PmUGT4基因的根相對于葉、莖的相對表達量均下調,分別呈現極顯著性差異(P<0.01)與顯著性差異的結果;而在PmUGT2中,莖相對于根與葉的相對表達量均下調,分別有極顯著性差異與顯著性差異的結果。

圖7 PmUGTs 在何首烏不同組織中的相對表達水平Fig.7 Relative expression level of PmUGTs gene in different tissues
何首烏中存在著豐富的糖苷類化合物,如二苯乙烯苷類、黃酮苷類以及蒽醌苷類成分等,暗示著其中具有多種相應催化的糖基轉移酶。至今仍未發現關于何首烏糖基轉移酶的報道,為此,本研究以前期實驗室獲得的轉錄組測序數據為基礎,成功從何首烏葉片中克隆出了4 條糖基轉移酶基因,并分別命名為PmUGT1、PmUGT2、PmUGT3、PmUGT4。對PmUGTs的密碼子偏好模式進行分析,發現其CAI 與ENC 均值為0.358 4 與53.681,表明PmUGTs的基因密碼子偏好性較弱;但對ACC 密碼子具有極強偏好(RSCU>2.00);且其GC3s 均>50%,該結果不符合大部分雙子葉植物密碼子偏好使用A/U結尾的特征,可能是在進化過程中產生突變,但是其具體原因還有待進一步研究。PmUGTs基因編碼的蛋白C 端結構域均可發現一段含有糖基轉移酶識別(WAPQV)、結合供體分子位點(HCGWNS)的PSPG box 保守序列[13-16],且該PSPG box 的第22、23 與44 位氨基酸種類一般會影響GT 的供體分子類型[17-18],PmUGTs 在以上位點皆分別為色氨酸、天冬氨酸與谷氨酰胺,由此可推測PmUGTs 的糖基供體極可能為UDP-葡萄糖。GT 根據其結構特性一般可分為GT-A 和GT-B 2 種折疊類型[19]。其中GT-B 型是由2 個正對的β/α/β 類Rossmann 折疊區域構成[20],一個為N 端結構域,另一個則為C 端結構域,且N 端同源性較C 端相比低,二者之間還有一個結合底物的口袋[20-21],觀察本實驗所預測的4 個PmUGTs 蛋白三維構型均與GT-B 型相符合。另外,本研究通過將PmUGTs基因與pET-28a質粒構建原核表達載體,誘導重組蛋白的表達,經過SDS-PAGE 驗證得pET-28a-PmUGTs 重組蛋白成功表達。何首烏中的糖苷類成分生物合成仍存在許多未知,因此,為探究何首烏糖苷類成分的主要合成部位及可能存在的作用,本實驗采用qRT-PCR 的方法研究PmUGTs基因在何首烏各組織中的相對表達情況。結果顯示PmUGTs在何首烏各組織中存在特異性表達,總體而言,PmUGTs 在根中皆表現出較低的表達量。張倫等[22]研究表明,何首烏塊根中二苯乙烯苷含量在6 到10月逐漸升高,10月達到峰值,然后一直到12月都逐漸降低,本研究qRT-PCR 實驗所使用的樣品采收于11月,所得結果與同時期二苯乙烯苷的含量逐漸減少相呼應,可能由于盛花期由10月開始,隨后進入果熟期,此時營養生長已停止,糖基轉移酶基因的表達量也隨之降低。
由于糖苷類化學成分的重要性以及相關研究技術的發展,截止2020年11月,Carbohydrate Active enZymes(CAZy)數據庫中已分類有111 個糖基轉移酶家族(GT1~111)[16,24],其中GT1 為最大家族[24],可以催化萜類、生物堿類、黃酮類、苯丙素類以及木脂素類的糖基化[25]反應。一般通過分析GTs 對底物偏好的生化數據,使用系統發育樹可以很好地對新發現的GTs 的底物特異性進行預測[26-27]。不僅如此,隨著GT 酶結構的研究深入,還可以將已知的模板蛋白所能催化的受體底物,通過計算機模擬進行目標蛋白的底物預測[28]。經文獻報道[10-12],UGT85H2 是蒺藜苜蓿的一種重要的糖基轉移酶,是PmUGT1、PmUGT3 蛋白同源建模所用分子模板,能夠對鷹嘴豆芽素A 等化合物反應生成糖基化產物;同時,UGT74AC1 與PaGT3 分別對羅漢果醇與白藜蘆醇都具有糖基化作用,分別為PmUGT2、PmUGT4 蛋白同源建模所用分子模板。根據該結果,本實驗利用autodock4 軟件與PmUGTs的三維構象分子模板的反應底物分別進行模擬對接實驗,結果得出PmUGT1 與PmUGT3、PmUGT2、PmUGT4 上的殘基分別可以與鷹嘴豆芽素A、羅漢果醇以及白藜蘆醇以氫鍵連接發生互相作用,且所得Ki、ΔGbind指數均在合理范圍之內;且根據前文可知PmUGTs 均以UDP-葡萄糖作為糖基供體。由此可推測:PmUGT1 可催化鷹嘴豆芽素A 的5 位羥基,4’位甲氧基生成糖基,形成5,7-二羥基-4’-甲氧基異黃酮-5-O-β-D-葡萄糖苷與5,7-二羥基-4’-甲氧基異黃酮-4’-O-β-D-葡萄糖苷2 種產物;PmUGT3可催化鷹嘴豆芽素A 的5,7 位羥基生成糖基,形成5,7-二羥基-4’-甲氧基異黃酮-5-O-β-D-葡萄糖苷與5,7-二羥基-4’-甲氧基異黃酮-7-O-β-D-葡萄糖苷2種產物;而PmUGT2 可催化羅漢果醇的11、23、24位羥基生成糖基,形成羅漢果醇-11-O-β-D-葡萄糖苷、羅漢果苷IA1(CAS:88901-46-6)、羅漢果醇-23-O-β-D-葡萄糖苷;PmUGT4 則可催化白藜蘆醇3,5,4’位羥基生成糖基,形成虎杖苷(CAS:27208-80-6)、白藜蘆醇-5-O-β-D-葡萄糖苷與白藜蘆醇-4’-O-β-D-葡萄糖苷3 種產物。以上結果可為后續進一步對PmUGTs 功能機制的研究提供理論基礎。
利益沖突所有作者均聲明不存在利益沖突