孫宇蛟,陳 欣,李 悅,徐慧瑩,董 源,王 左,康雨琦
(東北農業大學 生命科學學院,黑龍江 哈爾濱 150030)
甜葉菊是一種含糖量很高的作物,葉片中的甜菊醇糖苷(steviol glycosides,SGs)是一種天然的甜味劑,其甜度是蔗糖的300倍左右,但熱量只有蔗糖的1/3 000[1],因此,甜葉菊深受糖尿病、肥胖癥等相關疾病患者的關注。近些年來,甜葉菊被大規模運用到食品、醫藥等相關領域。它作為一種新型的食材和藥材,在國內外均廣受關注。有研究表明,作為甜菊醇糖苷生物合成途徑中的關鍵酶,尿嘧啶二磷酸-糖基轉移酶(UDP-glycosyltransferase,UGT)通常以甜菊醇為前體,合成不同的甜菊醇糖苷,對甜葉菊甜度和品質的提高有關鍵作用。
UGT基因種類多樣,在許多經濟和模式作物中均有研究。Brazier等人通過T-DNA插入手段,獲得了擬南芥T3代UGT72B1基因敲除株,發現ugt72b1植株(At4g01070)對3,4-二氯苯胺(3,4-dichloroaniline,DCA)和2,4,5-三氯苯酚(2,4,5-trichlorophenol,TCP)的結合能力顯著下降,證明了UGT基因在植物體內的脫毒作用[2];Jackon等人通過對擬南芥UGT84B1基因過表達植株的研究,發現其具生長激素缺陷的現象,推測該基因可能參與植物激素平衡[3];Chong等人通過抑制糖基轉移酶TOGT基因在煙草中的表達,發現在其植株中出現組織壞死、抗性降低等表型。推測該基因可能與植物防御相關[4]。
在世界范圍內,多數學者對甜葉菊糖苷轉運代謝、合成及其功能進行了研究,但在基因及蛋白質層面對甜葉菊尿嘧啶二磷酸-糖基轉移酶的研究卻不多。本研究依托于生物信息學分析,以甜葉菊3個UGT基因為研究對象,對其蛋白質進行了理化性質分析、初級及高級結構的預測、多序列比對分析,并與康乃馨、陸地棉等其他物種的UGT基因一同構建了分子進化樹,以期為甜葉菊作物UGT蛋白質研究及分子輔助育種提供參考及依據。
甜葉菊3個尿嘧啶二磷酸-糖基轉移酶基因UGT76G1(AY345974)、UGT85C2(AY345978)、UGT91D1(AY345980)及其他物種UDT基因均來源于NCBI(https://www.ncbi.nlm.nih.gov/)。
采用在線軟件ProtParam(http://web.expasy.org/protparam/)預測UGT蛋白序列的一級結構,通過ProtScale在線工具(http://web.expasy.org/protscale/)分析蛋白質的親疏水性,利用SOPMA在線軟件(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)預測UGT蛋白序列的二級結構,采用SWISS-MODEL軟件(http://www.swissmodel.expasy.org/)預測蛋白質的三級結構。
通過Clustal X2和DNAMAN進行多序列比對分析,采用MEGA 7.0軟件對所有蛋白質編碼序列進行分子進化樹的構建,采用鄰接法(Neighbor-jioning,NJ)建樹,其中,校正值(bootstrap)設置為1 000,其他均為默認值。
UGT76G1、UGT85C2、UGT91D1對應蛋白序列通過https://web.expasy.org/protparam/進行分子量、等電點、氨基酸數量、帶正負點的殘基總數、分子式、不穩定指數和脂肪酸指數預測,相關結果如表1所示。經分析,從表1中可以看出,等電點集中于6左右,氨基酸數量為520~550個不等,不穩定指數集中于45左右,脂肪族指數為100左右。

表1 UGT基因一級結構分析
通過https://web.expasy.org/protparam/預測所有蛋白質親疏水性(GRAVY)。UGT76G1、UGT85C2、UGT91D1對應的GRAVY值分別為-0.089,-0.077,-0.104,這初步說明3個蛋白質呈一定的親水性;通過http://web.expasy.org/protscale/網站,采用 Hphob./Kyte&Doolittle算法進一步進行親疏水性預測,圖1進一步認證了其均為親水性蛋白質。

圖1 UGT蛋白質親疏水性預測
利用SOPMA在線軟件(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)預測UGT蛋白序列的二級結構。經過分析,從表2和圖2中可以看出,各UGT蛋白含有35%~45%左右的α-螺旋及無規卷曲,含有15%左右的鏈延伸結構,較少的β-轉角。其中,UCT85C2、UCT76G1這2個蛋白除了含有較相近的β-轉角外,其余相似度高。

表2 UGT蛋白序列二級結構

圖2 UGT蛋白二級結構預測
通過SWISS-MODEL預測所得序列蛋白質高級結構,3條序列均通過同源建模獲得結構預測。從圖3中可以看出,3個UGT蛋白結構均有所差異,推測可能是基因在進化過程中內含子插入或丟失造成的。
將甜葉菊中3個UDT基因序列通過Clustal X2及DNAMAN進行多序列比對分析,序列的總體相似度為42.60%.從圖4中可以看出,完全一致的序列占較小部分,序列間總體相似度不高,由此推測其在進化過程中存在一定的差異。
將甜葉菊(Stevia rebaudian)、陸地棉(Gossypium hirsutum)、康乃馨(Dianthus caryophyllus)、棉豆(Phaseolus lunatus)和煙草(Nicotiana tabacum L.)中已報道的UGT基因通過MEGA 7.0軟件進行分子進化樹的構建。從圖5中可以看出,各分支自展值均大于80,說明建樹信息可靠。除此之外,對于同一物種,甜葉菊中的3個UGT基因進化關系比較遠;對于不同物種來說,甜葉菊AY345974基因與康乃馨BAD52007基因具有一定的親緣關系。總體可以看出,不同物種與同一物種間UGT基因均存在一定的進化關系。

圖3 UGT蛋白質高級結構預測

圖4 甜葉菊3個UGT基因序列比對

圖5 分子進化樹的構建
本研究通過生物信息學手段對甜葉菊3個UGT蛋白質進行了一級結構親疏水性分析,二級結構、高級結構的預測,多序列比對和系統進化樹的構建。在親疏水性方面,甜葉菊中UGT蛋白質均為可溶蛋白質,呈較強的親水性。
向麗等人用5’-RACE和 RT-PCR方法克隆了1條三七UDP-糖基轉移酶基因,該基因編碼495個氨基酸,蛋白分子量為55 kD,屬于不穩定蛋白。其二級結構中α-螺旋占36.16%,β-轉角占11.31%,無規卷曲占52.53%,這與本研究中甜葉菊3個UGT基因二級的預測較為相符[5]。除此之外,郭書巧等人在甜葉菊中分離出與本研究同源性很高的UGT76G2基因,研究發現其與玉米、康乃馨、水稻等5種均存在一定的進化關系,但進化地位相差較遠,與本研究的進化樹結果較為相符[6]。
UGT基因為多拷貝、多家族基因,家族中基因數目比較多,功能不盡相同。近年來,多種UGT基因被漸漸發掘,例如李微微等人在甜葉懸鉤子中克隆了18條UDP-糖基轉移酶基因,在大腸桿菌中進行了異源表達,并對克隆的基因進行了初步的序列分析,為進一步挖掘和驗證甜葉懸鉤子中UGT基因功能奠定了基礎[7]。隨著生命科學和微機科學的迅速發展,生物信息學作為一門獨立學科,在發掘新基因、研究生物大分子功能方面發揮著重要作用[8]。本研究依托生物信息學手段,在甜葉菊作物中鑒定3個UDP-糖基轉移酶基因,并對其進行蛋白質功能的初步研究,為甜葉菊UGT基因的發掘、提高作物經濟效益方面的研究提供了新的思路。
[1]Brandle,J.E.,P.G.Telmer.Steviol glycoside biosynthesis[J].Phytochemistry,2007,38(42):1855.
[2]Brazier-Hicks,M.,R.Edwards.Functional importance of the family 1 glucosyltransferase UGT72B1 in the metabolism of xenobiotics in Arabidopsis thaliana[J].Plant Journal,2005,42(4):556-566.
[3]RG Jackson,M Kowalczyk,Y Li,et al.Over-expression of an Arabidopsis gene encoding a glucosyltransferase of indole-3-acetic acid: phenotypic characterisation of transgenic lines[J].Plant Journal,2002,32(4):573-583.
[4]J Chong,R Baltz,C Schmitt,et al.Downregulation of a pathogen-responsive tobacco UDP-Glc:phenylpropanoid glucosyltransferase reduces scopoletin glucoside accumulation,enhances oxidative stress,and weakens virus resistance[J].Plant Cell,2002,14(5):1093-1107.
[5]向麗,郭溆,牛云云,等.三七PnUGT1基因的全長cDNA克隆和生物信息學分析[J].藥學學報,2012,47(08):1085-1091.
[6]郭書巧,楊郁文,倪萬潮.甜葉菊葡糖基轉移酶基因UGT76G2的克隆及生物信息學分析[J].基因組學與應用生物學,2009,28(03):422-428.
[7]李微微,孫雨偉,楊靖亞,等.甜葉懸鉤子(Rubus suavissimus S.Lee)中UDP-糖基轉移酶基因的克隆、表達及序列分析[J].工業微生物,2017,47(04):1-10.
[8]齊安智.計算機算法在生物信息學中的應用研究[J].中國新通信,2018,20(02):171.