陳川,凱迪日耶·玉蘇普,2*
(1.喀什大學生命與地理科學學院,新疆 喀什 844006;2.新疆帕米爾高原生物資源與生態重點實驗室,新疆 喀什 844006)
黃酮類化合物是一類廣泛存在于植物體內的次生代謝產物,研究表明黃酮類化合物參與光合作用、呼吸作用、生長發育以及植物對各種脅迫的防御等多種生理生化過程[1]。此外,黃酮類化合物具有多種藥理活性,在人類健康和飲食中也發揮著重要作用[2]。查爾酮異構酶(chalcone isomerase,CHI,EC5.5.1.6.)是類黃酮生物合成關鍵酶,催化查爾酮轉化為黃烷酮而形成不同類型的黃酮類化合物[3]。迄今為止,已經從許多不同的植物中克隆了許多CHI基因,包括大豆、玉米、小麥、苜蓿、花生、胡蘆巴、康乃馨和銀杏等[4-11]。
石榴是石榴科(Punicaceae)石榴屬(Punica L.)植物,是一種古老的果樹,原產于伊朗、阿富汗及印度西北部地區[12]。研究表明,石榴具有抗氧化、抗癌、抗炎等特點,可以有效預防和治療癌癥及其他慢性感染性疾病[13-14]。從石榴中已分離出的黃酮類化合物有黃酮、黃酮醇、花色素、黃烷-3-醇類等[15]。目前關于石榴黃酮類化合物的研究主要集中在黃酮類化合物的分離、純化以及藥理作用等研究方面,關于黃酮類化合物合成相關基因的研究較少,石榴CHI基因生物信息學方面的分析鮮有報道,對其生物學功能未深入了解[16-17]。鑒于此,本研究以石榴CHI基因為研究對象,利用生物信息學的方法,對其理化性質、跨膜區段預測、疏水作用力、信號肽預測、翻譯后修飾、亞細胞定位、蛋白質二級結構預測和三級結構預測等進行分析,為進一步研究石榴查爾酮異構酶基因提供一定的參考。
從美國國立生物技術信息中心(national center of biotechnology information,NCBI)數據庫中查詢已注冊的石榴CHI(KU058887)的核苷酸序列及氨基酸序列。
生物信息學分析工具如表1所示。
表1 生物信息學分析工具Table 1 Bioinformatic analysis tools
利用表1中工具分析了石榴CHI的理化性質、親水性/疏水性、信號肽、跨膜區、亞細胞定位、保守結構域、翻譯后修飾、二級結構預測以及三級結構預測。
使用Expasy提供的在線Protparam軟件對石榴CHI基因所編碼蛋白質的理化性質進行分析。結果表明,該基因全長1 075 bp,完整開放閱讀框為690 bp,可以編碼230個氨基酸。CHI原子總數為3 550,分子總質量為25 kDa,總分子式為C1127H1789N287O340。其中占比最高殘基為Glu(10.4%),占比最低殘基為Trp(0.9%)。正電荷殘基總數為28(Arg+Lys),負電荷殘基總數為30(Asp+Glu),理論等電點為5.71,推斷它為酸性蛋白質。不穩定系數結果分析表明,石榴CHI不穩定系數(44.60)數值較高,是一種不穩定蛋白質。親水性分析平均值結果分析表明,石榴CHI親水性平均值(-0.131)較低,并且脂肪系數(81.43)小于 100,推測為親水性蛋白。
氨基酸的極性對蛋白質折疊形成二級結構及以上的結構域和功能域有重要的影響。通過Protscale預測法分析對石榴CHI基因所編碼蛋白的親水性/疏水性,分析結果如圖1所示。
圖1 石榴CHI的親水性/疏水性分析(Kety and Doolittle算法)Fig.1 Hydrophlicity/hydrophobicity analysis of CHI in pomegranate(Kety and Doolittle algorithm)
從圖1得出波浪線的正值和負值來確定疏水和親水性,結果表明,CHI基因所編碼蛋白質在第56位氨基酸峰值最大,為1.733,表明該區域為高疏水性區域,而在第226位氨基酸峰值最小,為-2.133,表明該區域為高親水性區域,可以推測該蛋白為親水蛋白質,這與理化性質分析結果一致。
使用在線軟件TMHMM預測對石榴CHI基因所編碼蛋白質跨膜區預測分析??缒そY構域預測結果如圖2所示。
圖2 石榴CHI跨膜區預測(隱馬爾可夫模型)Fig.2 Transmembrane structure prediction of CHI in pomegranate(Hidden Markov models)
圖2中3種不同的顏色線分別代表不同的位置,結果顯示,該蛋白沒有跨膜區,即推測石榴CHI蛋白不屬于跨膜蛋白,代表著該蛋白在合成類黃酮化合物時以游離形式參與,為游離蛋白,這與親水性/疏水性分析結果一致。
信號肽指導蛋白質的跨膜轉移以保障產生的蛋白質準確定向運輸。使用SignalP4.0在線分析工具基于神經網絡算法對石榴CHI基因所編碼蛋白質進行信號肽預測分析,預測結果如圖3所示。
圖3 石榴CHI信號肽預測Fig.3 Signal peptide prediction of CHI in pomegranate
圖3中C值代表剪切位點的可能性,用桃紅色線表示可能性的大小。若該點屬于剪切位點,那么該處的C值明顯增高,紅色線較長。S值代表序列中氨基酸殘基是信號肽的概率,用綠色的先表示概率的大小,若綠色線越高,說明該部分的氨基酸殘基很可能就是信號肽。S值高說明此處是信號肽的一部分;S值低說明此處是成熟蛋白質的一部分。Y值是C值和S值結合派生出的值,用藍色線表示。剪切位點出現在S值最陡的坡和C值明顯增大的地方。結果顯示,石榴CHI蛋白沒有信號肽,這與跨膜區預測的結果一致。
亞細胞定位是蛋白質功能研究的重要內容,細胞中mRNA通過轉錄翻譯后形成蛋白質,然后被運送到特定的細胞器發揮作用,只有到達正確的部位才能參與細胞的各種生命活動,如果運輸錯誤很可能影響到細胞活動甚至可能殺傷細胞。PSORT和Cell-PLoc2.0共同對石榴CHI基因所編碼蛋白質進行亞細胞定位預測得出結果表明,在PSORT中石榴CHI蛋白存在于線粒體的概率為69.6%,存在于細胞核中概率為13%,存在于細胞質中可能性為8.7%,概率最低存在于液泡和過氧化物酶中,同為4.3%。而在Cell-PLoc2.0中真核生物蛋白質可能同時存在,或兩個以上的亞細胞位置之間移動。綜合兩種預測結果可以推測該蛋白質存在于線粒體中,在核糖體合成后進入線粒體,在線粒體中以游離態發揮作用。
利用CDD在線工具分析石榴CHI氨基酸序列的功能結構域,分析結果如圖4所示。
圖4 石榴CHI保守結構域預測Fig.4 Conserved domain prediction of CHI in pomegranate
不同基因可能有著相同的同源序列,擁有同源序列的基因有可能存在同樣的結構域、功能域,有可能有同樣的功能,這與基因超家族相同。保守結構域預測就是為了尋找是否存在與目的基因同源的超家族,找到即可推測其功能。結果表明,石榴CHI氨基酸序列在第10位~第229位存在Chalcone-3查爾酮超家族保守結構域。
利用NetPhos 3.1Sever對石榴CHI基因所編碼蛋白質進行磷酸化預測分析,結果如圖5所示。
圖5 石榴查爾酮異構酶磷酸化修飾預測Fig.5 Phosphorylation prediction of CHI in pomegranate
圖5中所標示的紅色(Threshold)代表閾值,其閾值設定為0.5,超過閾值的位點易被磷酸化,值越高磷酸化概率越大;結果顯示,CHI基因所編碼蛋白質共有27個磷酸化位點,其中絲氨酸位點有15個(6、32、85、115、128、156、163、165、167、173、192、198、206、218、225)、蘇氨酸位點 11 個(56、72、78、83、94、110、131、133、161、169、215)和酪氨酸 1 個(132)。
利用NetGlycate 1.0 Sever對石榴CHI基因所編碼蛋白質進行糖基化預測,結果如圖6所示。
圖6 石榴查爾酮異構酶糖基化修飾預測Fig.6 Glycosylation prediction of CHI in pomegranate
在圖6中,紅色橫線表示閾值,閾值設置為0.5,超過閾值的部分在此位置有被糖基化的可能。根據石榴CHI氨基酸序列糖基化的預測結果顯示,石榴CHI蛋白序列沒有被糖基化的位點。糖基化在調節蛋白質的空間結構、細胞質內和核內定位、基質內和跨膜轉運、在機制和質膜溶解性等都有非常重要意義。蛋白穩定性分析結果顯示該蛋白屬不穩定蛋白,而糖基化有增加蛋白穩定性的作用,石榴CHI蛋白沒有糖基化位點也從另一方面佐證了CHI蛋白不穩定這一結果。
蛋白質的二級結構指的是這個蛋白多肽鏈主鏈原子借助于氫鍵沿一維方向排列成具有周期性結構的構象。二級結構形成的構件主要有α-螺旋、β-折疊、β-轉角、無規卷曲、延伸鏈等。利用目前常用的Jpred 4和Sopma對石榴CHI基因所編碼蛋白質二級結構進行預測分析。石榴CHI的二級結構預測如圖7所示。
圖7 石榴CHI的二級結構預測Fig.7 Secondary structure prediction of CHI in pomegranate
由圖7可知,CHI蛋白質二級結構中,α-螺旋占41.3%,β-折疊占10%,無規則卷曲占26.96%,延伸鏈占21.74%。Jpred 4和Sopma的預測結果對比表明,兩種預測工具的預測結果基本一致。
2.10.1 石榴CHI的三級結構預測
蛋白質的三級結構是多肽鏈在二級結構或者超二級結構的基礎上,進一步盤曲折疊形成的特定空間結構,蛋白質的結構決定其功能,空間結構預測對蛋白質功能研究有重大意義。利用SWISS-MODEL同源建模法預測石榴CHI的三級結構,結果如圖8所示。
圖8 石榴CHI三級結構(SWISS-MODEL)Fig.8 Tertiairy structure of CHI in pomegranate(SWISSMODEL)
三級結構預測得到以PDB 4 doi.1.a為模板的預測模型,相似度為65.3%。全局模型質量評估得分為0.87,明顯高于其他預測模型。QMEAN得分為0.19,比其他模型更接近于0,明顯高于其他模型。
通過進一步預測模型的當地質量估計(local quality estimate),得分基本在0.6以上,說明符合模型的基本要求,結果如圖9所示。相似性散點分布圖分析結果如圖10所示。
圖9 石榴CHI當地質量估計Fig.9 Local quality estimate of CHI in pomegranate
圖10 石榴CHI相似性散點分布圖Fig.10 Similarity scattergram of the predicted model and the homologous protein
該模型以紅色五角星的值為判定標準,紅五角星的值小于1,表示該模型的結構穩定,是可靠的三級結構。據此可以推斷PDB 4 doi.1.a最可能為石榴CHI蛋白的最佳三級結構預測模型。而三級結構預測模型主要由α-螺旋、β-折疊、無規卷曲和延伸鏈組成,其中α-螺旋占比較多。三級結構預測結果與二級結構預測結果相符合。
2.10.2 模型質量評估
為了進一步驗證預測模型的準確性,進行模型質量評估。在Procheck評估中,結果如圖11所示。
圖11 預測模型拉曼圖Fig.11 Ramachandran plot of the predicted model
落在額外允許區域(圖中黃色區域)和最佳允許區域(紅色區域)的氨基酸殘基占整個蛋白質的比例高于90%,可以認為該模型的構象符合立體化學的規則。顏色越深的區域表明構象越合理。拉曼圖分析結果表明,石榴CHI蛋白的預測模型中有94.7%的氨基酸殘基(177個)位于紅色最佳區域,有4.8%的氨基酸殘基(9個)位于黃色額外允許區域內,這表明基本上大部分的氨基酸殘基都位于允許區域內,所以該模型的構象符合立體化學的規則。
在Verify 3D工具中,平均3 d~1 d分數≥0.2中有93.55%的氨基酸殘留,并且低質量部分不明顯,基本上都在標準線以上,這表明模型質量合格,結果如圖12所示。所以,結合以上觀點推斷石榴CHI的三級結構模型預測結果穩定可靠。
圖12 預測模型3D-1D得分散點圖Fig.12 3D-1D Score scattergram of the model
黃酮類化合物的生物合成首先通過苯丙烷途徑,苯丙氨酸轉化為香豆酰輔酶A、香豆酰輔酶A和丙二酰輔酶A在查爾酮合成酶的作用下合成查爾酮,查爾酮經過查爾酮異構酶(CHI)生成二氫黃酮類,二氫黃酮類是其他黃酮類化合物的前體物質,可通過不同反應途徑,生成其他的黃酮類化合物[18-20]。作為抗氧化化合物,黃酮類化合物在植物的生命活動中起著至關重要的作用,例如防紫外、抗病原體、植物著色、生長素轉運和花粉育性等[21-22]。黃酮類化合物對人類健康有益,包括預防心血管疾病,肥胖癥和糖尿病[23-24]。因此,植物類黃酮合成相關基因的研究引起廣泛關注。自1986年從豌豆中分離出第一個CHI基因以來,GenBank已登記了3 000多個CHI核苷酸序列[25]。石榴黃酮類化合物的生理活性,是近年來的研究熱點,黃酮類化合物的抗自由基、抗氧化作用越來越受到人們的重視,從石榴中已分離出的黃酮類化合物有黃酮、黃酮醇、花色素、黃烷-3-醇類等[26-27]。研究發現,石榴的果汁、果皮葉、樹皮都有發現黃酮類化合物[28]。
本研究以石榴CHI作為研究對象,對其進行生物信息學分析,結果表明:CHI基因全長1 075 bp,完整開放閱讀框為690 bp,可以編碼230個氨基酸,石榴CHI屬于親水不穩定蛋白,呈酸性,不具有信號肽,CHI不存在跨膜區域,亞細胞定位預測分析表明其最大可能定位在線粒體;有27個可能的磷酸化位點,無糖基化位點;二級結構預測結果表明,以α-螺旋和任意卷曲為主要結構,CHI氨基酸序列具有Chalcone 3查爾酮超家族保守結構域;同源建模法構建其三級結構模型,結果表明該模型與二級結構預測結果相符合,模型質量評估結果較好。本研究闡明了石榴CHI重要的分子特征,豐富了該蛋白的相關研究,為進一步研究其生物學功能提供了一定的理論基礎。