黃瓊林,鄭偉穰,黃學山,吳民華
(廣東醫科大學,廣東 湛江 524023)
高良姜是傳統藥食兩用中藥材,為姜科多年生草本植物高良姜AlpiniaofficinarumHance的干燥根莖,具有散寒止痛、溫中止嘔的功效[1]。萜類是高良姜發揮藥效和產生芳香氣味的物質基礎之一。高良姜萜類成分復雜、種類繁多,包括單萜、倍半萜、二萜等多種化合物[2]。目前已從高良姜中分離出多種倍半萜成分[3-5],但高良姜倍半萜生物合成的分子研究還鮮有報道。開展高良姜倍半萜合成酶(sesquiterpene synthase,SES)的研究可為高良姜倍半萜生物合成的機制研究奠定基礎,以期能通過基于倍半萜生物合成的基因工程手段來提高高良姜品質,進而緩解高良姜面臨的資源逐年減少的困境[6-7]。
本研究在前期高良姜轉錄組分析[8]的基礎上,挖掘和鑒定SES的編碼基因,通過生物信息學分析基因及其編碼蛋白的序列特征和功能,并分析SES基因在高良姜不同組織中的表達差異,以期為利用基于SES基因的基因工程途徑調控高良姜倍半萜成分的生物合成與含量積累奠定基礎。
在轉錄組測序數據[8]基礎上,以錯誤值(Evalue)小于10為篩選條件,檢索注釋為“sesquiterpene synthase”、含有完整編碼區的非重復序列基因。此外,在轉錄組數據中搜索微管蛋白β-Tubulin的編碼基因,用于后續實時熒光定量PCR(qPCR)檢測的內參基因及其引物設計。
RNAprep Pure Plant Kit試劑盒、ddH2O,天根生化科技(北京)有限公司;GoScript Reverse Transcription System、GoTaq qPCR Master Mix試劑盒,美國普洛麥格生物技術有限公司;其他試劑均為化學純。
Stepone Plus熒光定量PCR儀,美國Applied Biosystem公司;TGL-16MS型離心機,上海盧湘儀離心機儀器公司;JS-power 300型核酸電泳儀、JS-8600B型凝膠成像分析儀,上海培清公司。
采用Omiga 2.0對高良姜SES基因序列進行編碼區檢索,并將其翻譯成編碼蛋白的氨基酸序列。利用Protparam和Protscale軟件分析編碼蛋白的基本理化特征。使用CD-search在線工具分析編碼蛋白的保守功能域,利用Target1.1和TMHMM在線軟件完成編碼蛋白的亞細胞定位分析。分別采用SOPMA、Swiss-prot在線軟件分析編碼蛋白的高級結構。運用ClustalX和MEGA軟件完成編碼蛋白的多重序列比對和系統發育分析。
采用qPCR檢測高良姜SES在不同組織樣品中的表達模式。參照說明書,使用RNA prep Pure Plant Kit分別提取高良姜根莖、莖和葉片總RNA,再用GoScript Reverse Transcription System反轉錄合成cDNA。
目的基因和內參基因用于qPCR的特異性引物如表1所示。參照GoTaq qPCR Master Mix試劑盒說明書,qPCR反應體系總體積為20 μL,其中2×qPCR Master Mix 10 μL,10 μmol/L上下游引物各0.3 μL,cDNA模板適量,并用滅菌蒸餾水補足體積。qPCR反應條件為:95℃預變性10 min;95℃變性15 s,60℃退火20 s,72℃延伸20 s,40個循環。采用2-ΔΔCt計算高良姜SES基因的相對表達量。

表1 高良姜SES基因qPCR分析所用的引物Table 1 Primers for qPCR analysis of SES gene in A.officinarum
經過在高良姜轉錄組數據中檢索,共獲得2條編碼SES基因及其cDNA序列。根據高良姜的拉丁學名及這些基因在轉錄組中的注釋,將它們分別命名為AoSES3和AoSES6。AoSES3和AoSES6的cDNA序列長度分別為1 818 bp和2 257 bp,各自含有1個長度為1 653bp和1 647 bp的開放閱讀框(open reading frame,ORF),分別編碼含有550和548個氨基酸的蛋白質。
編碼蛋白的理化和結構特征如表2所示。AoSES3和AoSES6的等電點均小于7,皆為酸性蛋白質。AoSES3的蛋白質不穩定指數大于40,屬于不穩定蛋白質,而AoSES6則為穩定性蛋白質。AoSES3和AoSES6的多肽鏈整體表現為親水性,為水溶性蛋白質。AoSES3和AoSES6均不含有跨膜結構域,也不具有信號肽、轉運肽和靶向肽等結構。AoSES3和AoSES6均含有倍半萜合成酶來家族典型的保守序列——天冬氨酸富集基序(DDXYD),推測其為高良姜倍半萜類合成酶蛋白。

表2 高良姜SES理化及結構特征Table 2 Physicochemical and structural characteristics of SES in A.officinarum
為了進一步明確高良姜SES的功能和分類,對其編碼蛋白質的保守功能域進行分析。如圖1所示,AoSES3和AoSES6均具有多個底物結合位點和天冬氨酸富集區域,包含有植物萜類環化酶和萜類合成酶等特異性功能域,歸屬類異戊二烯合成酶生物合成酶超級家族。因此,AoSES3和AoSES6均為高良姜萜類生物合成酶基因。

圖1 高良姜SES的保守功能域分析Figure 1 Conservative functional domain analysis of SES in A.officinarum
基于20種植物萜類合成酶構建的聚類樹如圖2所示,AoSES3和AoSES6與其他SES聚成一支,而其他萜類合成酶則聚成另外一支。SES分支又分為2個小分支,其中AoSES3和AoSES6與單子葉植物來源的SES聚集在一起,而雙子葉植物SES則聚集在一起,說明AoSES與單子葉植物SES有更高的同源性,與其來源植物的親緣關系相符。

圖2 20種植物萜類合成酶蛋白的聚類樹Figure 2 Cluster tree of 20 plant terpenoid synthase proteins
蛋白質二級結構預測結果如圖3所示,AoSES3和AoSES6均由α-螺旋,延伸鏈、β-轉角和隨意卷曲等4種元件構成,各元件的數量分別是379(68.91)和384(70.07%)、26(4.73%)和23(4.20%)、16(2.91%)和15(2.74%)、129(23.45%)和126(22.99%),表明兩者均為混合型結構的蛋白質,并且在元件組成及比例上較為相似。

圖3 高良姜SES的二級結構預測Figure 3 Secondary structure prediction of SES in A.officinarum
AoSES3和AoSES6的空間結構如圖4所示,它們的三級結構元件組成與二級結構預測較為一致,均以α-螺旋為主,隨意卷曲次之,其他兩種元件則較少。AoSES3和AoSES6的空間排列也較為相似,提示它們的序列具有較高的保守性。

圖4 高良姜SES的三級結構預測Figure 4 Prediction for tertiary structure of AoSES proteins
通過qPCR測定AoSES3、AoSES6在高良姜不同組織中的表達水平,結果如圖5所示,AoSES3和AoSES6在高良姜葉、莖和根莖中均有表達,但表達趨勢不盡相同。兩者在莖中的表達均為最低,AoSES3在葉中的表達最高,根莖則次之;而AoSES6在根莖中的表達顯著高于其他2個組織。

圖5 SES基因在高良姜不同組織中的表達差異Figure 5 Expression analysis of AoSESs in different tissues of A.officinarum
本研究從高良姜轉錄組測序數據中鑒定獲得萜類合成途徑下游關鍵酶萜類合成酶(terpene synthase,TPS)的家族成員——倍半萜合成酶的2條編碼基因AoSES3和AoSES6,它們分別編碼550和548個氨基酸。AoSES3和AoSES6包含有倍半萜合成酶家族典型的保守序列DDXXD,并含有植物萜類環化酶和萜類合成酶等特異性功能域。聚類分析結果也發現,AoSES3和AoSES6與其他植物來源的倍半萜合成酶聚集在一起,具有較高的同源性。前人研究[9-10]認為倍半萜合成酶沒有信號肽,定位于細胞質中,本研究對于AoSES3和AoSES6的分析也得到一致的結果。這些結果表明,AoSES3和AoSES6很可能具有植物倍半萜合成酶的功能。
組織表達特異性分析發現,AoSES3和AoSES6在高良姜的不同組織中均有表達,但表達豐度存在差異。AoSES3傾向在葉片中表達,而AoSES6則主要在根莖中表達,推測高良姜不同組織中的倍半萜生物合成可能是由不同倍半萜合成酶來實現的。
本研究通過轉錄組分析挖掘和鑒定出2條編碼SES的基因,分析了其編碼蛋白的序列特點和功能,生物信息學分析表明這些基因具有SES必需的功能域,并明確了這些基因在高良姜中的表達模式,為后續AoSES基因的功能鑒定和調控研究奠定了基礎。