







摘要:利用HMMER、Pfam與SMART等工具,從決明(Senna tora)等不同物種中篩選獲得26條PAL(苯丙氨酸解氨酶)序列,并對其進行生物信息學分析。結果表明,決明PAL基因家族的基本特征在單雙子葉植物分離之前就已形成,且6個PAL成員被分為3個亞類。決明PAL基因家族成員的二級結構主要由α-螺旋和無規則卷曲組成;含有較高的Ala、Ser和Leu殘基;存在16種不同的保守基序,其中motif12(含有催化關鍵序列Ala-Ser-Gly)在所有PAL成員中均出現;啟動子區含有較多的光反應、植物激素響應與逆境脅迫響應元件。進一步的GO、轉錄組與Pearson分析也強化了以上分析結果,即決明PAL基因家族成員多集中在葉、莖和花等易感受光的組織,參與抗旱與抗菌等生物學過程呈現多樣化的特點。以上分析結果將為決明PAL基因的后續功能研究及抗逆功能基因篩選提供理論基礎。
關鍵詞:決明(Senna tora);丙氨酸解氨酶(PAL);基因家族;生物信息學
中圖分類號:S567.219" " " " "文獻標識碼:A
文章編號:0439-8114(2023)06-0181-06
DOI:10.14088/j.cnki.issn0439-8114.2023.06.033 開放科學(資源服務)標識碼(OSID):
Genome wide analysis of the phenylalanine ammonia lyase (PAL) gene family
from Senna tora
ZHAO Yong-yang, CHEN Wei-jia, DING Jing-feng, AO Yi-heng, FENG Ao, ZHOU Jia-yu
(School of Life Science and Engineering, Southwest Jiaotong University, Chengdu" 610031, China)
Abstract: Using tools such as HMMER, Pfam, and SMART, 26 PAL (phenylalanine ammonia lyase) sequences were screened from different species such as Senna tora, and analyzed for bioinformatics. The results showed that the basic characteristics of the PAL gene family of Senna tora had been formed before the isolation of monocotyledonous and dicotyledonous plants, and the six PAL members were divided into three subclasses. The secondary structure of the members of the PAL gene family of Senna tora was mainly composed of α-helixes and irregular curls, containing higher Ala, Ser, and Leu residues; there were 16 different conservative motifs, among which motif12 (containing the catalytic key sequence Ala Ser Gly) appeared in all PAL members; the promoter region contained many elements for light response, plant hormone response, and stress response. Further GO, transcriptome, and Pearson analyses had also reinforced the above analysis results, indicating that members of the PAL gene family of Senna tora were mostly concentrated in light-sensitive tissues such as leaves, stems, and flowers, and participated in diverse biological processes such as drought resistance and antibacterial activities. The above analysis results would provide a theoretical basis for the subsequent functional study of the PAL gene of Senna tora and the screening of stress resistant functional genes.
Key words: Senna tora; alanine ammonia lyase (PAL); gene family; bioinformatics
苯丙烷代謝是植物次生代謝中的一條重要途徑,由其合成木質素、類黃酮與生物堿等次生物質,不僅參與植物的多種生理過程,還具有極高的經濟與藥用價值。例如,木質素作為植物細胞壁的重要組成成分,不僅能提高植物的結構剛性,還能承受由于蒸騰作用所導致的負壓。木質素廣泛參與植物對環境脅迫的響應過程,提高木質素的含量可以提高植物的抗倒伏、抗病性與抗逆性[1]。類黃酮與生物堿具有藥用活性,其中類黃酮具有良好的抗氧化、抗癌、抗炎癥以及抗菌作用[2];生物堿可以消炎抑菌,調節神經系統,調節心血管機能[3]。
苯丙氨酸解氨酶(Phenylalanine ammonia lyase, PAL)是植物苯丙烷類代謝途徑的關鍵酶,其基因長度為2 000~2 200 bp,編碼酶蛋白的氨基酸為680~730個[4]。分析歐芹(Petroselinum crispum (Mill.) Hill)與大麥(Hordeum vulgare L.)等PAL的晶體結構[5],發現它們的活性形式均為同源四聚體,每個亞基由3個結構域組成,其催化關鍵序列(Ala-Ser-Gly)位于MIO結構域。PAL具有多種功能,主要催化苯丙氨酸的非氧化脫氨形成反式肉桂酸(Trans-cinnamic acid),參與木質素、類黃酮等下游苯丙烷物質的合成[6]。過表達PAL的植物能獲得較高的生長發育速度與較強的抗逆性,而降低PAL 基因的表達會減少木質素的合成,減弱抗逆性,表明PAL基因與植物抗逆性存在正向關聯性[7]。近期研究還發現,PAL基因的表達模式較復雜,Cheng等[8]發現苦蕎PAL基因在花和種子中的轉錄水平均高于根、莖和葉片;然而,施圓圓等[4]發現異葉天南星的3個PAL轉錄本在根中表達量均最高,表明PAL基因在不同物種中存在組織表達差異,推測其原因可能為PAL基因的表達受到MYB等多種轉錄因子的調控[9]。
決明(Senna tora)為豆科(Fabaceae Lindl.)決明屬(Cassia L.)植物,屬于藥食同源的植物,在云南省、四川省等多個省份有豐富的野生資源。決明的種子(又稱為決明子)含有豐富的蒽醌、類黃酮等成分,在治療高血壓、高脂血癥、明目、便秘和白內障等病癥都有顯著療效[10]。決明也是常見園林栽培植物,其抗旱能力強于同屬植物望江南與傘葉決明[11]。然而,目前對決明的研究主要集中在藥用成分,對決明代謝與抗逆功能基因的研究較少。例如,Xiang等[12]發現決明Kunitz抑制劑對棉鈴蟲、菜青蟲等鱗翅目害蟲表現出較強的抗蟲活性。Deng等[13]對決明種子、根、莖等不同組織開展了3+2代轉錄組學研究,發現Hsp20家族成員在不同組織具有分布特異性。Kang等[14]首次報道了決明的全基因組信息,為后續分子層面的研究奠定了遺傳學基礎;克隆鑒定了類查爾酮合酶(Chalcone-like)基因,并發現該基因可能參與了決明蒽醌的合成。本研究基于決明基因組信息,確定PAL基因家族成員,對PAL基因表達產物的理化性質、保守基序進行生物信息學分析,構建決明PAL基因家族成員與其他植物的系統進化樹,并結合實驗室前期獲得的決明不同組織的3+2代轉錄組數據,分析決明PAL基因家族成員在不同組織的表達特征,以上研究成果將為進一步認識PAL基因在植物體內的功能提供理論依據。
1 材料與方法
1.1 決明PAL 基因家族成員的確認
在Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)數據庫中,初步檢索PAL基因 序列,獲得候選序列。在Pfam 數據庫中,選取基因號為KAF7818627.1的PAL基因序列,以其特征結構域的HMM文件作為query[15],利用基于隱馬爾可夫模型的HMMER 檢索PAL 基因組。根據分子質量進行序列剔除,最終獲得決明的6個PAL基因家族成員。
1.2 決明PAL基因的理化性質分析
使用ProtParam在線工具(https://web.expasy.org/protparam/)對6 個決明PAL基因的氨基酸組成和理化性質進行分析;再利用SOPMA在線工具(https://npsa-prabi.ibcp.fr/)分析其結構特征。
1.3 PAL基因的系統發育學分析
選取其他物種的PAL基因,利用MEGA 7.0 軟件進行多序列比對,再采用鄰接法(Neighbor-Joining method)[16]構建系統發育樹,參數為:Method:Poisson,Gaps:Pairwise Deletion,Test of inferred phylogeny:Bootstrap,Replications:1 000,其余參數默認。
1.4 PAL蛋白序列的基序分析
利用MEME在線工具(http://meme-suite.org/tools/meme),分析決明PAL蛋白序列中的保守性基序,基序數量上限設為20,其余參數默認。
1.5 基因順勢結構元件分析
利用TBtools工具,提取決明6條PAL基因起始密碼子上游1 500 bp的序列,并將其作為啟動子序列,利用PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcarehtml)分析啟動子中的順式作用元件。
1.6 基因表達量分析
Deng等[13]前期研究已獲得轉錄組數據。利用MolPure? Plant RNA Kit 植物RNA提取試劑盒提取決明種子、根、莖、葉、花5種植物樣本,并對RNA 的濃度、純度及完整性進行檢測,達到要求后進行文庫構建。庫檢合格后,用單分子測序(SMRT)與Illumina平臺進行3+2代測序,以FPKM(每千個堿基的轉錄每百萬映射讀取的fragments)為衡量基因表達水平的指標。使用TBtools提取PAL基因注釋信息,利用eggNOG-mapper(http://eggnog-mapper.embl.de)完成GO富集分析,并繪制差異表達基因 GO 注釋與功能分類圖。
2 結果與分析
2.1 決明PAL基因家族成員的確定
采用Megablast工具,分別以AT3G53260.1、AWW24969.1與BAM63315.2基因的特征結構域為檢索序列,以決明基因組為模板,同源檢索得到候選序列,隨后通過HMMER、SMART 和 Pfam工具進行驗證,最終獲得6個PAL基因家族成員(表1)。
2.2 決明 PAL的理化性質分析
利用ProtParam在線分析工具對6個決明PAL的氨基酸序列進行分析。由圖1可知,決明PAL基因編碼的蛋白質約由700個氨基酸組成,分子質量約為77 ku。Ala、Glu、Gly、Leu、Ser和Val 6種氨基酸的含量最豐富,占比約50.00%,其中,含量最高的3種氨基酸分別為Leu、Ala和Ser,平均占比分別為10.75%、8.70%和7.87%。
利用SOPMA在線網站分析二級結構(表2),結果表明,各PAL成員的二級結構組成占比相似,均由α-螺旋、β-折疊、無規卷曲和延伸鏈組成。其中,α-螺旋與無規卷曲是二級結構的主要組成部分,占比分別為53.83%~59.32%、27.88%~32.51%。
2.3 植物 PAL基因系統發育分析
為了評估決明PAL成員的進化關系,利用鄰接法獲得系統進化樹(圖2),該進化樹中Bootstrap值超過70的節點達65.6%,超過90的節點達46.9%,表明該系統進化樹的可信度較高。系統進化樹結果表明,PAL氨基酸序列嚴格按照種屬關系分為2簇(Bootstrap的值均為100),第1簇由被子植物組成,包含雙子葉植物與單子葉植物;第2簇由裸子植物(穗烏毛蕨、問荊)與苔蘚植物(溪苔)2種蕨類植物組成。形成第2簇的可能原因是,相較于穗烏毛蕨,問荊是蕨類植物中較原始的種類,與苔蘚植物有更近的親緣關系。第1簇雙子葉植物亞簇中包括豆科植物、擬南芥。決明的6個PAL成員被分為3個亞組,第1亞組由KAF7804446.1、KAF7801471.1和KAF7818627.1組成;第2亞組由KAF7820144.1組成,第3亞組有2個成員(KAF7827046.1與KAF7805612.1),推測現有PAL成員起源于3個PAL祖先基因,通過復制形成。KAF7820144.1與XP 028773595.1 PAL Prosopis alba互為直系同源基因,KAF7805612.1與XP 028808004.1 PAL Prosopis_alba互為直系同源基因,表明決明與角豆的親緣關系最近,這與它們均屬于云實亞科植物相吻合。
2.4 PAL家族成員保守基序分析
通過 MEME 在線工具對6 個決明PAL成員進行保守性基序的預測,鑒定出16個不同的保守基序(圖3),motif12出現頻率為 100%,表示motif12在所有的決明PAL基因中均出現(圖3a)。字母的相對大小表示它們在序列中出現的頻率。每個字母的高度與該位置相應堿基的出現頻率成正比。Motif12含有PAL催化所需的關鍵序列Ala-Ser-Gly (圖3b),該三肽序列經環化和脫水后形成4-methylidene-imidazole-5-one(MIO)。MIO作為親電基團,與苯丙氨酸的芳香環發生相互作用,并最終導致苯丙氨酸脫氨形成反式肉桂酸。
2.5 決明PAL家族成員基因啟動子分析
將決明中PAL家族成員基因起始密碼子上游" "1 500 bp作為啟動子序列,利用PlantCare分析順式作用元件。由圖4可知,6條序列均含有光響應元件(Light)。除KAF7827046.1外,其余5個成員均存在脫落酸響應元件(Abscisic acid)。KAF7801471.1、KAF7804446.1和KAF7827046.1的啟動子中還存在赤霉素響應元件(Gibberellin)。KAF7804446.1和KAF7820144.1可能同時響應水楊酸(Salicylic acid)與茉莉酸甲酯(MeJA)。并且KAF7820144.1、KAF7801471.1和KAF7818627.1含有干旱響應元件(Drought),可能參與干旱響應。KAF7804446.1、KAF7805612.1和KAF7827046.1的啟動子區存在無氧響應元件(Anaerobic)。結果表明,6個決明PAL成員擁有多樣性的生物學功能,可能參與決明生長發育、激素應答和環境脅迫響應等過程。
2.6 決明PAL基因表達分析
在前期研究中,已獲得決明種子、根、莖、葉與花等不同組織的“3+2”全長轉錄組數據[13]。6個PAL基因家族成員分別在決明不同組織的FPKM見表3。不同PAL成員在決明不同組織中的表達差異較明顯,KAF7804446.1在根、莖中的表達量最高,FPKM分別為209.773、382.133;KAF7827046.1在葉中的表達量最高,FPKM為98.243;KAF7820144.1是花中表達量最高的成員(90.677);而在種子中,KAF7805612.1的表達量最高(8.083)。不同成員的表達呈組織特異性的趨勢,KAF7827046.1和KAF7818627.1在葉中的表達量明顯高于其他組織;KAF7820144.1、KAF7805612.1和KAF7801471.1在花中的表達量明顯高于其他組織。
進一步對6個PAL成員進行GO(Gene ontology)分析和功能分類(圖5)。發現只有KAF7805612.1不參與任何生物學過程,其余5個PAL成員可能均具有PAL活性,參與了響應放線菌酮、殺真菌劑及對赤霉素等生物學過程。
3 小結與討論
本研究利用隱馬爾可夫模型,依托NCBI數據庫中決明的全基因組信息,篩選獲得6個決明PAL基因家族成員。它們的分子質量為76.51~79.72 ku,與歐芹[5]、大麥[6]與異葉天南星等植物PAL的分子質量大小吻合[4]。Leu、Ala和Ser 3種氨基酸的含量最豐富,其中Ala、Ser是α-螺旋中常見的氨基酸殘基。α-螺旋和無規則卷曲是構成PAL二級結構的主要組成,該結果與大麥等植物PAL的氨基酸組成與二級結構特性[7]基本相同,表明PAL的氨基酸組成與二級結構特性相吻合。同時,以上數據表明,不同植物來源的PAL具有較高的二級結構相似性,推測盡管不同植物來源的PAL在一級結構上有一定的差異,但它們具有高度相似的二級結構單元,導致它們可能行使相近的功能。
系統進化樹結果顯示,雙子葉植物與單子葉植物的PAL形成被子植物簇,并與蕨類植物、裸子植物的遺傳距離較遠。PAL基因的進化與植物進化過程基本一致,進一步證明PAL基因在植物的進化過程中具有較高的保守性,與Huang等[9]的報道相似。決明PAL成員由3個亞組組成,處于亞組內部的成員(KAF7827046.1與KAF7805612.1)具有較近的遺傳距離,推測它們在功能上也有相似性。不同亞組間的遺傳距離較遠,推測各亞組的形成發生在決明與角豆物種分化前,隨后,經過復制與物種內分化形成6個PAL成員。
通過MEME 在線工具鑒定出決明PAL基因家族有16 條不同的保守基序,其中motif12出現頻率最高。Motif12中出現一段PAL基因家族成員的特征性保守序列,該結果與Mahesh等[17]的結果一致。該特征性序列中含有一個與催化作用相關的關鍵三肽,即Ala-Ser-Gly,可見在PAL基因家族中Ala與Ser具有較高的保守性。觀察大麥SbPAL1的結構,發現該三肽形成的MIO與Gln475、Asn247及鄰近亞基的Tyr338形成氫鍵,穩定其空間位置[18]。MIO中的次甲基作為親電基團,與苯環上的鄰位碳原子發生Friedel-Crafts反應,促進苯丙氨酸的非氧化脫氨[5]。本研究發現,該保守序列同樣出現在MIO結構域,位于第7個α-螺旋與第8個α-螺旋間(部分位于第8個α-螺旋),正好位于底物口袋中,推測可能具有結合并催化苯丙氨酸的作用。相關位點也可能成為PAL改造的重要候選位點,在后期的分子育種中可對它們加以利用。
PAL作為植物木質素、類黃酮等物質合成途徑的關鍵酶之一,在植物不同組織中的表達模式受到研究人員的廣泛關注。決明PAL成員在不同組織中的表達量有明顯差異,KAF7804446.1的總體表達量最高,KAF7805612.1的總體表達量最低;KAF7805612.1僅在種子時期表達量最高,但FPKM仍然較低,說明PAL在種子時期幾乎不表達。決明PAL成員主要集中的葉、花、莖等易感受光的組織,這與順式作用元件分析結果一致,也與齊學會等[19]的結果相近。決明PAL的啟動子區不僅含有較多的光反應元件,還含有較多的植物激素響應元件、逆境脅迫響應元件和生長發育相關的元件,表明了決明PAL可能參與生長發育和抗逆防御等生理過程,與PAL參與紫外線、干旱與受傷時的表達模式[11,16,20,21]變化一致。進一步的GO分析發現,PAL參與了響應放線菌酮及赤霉素等生物過程,部分結果也強化了順式元件的分析結果。只有KAF7805612.1不參與任何生物學過程,其余成員有相似的生物學功能,幾乎參與所有生物學過程,推測KAF7805612.1為假基因,這與其表達量最低的結果吻合。
本研究結果可以為將來深入開展決明PAL基因功能提供理論基礎,可能提高植物對生物及非生物脅迫的抗性,對提高糧食作物產量具有重要意義。
參考文獻:
[1] FUKUSHIMA R S, HATFIELD R D. Extraction and isolation of lignin for utilization as a standard to determine lignin concentration using the acetyl bromide spectrophotometric method[J]. Journal of agricultural and food chemistry,2001,49(7):3133-3139.
[2] 都宏霞,劉宴秀,嚴忠杰,等. 超聲波輔助-綠色低共熔溶劑提取茉莉花黃酮的工藝優化[J]. 現代食品科技,2021,37(1):199-206.
[3] 拉巴次旦,紀 鵬,趙年壽,等. 苦參堿類生物堿提取工藝優化及純化方法[J]. 動物醫學進展,2021,42(3):119-122.
[4] 施圓圓,張聲祥,趙德蕊,等. 異葉天南星苯丙氨酸解氨酶基因的克隆與蛋白結構分析[J]. 植物科學學報,2019,37(2):221-229.
[5] 郝向陽,孫雪麗,王天池,等. 植物PAL基因及其編碼蛋白的特征與功能研究進展[J]. 熱帶作物學報,2018,39(7):1452-1461.
[6] 張曉瑛,劉寶玲,郝青婷,等. 高粱苯丙氨酸解氨酶(SbPAL)編碼蛋白的生物信息學分析[J]. 山西農業科學,2016,44(11):1584-1588.
[7] HUANG J, GU M, LAI Z, et al. Functional analysis of the Arabidopsis PAL gene family in plant growth, development, and response to environmental stress[J]. Plant physiology,2010, 153(4):1526-1538.
[8] CHENG L L, YUE C B, CHEN H, et al. Cloning, characterization and functional analysis of a phenylalanine ammonia-lyase gene (FtPAL) from fagopyrum tataricum gaertn[J]. Plant molecular biology reporter, 2012, 30(5):1172-1182.
[9] HUANG Y J, WU Q, WANG S, et al. FtMYB8 from Tartary buckwheat inhibits both anthocyanin/Proanthocyanidin accumulation and marginal Trichome initiation[J].BMC plant biology,2019,19(1). DOI:10.1186/s12870-019-1876-x.
[10] VADIVEL V, JANARDHANAN K. Agrobotanical traits and chemical composition of Cassia obtusifolia L.: A lesser-known legume of the Western Ghats region of South India[J]. Plant foods for human nutrition,2002,57(2):151-164.
[11] 陳蘭蘭,郭圣茂,廖興國,等. 3種決明屬種子萌發對干旱脅迫的響應及其抗旱性評價[J]. 江西農業大學學報,2014(5):971-976.
[12] XIANG M,ZHANG X,DENG Y, et al. Comparative transcriptome analysis provides insights of antinsect molecular mechanism of Cassia obtusifolia trypsin inhibitor against Pieris rapae[J]. Archives of insect biochemistry and physiology, 2018,97(1).DOI:10.1002/arch.21427.
[13] DENG Y, HUI Z, YAN Z, et al. Full-length transcriptome survey and expression analysis of Cassia obtusifolia to discover putative genes related to aurantio-obtusin biosynthesis, seed formation and development, and stress response[J].International journal of molecular sciences,2018,19(9). DOI:10.3390/ijms19092476.
[14] KANG S H,PANDEY R P,LEE C M, et al. Genome-enabled discovery of anthraquinone biosynthesis in Senna tora[J]. Nature communications,2020,11(1). DOI:10.1038/s41467-020-19681-1.
[15] 陳安琪,宋思敏,鄧楷煜,等.擬南芥COMT基因家族的全基因組分析[J].分子植物育種,2021(3):26-29.
[16] 孫 建,顏小文,樂美旺,等. 芝麻不同抗旱基因型對花期干旱脅迫的生理響應機理[J]. 中國農業科學,2019,52(7):1215-1226.
[17] MAHESH V, RAKOTOMALALA J J, LéNAG L G, et al. Isolation and genetic mapping of a coffea canephora phenylalanine ammonia-lyase gene (CcPAL1) and its involvement in the accumulation of caffeoyl quinic acids[J]. Plant cell reports, 2006, 25(9):986-992.
[18] JUN S,SATTLER S A,CORTEZ G S,et al. Biochemical and structural analysis of substrate specificity of a phenylalanine ammonia-lyase[J]. Plant physiol, 2018, 176(2): 1452-1468.
[19] 齊學會,張曉燕,魯燕舞,等. 光質和光周期對大豆芽苗菜生長及總酚類物質含量的影響[J]. 中國蔬菜,2014(7):29-34.
[20] 樊 勝,張曉曉,周會玲,等. 紫外線照射對采后蘋果抗灰霉病作用的研究[J]. 西北農林科技大學學報(自然科學版),2016,44(2):172-178.
[21] 李雨哲,邢淋雪,劉夢潔,等. 棉花苯丙氨酸解氨酶基因家族的生物信息學分析[J]. 棉花學報,2021,33(1):66-74.
收稿日期:2022-02-09
基金項目:國家自然科學基金青年科學基金項目(31500276);四川省中醫藥管理局項目(2021MS116);中央高校基本科研業務費醫工結合項目(2682021ZTPY017);國家級大學生創新創業訓練計劃資助項目(202110613083);西南交通大學個性化實驗項目(GX20211600310001)
作者簡介:趙詠洋(2001-),女,天津人,在讀本科生,專業方向為生物工程,(電話)15922009066(電子信箱)1423963396@qq.com;通信作者,周嘉裕(1976-),女,四川宜賓人,副教授,博士,主要從事植物分子生物學研究,(電話)1550204560(電子信箱)spinezhou@home.swjtu.edu.cn。