趙 展
(開封大學,河南 開封 475004)
煙酰胺(Nicotianamine,NA)是一種非蛋白質性氨基酸,最早在煙草中發現[1],到目前為止,已被發現存在于所有高等植物中。NA是一種金屬螯合劑,對植物體內金屬(鐵、鋅、錳、銅)螯合和轉運起重要作用[2]。煙酰胺合成酶(Nicotianamine synthase,NAS)是植物體內NA合成過程中一種重要的酶,參與植物體內多種調控機制,對植物的生長發育有重要調節作用,能夠將3個s-腺苷蛋氨酸分子轉化成NA[3]。大量研究表明,NAS基因的過表達不僅能夠增強植物體內NA的含量,而且能夠增加鐵、鋅等金屬離子的含量,目前該結論已在大豆、水稻、玉米等多個作物中被證實,如,在CaMV35S啟動子的控制下,hvnas1過表達會引起轉基因大豆籽粒中NA濃度是未轉基因大豆的4倍,而Fe和Zn濃度分別是NT植株的2倍和1.45倍[4]。NAS基因參與植物體內多種作用機制,對植物的生長發育有重要的調控作用。如,Zhu等[5]在hap5a突變體中發現AtNAS1基因顯著下調表達,但與Fe的狀態不相關,進一步酵母單雜交和ChIP分析表明,HAP5A直接結合到NAS1的啟動子區域,且在缺鐵條件下,過表達NAS1可以挽救hap5a的褪綠表型。
據報道,目前關于NAS基因家族已經在玉米、小麥、花生等多個物種中進行了全基因組鑒定和生物信息學分析。Zhou等[2]在玉米的基因組中共鑒定出9個NAS基因家族成員,并測定了其在不同器官(包括發育中的種子)中的表達模式,根據ZmNAS基因的進化關系和組織特異性表達譜,將其分成了2類,并推測2類ZmNAS基因可能在轉錄水平上受到不同鐵攝取、轉運和穩態需求的調控。Bonneau等[6]在小麥的基因組中鑒定出21個NAS基因,并對TaNAS基因在種子萌發、幼苗生長、生殖發育過程、缺鐵響應的表達模式和蛋白質序列進行了詳細研究,研究結果增加了人們對禾本科植物NAS基因家族的認識,以及對面包小麥鐵營養遺傳學基礎的理解。羅艷芳等[7]在對花生NAS基因家族進行了全基因組鑒定和生物信息學分析,共鑒定出6個AhNAS基因,并通過對AhNAS基因家族進化關系、基因結構、保守結構域、亞細胞定位、順式作用元件、表達模式及花生響應缺鐵和鎘脅迫中的作用等進行分析,指出AhNAS2.1和AhNAS2.2主要參與黃色條紋樣蛋白3(YSL3)介導的鐵的木質部運輸,而AhNAS1.2、AhNAS3.1和AhNAS3.2可能參與花生對鎘的解毒機制,為揭示NAS在花生(Arachis hypogaea)鐵穩態調控中的生理功能奠定基礎。
西瓜是世界十大水果之一,隨著西瓜基因組的測序完成,西瓜的基因組學研究也越來越深入,但是目前關于西瓜NAS基因家族的全基因組鑒定和分析研究尚不深入。本研究以西瓜NAS基因家族為研究對象,利用HMMER、MEGA、TBtools等工具對西瓜NAS基因家族進行了全基因組鑒定與生物信息學分析,其中包括西瓜NAS基因家族的染色體定位、蛋白保守基序、系統進化樹、啟動子順式作用元件和共線性等,該研究能夠為進一步探討西瓜NAS基因的功能和分子機制提供重要的理論依據。
西瓜基因組數據集來源于葫蘆科基因組CuGenDB數據庫(Cucurbit Genomics Database(CuGenDB))。利用InterPro數據庫(https://www.ebi.ac.uk/interpro/)查找并下載NAS基因的特征結構域文件PF03059。在Linux系統中利用HMMER的hmmbuild功能構建NAS蛋白結構域的隱馬可夫模型,并利用hmmsearch掃描西瓜蛋白數據集。獲得的NAS家族成員分別通過SMART蛋白數據庫(SMART:Main page(embl-heidelberg.de))和NCBI-CDD(Home -Conserved Domains-NCBI(nih.gov))網站進行確認,在2個數據庫中均包含NAS家族成員作為候選,并對候選NAS家族成員進行命名。利用DNAMAN軟件對候選NAS家族成員的蛋白質分子量大小、等電點、氨基酸數量等指標進行分析。對已獲取的候選NAS家族成員的位置信息利用MG2C_v2.1在線軟件(http://mg2c.iask.in/mg2c_v2.1/)進行染色體定位。
利用SOPMA網站(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對西瓜NAS家族編碼蛋白質的二級結構進行預測;利用PDB數據庫(https://www.rcsb.org/)中的PSI-BLAST篩選模板,利用SWISS MODLE網站(https://swissmodel.expasy.org/),以PDB數據庫中篩選的模板對西瓜NAS家族編碼的蛋白質進行三級結構預測。
對西瓜NAS家族蛋白的保守基序利用MEME 5.5.0在線工具(https://meme-suite.org/meme/tools/meme)進行分析,最大檢索保守基序數量設為10,其他參數默認。利用MEGA7.0對候選NAS家族成員間的進化關系進行分析,并采用TBtools對候選NAS家族成員的保守基序和基因結構進行可視化。
從EnsemblPlants數據庫(http://plants.ensembl. org/Arabidopsis_thaliana/Info/Index)分別下載擬南芥、水稻、番茄和甜瓜4個物種的NAS基因的蛋白序列,利用MEGA 7.0內置的ClustalW,采用鄰接法(Neighbor Joining,NJ),對已獲得的擬南芥、水稻、番茄、甜瓜、西瓜的NAS蛋白序列進行多序列比對,將自展法系數(Booststrap)設置為1000次重復,其他參數采用默認值,進行系統進化樹的構建,并利用ITOL軟件(https://itol.embl.de/)進行展示。
利用TBtools軟件提取西瓜候選NAS家族成員基因轉錄起始位點上游2000bp的序列。利用PlantCARE對已獲得的西瓜NAS家族成員基因啟動子區的順式作用元件進行預測分析,并通過TBtools對預測的結果進行可視化。
利用TBtools軟件對西瓜基因組內的ClaNAS基因進行物種內的共線性分析以及西瓜與擬南芥、番茄基因組間的NAS基因進行共線性分析。
通過InterPro工具搜索,HMMER構建和查找,SMART和NCBI-CDD確認,共鑒定出4個西瓜NAS家族成員,分別命名為ClaNAS1~ClaNAS4,見表1。利用DNAMAN軟件分析發現,4個西瓜NAS家族成員編碼氨基酸序列長度從277aa到356aa,平均長度311aa;分子量變化范圍從30.68kDa到39.88kDa,平均34.55kDa;理論等電點PI從4.71到7.46,其中ClaNAS1的等電點最小為4.71,該結果說明西瓜NAS家族成員編碼的蛋白質含有較多酸性氨基酸。染色體定位結果顯示,ClaNAS家族成員主要分布于第2號染色體、3號染色體、6號染色體上,其中2號染色體上有2個ClaNAS基因家族成員,分別是ClaNAS1和ClaNAS3,且2個基因在染色體上的位置很近;3號染色體和6號染色體上的西瓜ClaNAS家族成員分別是ClaNAS2和ClaNAS4。

表1 西瓜NAS基因家族成員信息

表2 西瓜NAS基因家族編碼蛋白的二級結構分析預測
為了了解西瓜ClaNAS基因家族編碼蛋白的二級結構,利用SOPMA進行分析預測,結果表明,4個西瓜ClaNASs家族成員編碼蛋白質的二級結構主要由α-螺旋、延伸鏈、β-轉角、無規則卷曲組成,均不含有β-折疊;ClaNAS1~ClaNAS4 4個成員中,與其他二級結構相比,α-螺旋的數量均最多,β-轉角數量均最少;與ClaNAS1、ClaNAS3和ClaNAS4相比,ClaNAS2的延伸鏈數量最多為55;對于無規則卷曲,ClaNAS1和ClaNAS2的數量分別為112和119,而ClaNAS3和ClaNAS4的數量分別為72和86。

圖1 西瓜NAS基因家族成員在染色體上的分布
為了進一步了解西瓜ClaNAS基因家族編碼蛋白的三級結構,利用SWISS-MODEL,以PDB中3fpf.1.A為模板,進行分析預測并構建模型。結果表明,ClaNAS1和ClaNAS3編碼的蛋白質三級結構相似度較高,具有較復雜的三級結構;而ClaNAS2、ClaNAS4與ClaNAS1和ClaNAS3編碼的蛋白質整體相似度差異較大,可能與ClaNAS2和ClaNAS4 2個成員的二級結構中含有的延伸鏈、β-轉角、無規則卷曲數量差異較大有關。
為了探究西瓜ClaNAS家族的進化關系、蛋白保守基序與基因結構,分別利用MEGA7.0、MEME、TBtools進行分析,見圖2。結果表明,西瓜4個ClaNAS家族成員主要分為I、II、III 3個亞家族,其中ClaNAS1和ClaNAS3為I類,成員ClaNAS2屬于II類,ClaNAS4屬于III類;蛋白保守基序結果顯示,4個ClaNAS家族成員中ClaNAS1和ClaNAS2均含有從Motif1到Motif10共10個Motif,而ClaNAS3和ClaNAS4均含有7個Motif,從Motif1到Motif7;基因結構分析結果顯示,4個ClaNAS家族成員的外顯子數均只有1和2,其中ClaNAS1和ClaNAS2均含有2個外顯子,且具有相同的外顯子-內含子排列方式,而ClaNAS3和ClaNAS4的外顯子數均為1,說明ClaNASs家族成員的基因結構整體比較簡單。

圖2 西瓜NAS基因家族蛋白的二級結構預測
為了理解ClaNASs的功能和進化關系,利用MEGA7.0及其內置的ClustalW對5個擬南芥AtNASs,3個水稻OsNASs,4個甜瓜SlNASs,1個番茄SlNASs和4個西瓜ClaNASs的蛋白質序列進行多序列比對,見圖3,并構建擬南芥、水稻、甜瓜、番茄和西瓜5個物種中NAS基因家族的系統進化樹。結果表明,5個物種的NAS基因家族可分成3個亞家族,分別為I、II和III,其中I和II亞族均不含西瓜ClaNASs成員,而在III亞族中均是葫蘆科植物,能夠找到4個西瓜ClaNASs成員,分別是ClaNAS1~ClaNAS4,說明葫蘆科植物與其他植物的差異較大。

圖3 西瓜NAS基因家族蛋白的三級結構預測
為了探究西瓜ClaNASs家族啟動子中可能的順式作用元件及其作用,利用TBtools軟件獲取西瓜ClaNASs家族轉錄起始位點上游2000bp的序列,并進行順式作用元件分析,見圖4,結果表明,西瓜ClaNASs啟動子區含有激素應答、光響應、脅迫應答、轉錄因子結合位點等多種順式作用元件,其中ClaNAS1~ClaNAS4中均含有光響應和脫落酸應答相關的響應元件;除了ClaNAS4,ClaNAS1~ClaNAS3還均含有水楊酸應答元件;ClaNAS1和ClaNAS3的啟動子區均含有赤霉素應答元件,而ClaNAS2和ClaNAS4中均含有生長素應答元件;對于低溫脅迫應答元件,僅在ClaNAS1和ClaNAS4中含有;此外,MYB轉錄因子相關序列均集中在ClaNAS1、ClaNAS3和ClaNAS4中,說明西瓜ClaNASs基因家族可能對激素、脅迫等多種信號有響應。

圖4 西瓜NAS基因家族編碼蛋白的保守基序和基因結構析

圖5 西瓜、擬南芥、水稻和番茄的NAS基因家族進化樹分析

圖6 西瓜NAS基因家族啟動子區順式作用元件分析
利用TBtools對西瓜基因組內以及西瓜與擬南芥、番茄基因組間的NAS基因進行共線性分析,見圖7、圖8,結果表明,在西瓜基因組內NAS基因沒有發現串聯重復和片段復制,見圖7;在西瓜與擬南芥基因組間共鑒定出2個ClaNAS基因與擬南芥存在共線性關系,分別是ClaNAS1與AT1G09240.1、ClaNAS1與AT1G56430.1、ClaNAS2與AT1G09240.1、ClaNAS2與AT1G56430.1;在西瓜與番茄基因組間同樣鑒定出2個ClaNAS基因與番茄存在共線性關系,分別是ClaNAS1與Solyc01g100490.3.1、ClaNAS2與Solyc01g100490.3.1。

圖7 西瓜NAS基因家族成員的共線性分析

圖8 NAS基因在西瓜、擬南芥、番茄基因組間的共線性分析
NAS是麥根酸(mugineic acid,MA)類家族生物合成途徑中的關鍵酶,能夠催化三分子的S-腺苷甲硫氨酸形成一分子的NA,在植物生長發育過程中具有重要的調節作用[8]。隨著高通量測序技術和生物信息學技術的發展,目前已經在水稻、玉米、小麥、花生等多個物種中進行了NAS基因的鑒定和分析,并發現不同物種中NAS基因的數量與表達水平以及蛋白質的結構、長度和功能均存在顯著差異[2,6],而NAS基因在西瓜中的研究及其功能尚不清楚。
本研究利用生物信息學的方法對西瓜NAS基因家族進行了全基因組的鑒定和分析,共鑒定出4個NAS基因家族成員,與水稻、玉米、小麥和花生相比,基因數量差異較大,其中水稻基因組中共鑒定出3個OsNAS基因[9],玉米全基因組中鑒定出9個ZmNAS基因[2,10],花生全基因組中鑒定出6個AhNAS基因[7],在面包小麥中共鑒定出21個TaNAS基因[6]。編碼氨基酸的理化性質與其他物種差異也較大,本研究中西瓜NAS基因家族成員編碼的氨基酸數量277~356aa,分子量30.68~39.88kDa,等電點4.71~7.46;而花生中AhNAS基因編碼的氨基酸數量284~320aa,分子量32.03~35.65kDa,等電點5.37~6.37[7]。西瓜ClaNAS家族蛋白質的二級結構主要包含α-螺旋、延伸鏈、β-轉角、無規則卷曲,而不含β-折疊,該結果與水稻SBP家族蛋白的二級結構組成一致[11];對西瓜ClaNAS家族蛋白質的三級結構模型構建時,最優模板是3fpf.1,該結果與花生AhNAS蛋白質的三級結構模型構建時獲得的最佳模板一致[7]。對西瓜4個NAS基因家族成員的基因結構分析顯示,ClaNAS1和ClaNAS2均含有2個外顯子,且具有相同的外顯子-內含子排列方式,而ClaNAS3和ClaNAS4的外顯子數均為1,該結果與花生中AhNAS1.1和AhNAS1.2的編碼區含有2個外顯子,AhNAS2.1、AhNAS2.2、AhNAS3.1和AhNAS3.2只有1個外顯子的結果一致[7]。對擬南芥、水稻、番茄、西瓜、甜瓜5個物種共14個NAS蛋白質進行系統發育分析發現,禾本科、葫蘆科植物與其他植物均單獨聚為一類,其中在禾本科與其他非禾本科單獨聚為一類方面與羅艷芳等[7]、Zhou等[2]的研究結果一致。
西瓜NAS基因家族啟動子區的順式作用元件主要含有激素應答、光響應、脅迫應答等;其中,激素應答順式作用元件主要包括脫落酸、赤霉素、水楊酸、生長素等;脅迫應答主要是低溫脅迫應答,而花生的NAS基因家族啟動子區還包含茉莉酸甲酯激素應答,脅迫應答還包括干旱脅迫應答[7]。本研究中,在西瓜基因組內沒有發現NAS基因的串聯重復和片段復制,類似結果同樣在其他物種中也存在,如紅花基因組內也未發現SPL基因的串聯重復和片段復制[12],但在花生基因組內發現A組的AhNAS1.1、AhNAS2.1和AhNAS3.1分別與B基因組AhNAS1.2、AhNAS2.2和AhNAS3.2存在片段復制。西瓜NAS基因與擬南芥、番茄的NAS基因間分別存在2個共線性基因對,ClaNAS1與ClaNAS2分別連鎖了2個基因對,表明ClaNAS1與ClaNAS2可能是保守的,在進化中發揮著重要的作用。