張杰偉,秦新月,2,陳亞娟,劉 婧,3,崔進榮,姚 磊*,魏建華*
(1.北京市農林科學院北京農業生物技術研究中心,農業基因資源與生物技術北京市重點實驗室,北京 100097;2.北京農學院植物科學技術學院,北京 102206;3.內蒙古師范大學生命科學與技術學院,內蒙古 呼和浩特 010022)
【研究意義】真核翻譯起始因子5A(eukaryotic translation initiation factor 5A, eIF5A)是一類普遍存在于真核生物細胞中、分子質量為16~18 kDa的高度保守小分子蛋白質;是迄今為止發現的唯一含有羧腐胺賴氨酸(hypusine)殘基的蛋白質[1-2]。Hypusine是由eIF5A蛋白翻譯后特定位置的賴氨酸在脫氧羧腐胺賴氨酸合酶(DHS)的和脫氧羧腐胺賴氨酸羥化酶(DOHH)的作用下形成的。eIF5A前體沒有活性,每個成熟eIF5A僅含有1個hypusine殘基, 該殘基是eIF5A 行使生物學功能所必需的[3]。【前人研究進展】1976年,Kemper 等從兔子內質網膜上分離出eIF5A[4],生化分析表明eIF5A主要功能是促進第一步甲硫氨酸的合成,故此認為eIF5A在蛋白翻譯起始階段起重要作用[5]。植物eIF5A的研究起步較晚,2004年,Thompson等從模式植物擬南芥中分離出3個AteIF5A基因[6]。后續的研究表明AteIF5A1參與次生木質部的形成,超量表達AteIF5A1的轉基因擬南芥木質部增大[6-7]。AteIF5A2主要在受機械損傷的組織中高水平表達,AteIF5A2能夠抑制伏馬毒素B1和黑暗引起的細胞凋亡[6, 8]。AteIF5A3主要在細胞分裂很活躍的種子中表達,超量表達AteIF5A3的轉基因擬南芥葉子變為并生葉、種子變大、同時能夠響應高鹽、干旱以及滲透等脅迫信號[6,9]。
由中國科學家主導(深圳華大基因研究院、張家口市農業科學院)的谷子全基因組測序和美國科學家主導的谷子全基因組測序計劃的完成[10-11],為后續通過生物信息學挖掘、鑒定和分析谷子功能基因提供重要的基礎。【本研究切入點】本研究從谷子基因組數據庫出發,重點分析谷子eIF5A基因家族進化關系、編碼蛋白的保守結構域和磷酸化位點等,【擬解決的關鍵問題】為進一步研究谷子eIF5A 蛋白生物學功能以及其磷酸化修飾提供重要信息。
擬南芥(Arabidopsisthaliana)eIF5A基因及其推導的蛋白序列來自TAIR數據庫(http://www.arabidopsis.org);毛果楊(Populustrichocarpa)eIF5A基因及其推導的蛋白序列下載自phytozome 數據庫(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Ptrichocarpa);小家鼠(Musmusculus)、美洲黑楊(Populusdavidiana)和小麥(Triticumaestivum)eIF5A蛋白序列來自NCBI數據庫(https://www.ncbi.nlm.nih.gov/)。
分別以擬南芥AteIF5A1(AT1G13950)、AteIF5A2 (AT1G26630)、AteIF5A3(AT1G69410)、小麥TaeIF5A1(AAZ95171.1)、TaeIF5A2 (AAZ95172.1)和TaeIF5A3 (AAZ95173.1)蛋白序列為參比序列,利用phytozome 數據庫(谷子)中Blast 程序進行BlastP檢索,檢索結果的全序列E值大于e-60的舍去,再利用美國國家生物技術信息中心提供的在線CDS(conserved domain search)程序(http://www.ncbi.nlm.nih.gov/cdd)預測這些蛋白有無DNA結合寡核苷酸結合結構域,同時具有這兩個特征的蛋白序列屬于eIF5A基因家族。
對鑒定出的谷子eIF5A基因根據其預測編碼區序列和基因組序列進行結構分析,利用GSDS(http://gsds.cbi.pku.edu.cn/) 在線軟件進行分析[12]。
利用Clustal X(2.0)[13]軟件對鑒定出所有谷子eIF5A蛋白、1個小家鼠eIF5A蛋白、3個擬南芥eIF5A蛋白[6]、4個毛果楊eIF5A蛋白[14]、4個美洲黑楊eIF5A蛋白[9]和3個小麥eIF5A蛋白[15]進行多重序列比對,使用MEGA 6.0[16]軟件,采用鄰接(neighbor-joining,NJ)算法構建系統進化樹,進行1000 次Bootstrap 抽樣。應用在線軟件MEME(http://meme-suite.org/tools/meme)對上述eIF5A蛋白保守基序進行分析[17]。參數設置如下:基序的最大發現數目是1個,其它參數為程序默認值。
利用NetPhos 3.1 Server在線軟件[18](http://www.cbs.dtu.dk)對鑒定出所有谷子eIF5A蛋白序列進行磷酸化位點預測,所有參數都選用程序默認值。
分別以3個擬南芥eIF5A蛋白和3個小麥eIF5A蛋白序列為參比序列,利用phytozome 數據庫(谷子)提供的Blast P程序進行檢索,共得到了4個谷子候選eIF5A基因。利用保守基序在線預測軟件MEME進行驗證保守結構域(PF01287)的存在,初步確定了4個谷子eIF5A基因。谷子eIF5A基因分布在第2、3和9條染色體上,根據通用植物基因的命名方法,對鑒定到的4條eIF5A基因進行了命名,并統計了它們對應的轉錄本、別名、染色體定位、基因長度以及對應的推導蛋白長度和內含子個數等,他們推導的蛋白質長度從135個氨基酸到162個氨基酸不等(表1)。谷子eIF5A基因家族成員均含有4個內含子,且內含子的長度遠大于外顯子的長度(圖1)。
利用在線軟件MEME對1個MmeIF5A1蛋白序列、3個AteIF5A蛋白序列、4個PtreIF5A蛋白序列、3個TaeIF5A蛋白序列、4個PdeIF5A蛋白序列和4個SieIF5A蛋白序列保守基序進行分析,結果表明谷子eIF5A基因家族蛋白序列中均包含由基序1(相似度為6.5e-747)(圖2)。
利用進化樹分析軟件MEGA 6.0 對4個谷子eIF5A蛋白、1個小家鼠eIF5A蛋白、3個擬南芥eIF5A蛋白、4個毛果楊eIF5A蛋白、4個美洲黑楊eIF5A蛋白和3個小麥eIF5A蛋白全蛋白序列進行進化分析。結果顯示:這19個eIF5A按照同源進化關系可以分為3個亞家族,分別含有11、6和2個成員(圖3)。第Ⅰ亞家族由毛果楊、美洲黑楊和谷子共同組成;第Ⅱ亞家族由擬南芥和小麥組成,第Ⅲ亞家族中由小家鼠和谷子組成。谷子eIF5A基因家族分布于第Ⅰ和 Ⅲ亞家族中,其中毛果楊PtreIF5A1~PtreIF5A4、美洲黑楊PdeIF5A1~ PdeIF5A4和谷子SieIF5A2~SieIF5A4聚類于第Ⅰ亞家族;擬南芥AteIF5A1~AteIF5A3和小麥TaeIF5A1~TaeIF5A3聚類于第Ⅱ亞家族;小家鼠MmeIF5A1和谷子SieIF5A1聚類于第Ⅲ亞家族。利用歐洲生物信息研究所在線Clustal Omega程序對4個毛果楊的蛋白序列進行多重序列比對,發現他們的氨基酸相似性在77.04 %~ 88.68 %,其中SieIF5A1 和SieIF5A3氨基酸序列的相似性最低達到 77.04 %,SieIF5A2 和SieIF5A4氨基酸序列的相似性最高達到 88.68 %(表2)。

表1 谷子eIF5A基因家族的基本特征

圖1 谷子eIF5A基因家族結構分析Fig.1 Gene structure of eIF5A gene family in S.italica

圖2 eIF5A編碼蛋白保守基序分布Fig.2 Distribution of conserved motifs in eIF5A proteins

表2 谷子基因組中eIF5A蛋白氨基酸相似性分析

圖3 eIF5A蛋白進化樹Fig.3 Phylogenetic tree for eIF5A proteins

圖4 谷子eIF5A蛋白磷酸化位點預測Fig.4 Phosphorylation site prediction of eIF5A proteins in S.italica

表3 谷子基因組中eIF5A蛋白磷酸化位點分析
利用在線軟件NetPhos 3.1 Serverl對4個谷子eIF5A蛋白進行磷酸化位點預測,結果顯示SieIF5A1~ SieIF5A 4蛋白中存在著12~19個絲氨酸、蘇氨酸及酪氨酸潛在磷酸化位點,預測磷酸化位點主要是以絲氨酸的形式存在,其次是蘇氨酸,絡氨酸的磷酸化位點最少(表3)。預測SieIF5A1潛在磷酸化位點中存在10個絲氨酸、7個蘇氨酸和2個酪氨酸位點。SieIF5A2 潛在磷酸化位點中絲氨酸和蘇氨酸位點均為7個,酪氨酸位點僅有1個(圖4)。
本研究鑒定谷子eIF5A基因家族含有4個成員,而已鑒定的擬南芥[6]、毛果楊[14]、美洲黑楊[9]和小麥[15]eIF5A基因家族分別含有3、4、4和3個成員,這說明在植物進化過程中,eIF5A基因可能經歷了不斷發生譜系的特異擴張和拷貝丟失。谷子eIF5A基因家族的4個成員均含有5個外顯子,均含有1個保守的DNA結合寡核苷酸結合結構域(PF01287),這表明eIF5A基因家族的高度保守性,推測eIF5A蛋白在植物諸多生理過程中起著類似作用。不同植物中eIF5A基因家族含有的成員數目存在差異,推測不同植物的各成員在特定組織響應低溫、干旱和高鹽等信號后精細調節各生理過程。
進化分析表明,谷子eIF5A基因家族分布在第Ⅰ和第Ⅲ亞家族中,谷子SieIF5A2 ~ SieIF5A4、毛果楊PtreIF5A1~PtreIF5A4和美洲黑楊PdeIF5A1~ PdeIF5A4聚類于第Ⅰ亞家族;谷子SieIF5A1和小家鼠MmeIF5A1聚類于第Ⅲ亞家族。目前,eIF5A基因家族各成員確切的功能分析主要集中在擬南芥中。近年,伴隨著植物基因組學、生物信息學等新興學科的興起,大量的eIF5A基因從不同植物中克隆出來,部分林木eIF5A基因成功克隆并功能也得到初步分析。第I亞家族中毛果楊和美洲黑楊之間的eIF5A基因間是一一對應關系,而谷子eIF5A基因并沒有表現出與之相對應的關系,表明盡管是高度保守的基因家族在經過長期進化選擇,同屬楊屬的毛果楊和美洲黑楊eIF5A基因還未發生分離,而與其他植物發生了分離。美洲黑楊PdeIF5A3超量表達轉基因擬南芥表現出比轉空載體擬南芥對干旱和滲透耐受,且收獲的種子比轉空載體擬南芥增加30 %~100 %。鑒于谷子SieIF5A3與美洲黑楊PdeIF5A3同源性最高,據此推測:谷子SieIF5A3可能也參與谷子的生長發育及抗逆生理中發揮重要作用。聚類在一起的不同植物的同源基因可能具有不同的生物學功能[19],因此不能簡單推測谷子eIF5A基因家族各成員的生物學功能,其各成員確切的生物學功能還需要逐一進行功能驗證。
磷酸化分析表明,谷子SieIF5A蛋白存在大量潛在磷酸化位點。目前,植物eIF5A蛋白確切的生物學功能尚未見報道。Lebska等通過多重序列比對發現玉米ZmeIF5A蛋白存在2個潛在的能被CK2蛋白磷酸化的位點,分別將ZmeIF5A以及這兩個潛在的絲氨酸磷酸化位點突變(Ser2Ala和Ser4Ala)為丙氨酸并進行體外重組蛋白的表達及純化,只有ZmeIF5A Ser2Ala重組蛋白不能被玉米CK2蛋白磷酸化。玉米原生質體瞬時轉化發現ZmeIF5A和模擬Ser2不磷酸化的Ser2Ala融合EYFP熒光蛋白均勻地分布在細胞核和細胞質中,而模擬Ser2磷酸化的Ser2Asp融合EYFP熒光蛋白僅在細胞核內表達,表明:玉米ZmeIF5A蛋白中Ser2是決定其進出細胞核的關鍵位點[20]。谷子SieIF5A蛋白中潛在的磷酸化位點(尤其是絲氨酸)還需要通過潛在位點的定點突變、體外磷酸化等試驗進一步研究和驗證。
谷子基因組中鑒定出4個eIF5A基因家族成員,均含有4個內含子,位于谷子的第2、3和9染色體上。谷子eIF5A蛋白均含有1個保守的DNA結合寡核苷酸結合結構域(PF01287)、均含有大量潛在的磷酸化位點。