陳麗娟,張 斌
(湖南科技學院化學與生物工程學院,湖南 永州 425199)
大豆[Glycine max(Linn.)Merr.]是豆科大豆屬一年生草本植物,種子中富含大豆蛋白、活性肽、脂肪、異黃酮和皂苷等生物活性成分,具有抗高血壓、抗氧化、抗癌、降血脂等生理保健功能[1],尤其是大豆皂苷具備降血糖血脂、抗誘變、抗衰老、抗凝血等作用,對癌細胞也有一定的抑制作用[2]。熱激蛋白HSP (Heat Shock Proteins)是一類高度保守的蛋白質,具有幫助多肽正確折疊、轉運和修復的功能,在植物生 長發育和抗脅迫過程中發揮重要的作用[3]。HSP大 體可分為小分子HSP、HSP10、HSP40、HSP60、HSP70、 HSP90和HSP100這7類[4-5]。其中,小分子HSP的分 子量在15~42 kD之間,通常被稱為蛋白錯誤折疊的第一道防線,也被稱為“細胞衛士”[6]。HSP基因轉入大豆可以提高其抗逆性[7],但是,目前為止,關于GmHSP20家族基因的研究還非常有限。大豆基因組的成功測序為大豆基因功能研究提供了有力條件,筆者對GmHSP20家族基因進行了鑒定,并對其理化性質、系統進化、啟動子原件以及表達模式進行了分析,為探究GmHSP20家族基因的功能打下了一定基礎。
GmHSP20家族基因相關數據來自Ensembl數據庫;擬南芥HSP20蛋白家族基因相關數據來自擬南芥基因組數據庫(TAIR);HSP20蛋白隱馬爾可夫模型(pf 00011)來自PFAM數據庫。
1.2.1 HSP20蛋白家族基因成員的鑒定首先,從Ensembl數據庫下載基因組序列、CDS和蛋白序列,建立本地數據庫。第二,以pf 00011為參考序列,設置e值≤1E-20,用HMME軟件在本地數據庫搜索HSP20結構域,建立GmHSP20的隱馬爾可夫模型,搜索GmHSP20序列,e值≤0.001;將GmHSP20序列提交到NCBI進一步確認結構域,去除假陽性。第三,使用MEGA6.0軟件鄰接法(NJ)構建大豆和擬南芥HSP20蛋白的系統發育樹,bootstrap設置值為1000。通過http://web.expasy.org/compute_pi/獲得GmHSP20的長度、分子量和等電點。第四,從Phytozome數據庫中提取GmHSP20起始密碼子上游1500 bp基因組序列,利用PlantCARE預測其順式作用元件,用TBtools軟件繪制啟動子順式元件圖。第五,通過CDS找出GmHSP20基因在染色體上的位置,將信息提交到http://gsds.cbi.pku.edu.cn/生成基因結構。
1.2.2 HSP20蛋白家族基因的表達從大豆數據庫SoyKB(http://soykb.org/)下載GmHSP20基因表達數 據,利用TBtools軟件繪制基因的表達熱圖。
2.1GmHSP20蛋白家族基因的篩選、鑒定和染色體定位
該研究在大豆基因組數據庫中鑒定出56個GmHSP20蛋白家族基因。根據蛋白質分子量的大小命名,相同分子量命名為A、B等,結果(表1)顯示, 基因的氨基酸長度不一,分子量和等電點變化范圍比較大。GmHSP20的氨基酸長度為136~372(aa),最長的為GmHSP41.8,最短的為GmHSP15.6;GmHSP20 相對分子質量為15.2~41.8 Da,最大的為GmHSP41.8,最小為GmHSP15.2;蛋白質的等電點為4.49~10.28,最高為GmHSP17.8,最低為GmHSP17.5B。大豆全基因組共含有20條染色體,而56個GmHSP20基因分布在18條染色體上(圖1)。不同染色體含有不同的GmHSP20基因數目,1、11、12、17和19號只有1個基因,5、9、16號有2個基因;6、10、18、20號有3個基因;其中2、4、7、8、13、14號染色體上有基因成簇存在。

圖1 GmHSP20基因的染色體定位

表1 GmHSP20基因家族信息
2.2GmHSP20基因進化樹構建
根據HSP20家族基因在銀杏中的分組方法,GmHSP20基因可分為11個亞家族,如圖2所示,分別是CⅠ、CⅡ、CⅢ(細胞質或細胞核),MⅠ、MⅡ(線粒體),P(質體),Po(過氧化物酶體),ER(內質網)和UN1、UN2、UN3(位置未知)。對比擬南芥系統的進化分析發現,大豆和擬南芥HSP20基因家族成員具有高度的同源性。在各個亞族中,成員數量不一,CI有26個成員,CⅡ有2個,CⅢ有2個,P有7個,ER有6個,MI有4個,MⅡ有2個,Po有3個,未知功能的UN1亞族有2個,UN2有2個,UN3有13個。大多數GmHSP20基因分布在細胞質或細胞核中,少量分布在細胞器內。

圖2 GmHSP20基因進化樹
2.3GmHSP20基因啟動子原件分析
為了研究GmHSP20基因在進化過程中的多樣性變化,對基因結構進行分析,結果(圖3左)表明,家族基因在結構上較為保守,雖然56個GmHSP20基因長短差異較大,但內含子主要為0~2個。CⅠ和ER亞族基因長度比較短,都只含有1個內含子;UN1亞族含有5個內含子,而且外顯子和內含子相對位置高度相似;其余絕大部分基因都只含有2個內含子。值得注意的是,P亞族中GmHSP26.1和UN3亞族中GmHSP26.7比較特殊,基因結構較長,內含子超過了4 kb。

圖3 大豆GmHSP20基因結構(左)和啟動子原件(右)
對GmHSP20基因的啟動子(圖3右)進行分析,發現所有GmHSP20基因都含有與植物脅迫相關的元件,例如ARE、LTR、MBS和TC-rich。ARE元件在GmHSP20基因中普遍存在,表現為1~4個重復。
2.4GmHSP20基因表達模式分析
研究對56個GmHSP20基因的表達模式進行了分析,結果如圖 4所示。整體上,GmHSP20基因在種子發育第42天表達水平較高,其中GmHSP17.3A、GmHSP17.7A、GmHSP17.9和GmHSP18.5B在種子發育第35天和第42天表達最高。值得注意的是,同一亞族GmHSP18.5A和GmHSP18.5B在大豆不同生長部位和生長發育階段都有表達,而且表達水平均較高,表現出相似的表達模式。

圖4 GmHSP20基因表達模式圖
HSP蛋白廣泛存在于植物體內,參與植物生長發育、非生物脅迫響應等多種生物學過程[8]。關于HSP20蛋白家族基因的分析報道比較多,擬南芥有19個Hsp20[9],楊樹有36個[10],水稻有39個[11],銀杏有39個[12],可以分成了不同的亞族,并且在基因數量、亞細胞定位、功能和序列方面體現出多樣性。但是,到目前為止,關于GmHSP20基因的研究十分有限。該研究從大豆全基因組中鑒定出56個GmHSP20基因,分為11個亞族,大多數分布在細胞質或細胞核中,少量分布在細胞器內,說明細胞質可能是GmHSP20基因的主要功能區,這與銀杏中的研究一致;但是,銀杏中只有10個亞族,這可能與銀杏和大豆基因組具有不同的系統發育狀態有關[12]。GmHSP20蛋白的氨基酸長度不一、分子量和等電點變化范圍比較大,推測可能與這些蛋白是在不同亞細胞中發揮作用有關。18條染色體含有不同的GmHSP20基因數目,有的基因成簇存在,這些成簇的基因可能對某一生物學功能有加強作用。GmHSP20基因在在種子發育第42天表達量比較高,暗示這些基因在種子發育過程中發揮了一定的作用,其中GmHSP17.3A、GmHSP17.7A、GmHSP17.9和GmHSP18.5B在種子發育第35天和第42天表達最高,說明這4個基因在種子發育過程中可能發揮重要作用。GmHSP18.5A和GmHSP18.5B在大豆不同生長部位和各生長發育階段都有表達,表現出相似的表達模式,提示著這2個基因可能具有相同的功能,還需要進一步的研究確定。綜上所述,該研究結果為GmHSP20基因在大豆生長發育及非生物脅迫響應過程中的功能研究提供了參考。