田文杰 ,侯瑞澤,杜澤光,李改珍,侯雷平,李梅蘭*
(1.山西省曲沃縣智慧菜谷發(fā)展服務(wù)中心,山西 曲沃 043400;2.山西農(nóng)業(yè)大學(xué)園藝學(xué)院,山西 太谷 030801)
轉(zhuǎn)錄因子是一種可以與DNA 特異性結(jié)合,保證基因以特定的強(qiáng)度在特定的時(shí)空表達(dá),從而進(jìn)一步調(diào)控基因轉(zhuǎn)錄的蛋白質(zhì),其在植物生長(zhǎng)發(fā)育、細(xì)胞周期調(diào)控、環(huán)境應(yīng)答等過(guò)程中扮演著重要角色[1~3]。鋅指(zinc finger,ZF)蛋白最早發(fā)現(xiàn)于非洲爪蟾卵母細(xì)胞ⅢA,是一類具有鋅指結(jié)構(gòu)域的、對(duì)基因調(diào)控起重要作用的轉(zhuǎn)錄因子家族[4]。鋅指結(jié)構(gòu)域由半胱氨酸(Cys)和/或組氨酸(His)組成,通過(guò)鋅離子形成“指”狀四面體結(jié)構(gòu),因而將含有這種結(jié)構(gòu)的蛋白質(zhì)統(tǒng)稱鋅指蛋白。根據(jù)其結(jié)構(gòu)和功能的不同,鋅指蛋白可分為大約14 個(gè)基因家族[5],包括WRKY 和AP2/ERF 等基因家族,其功能也涉及DNA 識(shí)別、RNA 包裝、細(xì)胞凋亡等眾多領(lǐng)域,是植物已知較大的轉(zhuǎn)錄因子家族之一[6]。根據(jù)鋅指結(jié)構(gòu)序列和功能的差別,又可以將鋅指蛋白分為十大類——C2H2、C2C2、C2HC、C2HC5、C3H、C3HC4、C4、C4HC3、C6和C8,其中C3H(CCCH) 型鋅指蛋白占比僅0.8%[7,8]。近年來(lái),越來(lái)越多的研究表明,C3H 型鋅指蛋白在調(diào)節(jié)植物生長(zhǎng)發(fā)育以及脅迫響應(yīng)中起著重要作用。
C3H 型鋅指蛋白,其特征是含有一個(gè)或多個(gè)由3個(gè)Cys(C)和一個(gè)His(H)殘基構(gòu)成的鋅指基序[9],現(xiàn)對(duì)其定義為C-X4-15-C-X4-6-C-X3-H,X 代表任何氨基酸[10,11]。而在植物中,C-X7/8-C-X5-C-X3-H 基序更為常見(jiàn)[12]。區(qū)別于其他類型的鋅指蛋白,C3H 型鋅指蛋白已被廣泛證明是具有RNA 加工作用的RNA 結(jié)合蛋白[13]。目前,在擬南芥中已經(jīng)鑒定出68 個(gè)C3H 型鋅指蛋白家族成員[14],分為11 個(gè)亞族,其功能涉及到擬南芥生長(zhǎng)發(fā)育的多個(gè)階段。如,PEI1是一種胚胎特異性轉(zhuǎn)錄因子[15],可在胚胎頂端區(qū)域作用于擬南芥胚胎的發(fā)生過(guò)程。HUA1 蛋白是一個(gè)可以參與一種新的花調(diào)節(jié)機(jī)制的RNA 結(jié)合蛋白[16],通過(guò)與AGAMOUSpre-mRNA 結(jié)合來(lái)調(diào)節(jié)花形態(tài)的發(fā)生。FES1 可以與FRI 形成轉(zhuǎn)錄復(fù)合體作用于開花調(diào)節(jié)因子FLC,從而提高擬南芥的越冬活性[17]。而在另一種模式作物水稻中,共鑒定出67 個(gè)C3H 型鋅指蛋白家族成員,分屬8 個(gè)亞族[18]。水稻C3H 鋅指蛋白主要參與水稻的生長(zhǎng)發(fā)育和脅迫響應(yīng),其中OSDOS 蛋白可以整合發(fā)育信號(hào)參與茉莉酸途徑以延緩衰老[19]。SAW1可以調(diào)節(jié)水稻中赤霉素的穩(wěn)態(tài)和花藥的發(fā)育[20]。可見(jiàn),C3H 型鋅指蛋白具有重要的研究?jī)r(jià)值。
普通白菜(Brassica campestrisL. ssp.chinensisMakino),又稱小白菜,屬十字花科蕓薹屬植物[21],是維生素頗為豐富的蔬菜之一,因而受到人們的廣泛喜愛(ài)。但其是種子春化型作物,在春季易產(chǎn)生先期抽薹的現(xiàn)象,影響產(chǎn)品質(zhì)量。因此,培育耐抽薹品種,使作物在合適的時(shí)間抽薹開花,是重要的研究?jī)?nèi)容。但截至目前,在普通白菜中有關(guān)C3H 型鋅指蛋白的研究還較少。為了全面了解這一新興RNA 結(jié)合蛋白家族在普通白菜中的作用,利用生物信息學(xué)技術(shù)對(duì)普通白菜全基因組進(jìn)行鑒定,分析其成員的蛋白理化性質(zhì)、系統(tǒng)進(jìn)化和染色體的分布等,并對(duì)其在不同時(shí)期的表達(dá)模式進(jìn)行分析,旨為進(jìn)一步了解C3H 類鋅指蛋白在普通白菜中的功能奠定理論基礎(chǔ)。
在擬南芥官網(wǎng)TAIR(https://www.arabidopsis.org/)上獲取已知C3H 基因家族成員蛋白質(zhì)序列的FASTA格式,以其作為模板,利用TBtools 的Blast 功能(Evalue 值設(shè)置為10-5) 將其與白菜數(shù)據(jù)庫(kù)NHCCDB(http://tbir.njau.edu.cn/NhCCDbHubs/index.jsp) 中下載的普通白菜基因組進(jìn)行比對(duì)(Brassica campestris(syn.Brassica rapa)ssp.chinensis(Cultivar NHCC001)v1.0 Genome) 獲取候選基因,通過(guò)NCBI 上(CDsearch)對(duì)候選基因的保守結(jié)構(gòu)域進(jìn)行預(yù)測(cè),篩選得到含有C3H 類結(jié)構(gòu)域的成員,然后按其染色體測(cè)序順序依次命名,并在在線網(wǎng)站ExPASy(https://www.expasy.org/)上對(duì)其蛋白質(zhì)的理化性質(zhì)進(jìn)行分析。
從NHCCDB 上獲取基因的染色體位置信息,利用Tbtools 軟件對(duì)其進(jìn)行可視化。
利用MEGA7.0 軟件對(duì)普通白菜和擬南芥2 個(gè)物種的C3H 蛋白序列進(jìn)行進(jìn)化樹構(gòu)建,采用最大似然法(設(shè)置Bootstrap 值為1 000,其余參數(shù)按照默認(rèn)設(shè)置),保存Newick 結(jié)果文件,并通過(guò)iTOL 在線網(wǎng)站(https://itol.embl.de/)進(jìn)行美化。
利用Tbtools 軟件和Mcscan 功能對(duì)普通白菜物種內(nèi)的C3H 成員進(jìn)行共線性分析,并對(duì)所得數(shù)據(jù)進(jìn)行可視化。
通過(guò)Tbtools 軟件分析BrcC3H 成員的保守基序(將最大基序檢索值設(shè)置為10,其他參數(shù)默認(rèn),得到xml 格式結(jié)果文件)。將普通白菜的gff 文件、保守基序xml 格式預(yù)測(cè)文件結(jié)合1.1 CD-search 預(yù)測(cè)的保守結(jié)構(gòu)域(Domain) 文件、1.3 Newick 結(jié)果文件在Tbtools 軟件上進(jìn)行一體可視化。
根據(jù)本課題組的普通白菜的轉(zhuǎn)錄組數(shù)據(jù),對(duì)普通白菜C3H 家族基因不同時(shí)期的表達(dá)情況進(jìn)行分析。
通過(guò)擬南芥C3H 類鋅指蛋白基因家族68 個(gè)成員的蛋白序列,在Tbtools 上進(jìn)行Blast 同源比對(duì),并通過(guò)Interpro 和Smart 驗(yàn)證其蛋白序列結(jié)構(gòu)域,最終鑒定到84 個(gè)C3H 蛋白,并根據(jù)其在染色體中的順序命名為BrcC3H1~BrcC3H84(表1)。對(duì)蛋白質(zhì)理化性質(zhì)進(jìn)行預(yù)測(cè)發(fā)現(xiàn),C3H 蛋白的氨基酸數(shù)目為156~1 542 個(gè),其中,BrcC3H10 的氨基酸數(shù)目最少,BrcC3H2 的氨基酸數(shù)目最多;相對(duì)分子量為17.26~172.69 ku,差異明顯;等電點(diǎn)為4.96~10.84,其中堿性蛋白居多,共49 個(gè),酸性蛋白35 個(gè);不穩(wěn)定系數(shù)為25.57~104.91,除BrcC3H3、BrcC3H10、BrcC3H16、BrcC3H31、BrcC3H42 和BrcC3H77 為穩(wěn)定蛋白外,其他蛋白均不穩(wěn)定;親水性均為負(fù)值,表明該家族蛋白均是親水性蛋白。

表1 C3H 基因家族蛋白質(zhì)理化性質(zhì)分析Table 1 Analysis of physical and chemical properties of C3H gene family proteins

續(xù)表
染色體定位結(jié)果顯示,普通白菜84 條C3H 基因不均勻地分布在10 條染色體上(圖1),1 條定位未知。其中,定位在A03 號(hào)染色體上的基因最多,有15 個(gè);定位在A02、A04 號(hào)染色體上的基因最少,各有5 個(gè)。
為了更好地了解C3H 類鋅指蛋白基因家族的特性,采用最大似然法,對(duì)普通白菜C3H 家族的84 個(gè)成員蛋白進(jìn)行聚類分析,并參考擬南芥C3H 亞家族的分類對(duì)普通白菜C3H 成員進(jìn)行分類。聚類分析結(jié)果(圖2) 顯示,普通白菜C3H 家族可分為4 個(gè)亞家族——C3H-A、C3H-B、C3H-C 和C3H-D,成員數(shù)量分別為16 個(gè)、21 個(gè)、22 個(gè)和23 個(gè),其中D 家族成員最多。共線性分析結(jié)果(圖3)顯示,65 對(duì)染色體片段發(fā)生復(fù)制事件,說(shuō)明基因復(fù)制是造成C3H 家族進(jìn)化的重要原因。

圖2 普通白菜C3H 類鋅指蛋白的系統(tǒng)進(jìn)化樹Fig.2 Phylogenetic tree of C3H zinc finger proteins in B. campestris ssp. chinensis

圖3 普通白菜C3H 家族成員的共線性分析Fig.3 Colinear analysis of C3H family members in B. campestris ssp. chinensis
通過(guò)在線網(wǎng)站MEME 對(duì)84 個(gè)C3H 蛋白序列進(jìn)行保守基序分析(表2),共鑒定出10 種不同類型的Motif,將其命名為Motif1~Motif10。所有成員均包含C3H 型Motif,其中C-X8-C-X5-C-X3-H 型居多,其次是C-X7-C-X5-C-X3-H 型,二者合計(jì)占總數(shù)的一半以上,說(shuō)明C-X8/7-C-X5-C-X3-H 型是普通白菜中C3H 型蛋白的主要形式。通過(guò)對(duì)保守基序結(jié)果進(jìn)行可視化分析,發(fā)現(xiàn)84 個(gè)成員各包含1~7 個(gè)保守基序,4 個(gè)亞族間保守基序差異明顯,其中,C3H-A 亞族主要包含Motif 1、Motif 2、Motif 4、Motif 8 和Motif 9,C3H-B 亞族主要包含Motif 2 和Motif 7,C3H-C 亞族主要包含Motif 3、Motif 5、Motif 6、Motif 7 和Motif 10,C3H-D 亞族主要包含Motif 2 和Motif 7,而不同亞族內(nèi)基序保守。

表2 C3H 基因家族蛋白質(zhì)保守基序分析Table 2 Conservation motif analysis of C3H gene family proteins
通過(guò)NCBI 上的CD-search 功能對(duì)普通白菜84 個(gè)C3H 家族成員的結(jié)構(gòu)域進(jìn)行分析,發(fā)現(xiàn)所有蛋白均包含C3H 型結(jié)構(gòu)域(圖4),除此之外,還包含多種其它結(jié)構(gòu)域,說(shuō)明普通白菜該家族成員功能比較廣泛。其中根據(jù)亞族的不同又各有特征:C3H-A 亞族成員多數(shù)包含Ank(錨蛋白,Ankyrin);C3H-B 亞族成員部分包含YTH1(YT521B homology);C3H-C 亞族成員多數(shù)包含重復(fù)的C3H 型結(jié)構(gòu)域;C3H-D 亞族成員少數(shù)包含KH(K-homology)結(jié)構(gòu)域,同時(shí)RRM(RNA recognition motif)結(jié)構(gòu)域在各亞族里較為常見(jiàn)。

圖4 普通白菜C3H 類鋅指蛋白基因家族保守基序(A)及保守結(jié)構(gòu)域(B)Fig.4 Conservative motifs and domains of C3H zinc finger protein gene family in B. campestris ssp. chinensis
為了進(jìn)一步了解普通白菜C3H 家族特征,對(duì)84個(gè)基因的基因結(jié)構(gòu)進(jìn)行分析,結(jié)果(圖5)表明,普通白菜C3H 家族成員基因長(zhǎng)度差異明顯,基因結(jié)構(gòu)也有所區(qū)別。普通白菜C3H 家族基因包含CDS 1~14 個(gè),其中CDS 數(shù)量為1 個(gè)和7 個(gè)的居多,分別有15個(gè)和18 個(gè),合計(jì)占成員總數(shù)的39.3%。

圖5 普通白菜C3H 類鋅指蛋白基因家族的基因結(jié)構(gòu)Fig.5 Gene structure of C3H zinc finger protein gene family in B. campestris ssp. chinensis
為研究普通白菜C3H 基因在普通白菜花芽分化不同階段的表達(dá)特性,利用普通白菜不同時(shí)期莖尖的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,結(jié)果(圖6)顯示,有69 個(gè)普通白菜C3H 基因在花芽分化不同階段均有表達(dá),但不同時(shí)期的表達(dá)差異明顯,其中有10 個(gè)BrcC3H 基因在花芽分化臨界期有高表達(dá)、在花芽分化中后期表達(dá)降低,如BrcC3H11、BrcC3H18、BrcC3H23、BrcC3H27、BrcC3H38和BrcC3H52,猜測(cè)其可能參與普通白菜花芽的形成。在花芽分化臨界(S0)、花芽分化1 級(jí)(S1)和花芽分化3 級(jí)(S3)時(shí)期高表達(dá)的普通白菜C3H 基因相對(duì)較少,其中BrcC3H59、BrcC3H6和BrcC3H61分別為這3 個(gè)時(shí)期差異表達(dá)最顯著的基因,猜測(cè)他們可能對(duì)花芽分化的進(jìn)程具有促進(jìn)作用。

圖6 普通白菜C3H 類鋅指蛋白基因家族基因在花芽分化不同時(shí)期莖尖表達(dá)情況Fig.6 Expression of C3H zinc finger protein gene family genes at different stages of flower bud differentiation in stem tips of B. campestris ssp. chinensis
隨著植物全基因組測(cè)序的不斷完成,C3H 類鋅指蛋白基因家族已經(jīng)在水稻、玉米、擬南芥等多種作物中被鑒定出來(lái)。本研究通過(guò)生物信息學(xué)方法比對(duì)擬南芥C3H 類鋅指蛋白基因家族,在普通白菜中鑒定出84個(gè)成員。該數(shù)據(jù)多于水稻(67 個(gè))、玉米(68 個(gè))[22]和擬南芥(68 個(gè))中的數(shù)量,同樣數(shù)量較多的還有同為蕓薹屬的白菜(117 個(gè))[23]和甘藍(lán)(110 個(gè)),說(shuō)明C3H類鋅指蛋白基因家族在不同物種中存在差異。
通過(guò)基因定位,將普通白菜C3H 基因定位于10條染色體上,且大部分染色體上定位到5~9 條染色體,其中在染色體A03 和A05 上分布較多,分別有15 條和12 條,同時(shí)發(fā)現(xiàn)有部分普通白菜C3H 基因分布較為密集,可能在生物學(xué)上發(fā)揮相似功能。對(duì)普通白菜C3H 類鋅指蛋白基因家族進(jìn)化研究表明,普通白菜C3H 類鋅指蛋白基因家族可分為3 個(gè)亞族,且各亞族間差異明顯,在各亞族發(fā)現(xiàn)有部分基因序列相似度較高,猜測(cè)是基因進(jìn)化中序列片段復(fù)制的的結(jié)果。共線性分析結(jié)果印證了我們的猜想,在普通白菜基因組的10 條染色體上均檢測(cè)到大量基因同源,這也與之前白菜進(jìn)化中發(fā)生多倍體化的研究相符合。
目前,對(duì)C3H 型鋅指蛋白的Motif 模型定義多為C-X4-15-C-X4-6-C-X3-H 的形式。同時(shí),由于2 個(gè)Cys(C)中的氨基酸種類與數(shù)量不盡相同,造成了成員間的差異性[24]。本研究從普通白菜C3H 基因家族成員中鑒定了10 種Motif,其中C-X7-C-X5-C-X3-H和C-X8-C-X5-C-X3-H 是普通白菜C3H 基因Motif的主要形式,二者占總數(shù)的比例分別為57.14%和40.48%,合計(jì)占比達(dá)到97.62%,較擬南芥(82.24%)、玉米(79.44%)和水稻(78.67%)占比更高,同時(shí)還發(fā)現(xiàn)有C-X11-C-X5-C-X3-H 和C-X8-C-X4-C-X3-H 型的Motif,這在其他植物中比較少見(jiàn)。結(jié)構(gòu)域研究發(fā)現(xiàn),除C3H 結(jié)構(gòu)域外,還存在著多種其他類型的結(jié)構(gòu)域,如Ank 結(jié)構(gòu)域、KH 結(jié)構(gòu)域和RRM 結(jié)構(gòu)域等,這一現(xiàn)象并非偶然,在其它物種如甘藍(lán)型油菜[25]和煙草[26]中的C3H 家族成員中也發(fā)現(xiàn)有類似的結(jié)構(gòu)域,這些結(jié)構(gòu)域參與DNA 或RNA 的結(jié)合、脅迫響應(yīng)和開花調(diào)節(jié)等多項(xiàng)生物進(jìn)程[27~32],多樣的結(jié)構(gòu)域也說(shuō)明不同物種的C3H 家族成員有著較為廣泛的功能,以幫助植物適應(yīng)各種環(huán)境[30,31]。
開花是植物重要的生物學(xué)過(guò)程,擬南芥C3H 型鋅指蛋白HUA1 蛋白可以作為RNA 結(jié)合蛋白參與花的發(fā)育,并通過(guò)與AGAMOUSpre-mRNA 結(jié)合來(lái)調(diào)節(jié)花形態(tài)的發(fā)生。另一個(gè)擬南芥C3H 型鋅指蛋白FES1,可以與FRI 形成轉(zhuǎn)錄復(fù)合體調(diào)節(jié)開花調(diào)節(jié)因子FLC的表達(dá),從而提高擬南芥的越冬活性。同時(shí)在C3H 成員中鑒定到的多種其他結(jié)構(gòu)域也被證明具有調(diào)節(jié)開花相關(guān)的功能[32,33],故結(jié)合轉(zhuǎn)錄組數(shù)據(jù)對(duì)普通白菜C3H基因花芽分化不同階段的表達(dá)特性進(jìn)行分析。結(jié)果顯示,在鑒定出的84 個(gè)成員中,有69 個(gè)普通白菜C3H 基因在花芽分化不同階段均有表達(dá);在未表達(dá)的15個(gè)基因中,有4 個(gè)基因(BrcC3H54、BrcC3H68、BrcC3H69和BrcC3H71)同屬C3H-B 亞族,且其親緣關(guān)系接近,同時(shí)其結(jié)構(gòu)域均同時(shí)存在有C3H 結(jié)構(gòu)域和YTH1 結(jié)構(gòu)域,猜測(cè)C3H 結(jié)構(gòu)域和YTH1 結(jié)構(gòu)域同時(shí)存在可能影響普通白菜C3H 基因在花芽分化時(shí)期的表達(dá)。
本研究對(duì)普通白菜C3H 類鋅指蛋白基因家族進(jìn)行了鑒定與分析,共鑒定到84 個(gè)成員,并利用生物信息學(xué)分析不同家族成員的理化性質(zhì)、染色體位置、保守基序、基因結(jié)構(gòu)等,發(fā)現(xiàn)其均有差異,進(jìn)化樹分析結(jié)果表明普通白菜C3H 家族同一亞族成員可能有類似的功能。通過(guò)對(duì)不同成員在花芽分化不同時(shí)期的表達(dá)模式進(jìn)行分析,發(fā)現(xiàn)有10 個(gè)BrcC3H基因在花芽分化臨界期有高表達(dá),且在花芽分化中后期表達(dá)降低,其中BrcC3H23、BrcC3H38和BrcC3H52的表達(dá)特征尤為顯著,猜測(cè)其可能參與普通白菜花芽的形成。BrcC3H48、BrcC3H6和BrcC3H61可能對(duì)花芽分化的進(jìn)程具有促進(jìn)作用。本研究為后續(xù)了解普通白菜C3H類鋅指蛋白基因家族成員的功能提供了重要參考依據(jù)。