林 歡 段偉科 周 怡 祝夢全 王云鵬 孫 敏 黃志楠
(淮陰工學(xué)院生命科學(xué)與食品工程學(xué)院,江蘇淮安 223003)
在植物整個生命歷程中,外界多種環(huán)境因素往往會影響其生長發(fā)育。為適應(yīng)多變的外界環(huán)境,植物體自身形成了一套復(fù)雜的信號網(wǎng)絡(luò)系統(tǒng)[1]。Ca2+是真核生物細(xì)胞信號傳導(dǎo)過程中常見的第二信使[2]。不同的細(xì)胞外刺激會觸發(fā)植物體內(nèi)特定的鈣信號,這些鈣信號會被不同的鈣傳感器識別,從而激活下游級聯(lián)系統(tǒng)[3]。目前主要有三大類鈣傳感器(鈣離子結(jié)合蛋白),包括鈣依賴蛋白激酶(calcium-dependent protein kinase,CDPK/CPK)、鈣調(diào)素和類鈣調(diào)素蛋白(calmodulin and calmodulin-like protein,CaMand CaML)、類鈣調(diào)磷酸酶亞基B蛋白質(zhì)(calcineurin Blike protein,CBL)[4]。在這些鈣傳感器中,CDPK是植物和一些原生生物特有的一類絲氨酸/蘇氨酸蛋白激酶,因其結(jié)構(gòu)特殊,不需要鈣調(diào)素的參與,可直接感知、響應(yīng)鈣信號,在基因表達(dá)、酶代謝、離子和水分的跨膜運輸、植物細(xì)胞的骨架調(diào)節(jié)、植物的氣孔運動和生長發(fā)育等方面具有潛在的調(diào)節(jié)作用[5-7]。
陸生植物CDPK蛋白結(jié)構(gòu)保守,往往以單肽鏈形式存在,通常從N端到C端包含4個功能區(qū)[8-9]:1)N端為一個包含豆蔻酰化與棕櫚(十六烷)酰化位點的可變區(qū),在不同物種,甚至相同物種的不同CDPK蛋白中,N端的結(jié)構(gòu)域長度都不盡相同[10],該結(jié)構(gòu)域主要與CDPK蛋白定位及體內(nèi)磷酸化有關(guān)[11];2)包含ATP結(jié)合位點的絲氨酸/蘇氨酸催化區(qū),該結(jié)構(gòu)域是CDPK蛋白的主要功能結(jié)構(gòu)域,有效調(diào)控CDPK的活性、亞細(xì)胞定位以及與其他蛋白的互作[2,8];3)控制活性的自抑制區(qū),通過感應(yīng)鈣信號來維持CDPK的活性,或者通過鈣信號刺激來激活CDPK的活性[9];4)C端為包含2~4個EF手型結(jié)構(gòu)區(qū)(EF-hand)基序的類鈣調(diào)蛋白結(jié)構(gòu)域調(diào)控區(qū)[9],該調(diào)控結(jié)構(gòu)域通常含有至多4個EF-hand,每個EF-hand是由29個氨基酸構(gòu)成的螺旋-環(huán)-螺旋結(jié)構(gòu),該結(jié)構(gòu)有13個保守位點,可以感應(yīng)鈣信號并結(jié)合鈣離子[12-14]。
研究表明,CDPK廣泛分布于植物界[15-16]。通過全基因組測序在很多物種中鑒定出了CDPK基因,且數(shù)目眾多。擬南芥基因組中有34個CDPK基因成員[5],水稻基因組中鑒定出31個CDPK基因成員[17],二倍體棉花中有41個CDPK基因[18]。在園藝作物中,也有多個物種的CDPK被鑒定,如番茄基因組中存在29個CDPK基因[19],黃瓜、葡萄中均有19個CDPK基因[20-21]。在進(jìn)化過程中,自苔蘚植物到被子植物,CDPK基因家族表現(xiàn)出了高度的結(jié)構(gòu)保守性[16]。該基因家族一般可分為4個亞族,并發(fā)生不同程度的分化擴(kuò)增,其中,第Ⅳ亞族的基因數(shù)目最少,同時第Ⅳ亞族也最古老[16]。雖然對園藝作物中的CDPK基因家族研究越來越廣泛,但是對辣椒CDPK基因家族的系統(tǒng)分析還不夠全面。
辣椒(Capsicumannuum)屬茄科(Solanaceae)茄亞族(Solaninae Dunal)辣椒屬,一年生或多年生植物,是重要的藥食同源蔬菜,經(jīng)濟(jì)價值和社會效益極高。CDPK作為一種重要的蛋白激酶,深入研究辣椒CDPK基因,可進(jìn)一步了解其對辣椒生長發(fā)育的影響,為辣椒栽培品種育種提供基因資源和理論依據(jù)。目前,我國與墨西哥分別對辣椒品種遵辣1號及CM334進(jìn)行了全基因組測序[22-23]。遵辣1號是我國遵義市農(nóng)業(yè)科學(xué)研究所多年系統(tǒng)選育的優(yōu)良辣椒品種,栽培廣泛。2015年,Cai等[24]基于CM334基因組鑒定獲得了31條CDPK基因,初步分析其基因結(jié)構(gòu),并深入分析了部分基因的表達(dá)情況。本研究基于已公布的遵辣1號及墨西哥地方品種CM334基因組測序數(shù)據(jù),進(jìn)一步分離鑒定辣椒中的CDPK基因家族,詳細(xì)比較擬南芥、番茄、辣椒遵辣1號和CM344中的CDPK的進(jìn)化關(guān)系及各組基因數(shù)目的差異;同時,比較分析辣椒與模式植物擬南芥CDPK成員的基因結(jié)構(gòu)、保守結(jié)構(gòu)域差異及同源基因情況。最后,詳細(xì)鑒定辣椒CDPK基因在辣椒的不同組織及果實發(fā)育過程中的表達(dá)情況,并根據(jù)共表達(dá)情況分析辣椒CDPK基因之間的相互作用,旨在為探索CDPK基因的分子進(jìn)化機(jī)制和進(jìn)一步研究辣椒CDPK的基因功能提供理論基礎(chǔ)。
本研究主要基于我國辣椒測序品種遵辣1號進(jìn)行系統(tǒng)分析,與墨西哥地方品種CM344進(jìn)行比較分析,所用辣椒基因組數(shù)據(jù)分別從已公布的辣椒基因組網(wǎng)站Pepper Genome Database 2.0(http://peppersequence.genomics.cn/page/species/index.jsp)和PGP(Pepper genome platform,http://peppergenome.snu.ac.kr/)下載獲得。
參照已報道的34個擬南芥CDPK蛋白序列[5],利用本地BLAST query工具在辣椒基因組數(shù)據(jù)庫中進(jìn)行比對(參數(shù)為E<1e-10,Identity>50),獲得候選辣椒CDPK基因,隨后通過Pfam(http://pfam.sanger.ac.uk/search)和SMART(http://smart.emblheidelberg.de/)對候選序列進(jìn)行驗證分析,篩選同時含有CDPK蛋白典型結(jié)構(gòu)域絲氨酸/蘇氨酸蛋白激酶區(qū)(Protein Kinase)以及EF-hand的蛋白序列,刪除缺失結(jié)構(gòu)域的序列。
辣椒CDPK家族蛋白分子量和等電點利用在線工具EMBOSS Programs(https://www.ebi.ac.uk/Tools/emboss/)進(jìn)行分析鑒定。EF-hand結(jié)構(gòu)通過在線工具PROSITE(https://prosite.expasy.org/prosite.html)進(jìn)行預(yù)測鑒定。N豆蔻酰化修飾和十六烷酰化修飾通過GPS-Lipid(http://lipid.biocuckoo.org/)進(jìn)行分析鑒定。
根據(jù)本地perl語言在辣椒基因組注釋信息GFF文件中提取獲得CaCDPK基因染色體位置信息,之后應(yīng)用Tbtool構(gòu)建辣椒染色體定位圖[25]。利用MCScanX下游程序duplicate_gene_classifier分析辣椒CDPK基因的復(fù)制類型[26],并標(biāo)注在染色體上。
利用CLUSTALW對CDPK氨基酸序列進(jìn)行多序列比對分析[27],并在MEGA 6.0軟件中通過鄰接法(neighbour-joining,NJ)構(gòu)建系統(tǒng)進(jìn)化樹,自展值(Bootstrap)設(shè)定為1 000,同時應(yīng)用MEGA 6.0計算CDPK基因的核苷酸差異[28]。根據(jù)進(jìn)化樹及擬南芥CDPK的分組確定辣椒中CDPK基因家族的分組。
應(yīng)用本地perl語言獲得辣椒基因組注釋信息GFF文件中CDPK基因的外顯子和內(nèi)含子位置信息,轉(zhuǎn)變?yōu)镚SDS(Gene Structure Display Server;http://gsds.cbi.pku.edu.cn ref)可讀bed件,并繪制CDPK基因結(jié)構(gòu)。
應(yīng)用在線軟件MEME 4.9.0預(yù)測分析CDPK蛋白序列結(jié)構(gòu)域,搜尋motif值為16,結(jié)構(gòu)域?qū)挾仍O(shè)定最小為10、最大為100,其他設(shè)定為默認(rèn)參數(shù)。通過TBbool軟件繪制MEME結(jié)構(gòu)[24]。CDPK蛋白的Protein Kinase和EF-hand結(jié)構(gòu)域通過SMART(http://smart.embl-heidelberg.de)數(shù)據(jù)庫分析確定。
辣椒、番茄和擬南芥的CDPK基因的直系與旁系同源關(guān)系通過 OrthoVenn2(https://orthovenn2.bioinfotoolkits.net/home)軟件進(jìn)行鑒別[29],并利用Circos(http://circos.ca/)軟件繪制CDPK基因在3個基因組中的直系與旁系之間的關(guān)系圖。
在GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)中獲得辣椒遵辣1號不同時期的轉(zhuǎn)錄組(GSE45037)注釋文件,運用R軟件繪制辣椒CDPK基因家族的表達(dá)熱圖。篩選獲得根、莖、葉、花和花芽中FPKM值大于50的基因構(gòu)建Venn圖。
利用本地perl語言計算辣椒CDPK基因在不同組織之間表達(dá)關(guān)系的皮爾森相關(guān)系數(shù)(pearson correlation coefficient,PCC),并利用Cytoscape 3.1構(gòu)建顯著相關(guān)共表達(dá)基因?qū)W(wǎng)絡(luò)。
利用生物信息學(xué)方法在辣椒遵辣1號基因組中鑒定獲得30個CDPK基因家族成員,并依據(jù)其在辣椒染色體上的位置,命名為CaCDPK01~CaCDPK30。隨后對CaCDPKs的蛋白質(zhì)長度、分子量以及等電點等基本理化性質(zhì)進(jìn)行分析,由表1可知,在辣椒CDPK家族中,30個CDPK的基因序列長度和編碼氨基酸大小各不相同,其中CaCDPK13的基因序列長度最短,只有891 bp,編碼296個氨基酸殘基;CaCDPK21的基因序列長度最長,為2 301 bp,編碼766個氨基酸殘基。CaCDPKs的分子量介于33.63~84.23 kDa之間,等電點介于4.53~9.80之間,大部分蛋白等電點小于7。
利用PROSITE工具對CDPK家族成員進(jìn)行蛋白質(zhì)結(jié)構(gòu)分析,CDPK家族成員的類CaM結(jié)構(gòu)域中的EF-hand數(shù)目不完全一致,除CaCDPK05、CaCDPK21、CaCDPK27、CaCDPK29含有3個與Ca2+結(jié)合的該結(jié)構(gòu),其余均為4個。而辣椒CDPK家族成員的N端結(jié)構(gòu)域差異也很大,其中有7條CaCDPK包含豆蔻酰化位點,包含十六烷酰化位點的CaCDPK數(shù)目較多,有22條(表1)。此外,辣椒CDPK與擬南芥CDPK蛋白比對結(jié)果顯示,兩個物種的CDPK間E值除CaCDPK28為5E-180,其余均為0,表明CDPK序列非常保守,這為利用擬南芥的研究結(jié)果指導(dǎo)辣椒CDPK基因家族成員相關(guān)功能的研究提供了參考。
根據(jù)辣椒CDPK家族的染色體位置信息,繪制出其在染色體上的物理位置分布圖。由圖1可知,有6條CaCDPK基因沒有錨定在染色體上,其余24條CaCDPK基因不均等地分布在除7號染色體之外的11條染色體上。其中,在1號和4號染色體上分布最多,均有4條;在5號、8號、9號和11號染色體上均只分布1條,其余染色體上分布2~3條不等。此外,CaCDPK10和CaCDPK23分別位于4號和12號染色體的頂端,CaCDPK18位于8號染色體末端,CaCDPK20和CaCDPK21位于10號染色體末端。共有6對CaCDPK基因發(fā)生片段復(fù)制,分別是CaCDPK01/CaCDPK22、CaCDPK03/CaCDPK23、CaCDPK05/CaCDPK13、CaCDPK06/CaCDPK12、CaCDPK14/CaCDPK24及CaCDPK17/CaCDPK19。

?
為深入探究辣椒與其他物種CDPK基因家族的同源進(jìn)化關(guān)系、分組情況以及兩個辣椒品種之間的差異,通過NJ法構(gòu)建了遵辣1號、CM334、番茄和擬南芥CDPK基因家族的系統(tǒng)進(jìn)化樹。由圖2-A可知,擬南芥、番茄、辣椒的CDPK基因家族均分為4個亞族:Ⅰ、Ⅱ、Ⅲ和Ⅳ亞族。兩個辣椒基因組中的CDPK基因大多處于相同節(jié)支點下,同源性較高。個別基因,如CaCDPK17、CaCDPK19、CaCDPK25、CaCDPK28在CM334中沒有對應(yīng)同源基因。辣椒中部分基因與番茄CDPK關(guān)系更近,如遵辣1號中的CaCDPK27-SlCDPK19和CaCDPK25-SlCDPK6,CM334中的CA11g11120、CA04g01680 分別與SlCDPK20、SlCDPK16同源性更高。上述結(jié)果說明,該基因家族在兩個辣椒品種中發(fā)生了分化。
總體來看,4個亞族的基因個數(shù)并不相同,Ⅰ亞族最多,為47個,而Ⅳ亞族最少,只有9個(圖2-B)。通過分析系統(tǒng)進(jìn)化樹遺傳距離,Ⅰ亞族和Ⅱ亞族具有較近的同源性,而Ⅳ亞族最遠(yuǎn),Ⅲ亞族介于中間。
由圖2-C可知,擬南芥、番茄和辣椒中CDPK基因總體數(shù)目差異不大,但在4個亞族間仍有差異。遵辣1號CDPK基因家族中有13個家族成員在Ⅰ亞族,8個在Ⅱ亞族中,7個包含在Ⅲ亞族,僅有2個家族成員在Ⅳ亞族;CM334基因組的28個CDPK家族成員在Ⅰ~Ⅳ亞族中的基因數(shù)目依次為11、10、5和2,其分布情況與辣椒遵辣1號有一定差異,除Ⅳ亞族數(shù)目相同外,均有不同程度的增減。番茄在Ⅰ~Ⅳ亞族中的基因數(shù)目依次為13、8、6和2,其家族成員分布情況與辣椒遵辣1號相似,Ⅰ亞族基因數(shù)目最多,Ⅳ亞族最少。而擬南芥CDPK基因家族成員數(shù)在亞族Ⅰ~Ⅳ中分布為10、13、8、3,Ⅱ亞族中的家族成員數(shù)多于亞族Ⅰ,但總體數(shù)目差異不大。亞族Ⅳ在四個基因組數(shù)目最保守,特別是番茄和辣椒中。
為進(jìn)一步了解辣椒遵辣1號CDPK基因的結(jié)構(gòu)特征,選取擬南芥的34個CDPK家族成員與其比較(圖3)。辣椒和擬南芥CDPK基因的結(jié)構(gòu)均比較復(fù)雜,大多數(shù)基因的內(nèi)含子數(shù)目大于10,但辣椒CDPK基因的內(nèi)含子長度明顯大于擬南芥CDPK基因(圖3-A)。具體來看,CaCDPK基因內(nèi)含子數(shù)量不一,內(nèi)含子數(shù)最多的是CaCDPK21,為13個,內(nèi)含子數(shù)最少的是CaCDPK25,為5個;與之相對應(yīng)的34個擬南芥家族成員,含內(nèi)含子最多為11個,最少同樣為5個。不同分組間,Ⅰ亞族基因結(jié)構(gòu)差異最大,內(nèi)含子最多與最少的CaCDPK都屬于Ⅰ亞族;Ⅳ亞族中,CaCDPK與擬南芥的CDPK均含有11個內(nèi)含子,證明Ⅳ亞族基因相對更保守。在擬南芥中,CDPK同源基因有類似的結(jié)構(gòu)特征,辣椒CDPK同源基因的結(jié)構(gòu)多數(shù)也類似。但部分CaCDPK同源基因發(fā)生了內(nèi)含子增加等分化現(xiàn)象,如CaCDPK28/CaCDPK29;或者雖然結(jié)構(gòu)相似,但同源基因間長度差異很大,如CaCDPK17/CaCDPK19。這表明相較于擬南芥,辣椒CDPK基因結(jié)構(gòu)發(fā)生了更大程度的分化。此外,擬南芥和辣椒CDPK直系同源基因(如AT4G23650-CPK3/CaCDPK27、AT1G76040-CPK29/CaCDPK10、AT2G1500-CPK24/CaCDPK15)之間的內(nèi)含子數(shù)目無較大差別,說明CDPK基因在整體進(jìn)化過程中相對保守。
擬南芥和辣椒遵辣1號的CDPK蛋白序列中共鑒定獲得16個Motif(Motif1~Motif16)(圖3-B)。整體來看,該家族蛋白序列非常保守,大部分序列包含所有的Motif基序,兩個物種也無明顯差異。Ⅳ亞族中的蛋白,除了不含Motif13和Motif15,其余14個Motif都存在,證明其非常保守。Ⅲ亞族中也只有個別蛋白缺失Motif15。在兩個物種的Ⅰ和Ⅱ亞族中,Motif整體分布差異較明顯。擬南芥和辣椒中均有CDPK蛋白丟失部分絲氨酸/蘇氨酸蛋白激酶區(qū),且N端Motif16丟失較多。
辣椒、番茄和擬南芥三個物種中的直、旁系同源基因?qū)Ρ冉Y(jié)果顯示(圖4),辣椒和番茄之間直系同源基因(24對)稍多于其他組(擬南芥和辣椒12對;擬南芥和番茄14對),表明辣椒與番茄之間的基因相似度更高,也表明它們之間的親緣關(guān)系更近。而旁系同源基因的鑒定結(jié)果表明,擬南芥中的旁系同源基因(14對)明顯多于番茄(10對)和辣椒(6對),辣椒中最少,表明辣椒基因組的倍增事件并未使CaCDPK基因發(fā)生明顯擴(kuò)增。
由圖5可知,CaCDPK基因在辣椒不同組織中有明顯的表達(dá)差異,如CaCDPK09、CaCDPK18、CaCDPK20、CaCDPK12在辣椒各組織中均表達(dá),且表達(dá)量較高;CaCDPK28、CaCDPK04則在辣椒各組織表達(dá)量都很低甚至完全不表達(dá);個別基因如CaCDPK02、CaCDPK03、CaCDPK30、CaCDPK23和CaCDPK15只在花芽和花中表達(dá),CaCDPK07、CaCDPK14、CaCDPK13和CaCDPK26只在根、莖、葉中高表達(dá)。此外,每個亞族的表達(dá)情況也具有一定差異性,如Ⅰ亞族的基因整體表達(dá)水平低于其他亞族的,有一半的基因表達(dá)水平較低,其他亞族不表達(dá)的基因比例較低;在授粉后直到果實變色7 d,有7個基因(CaCDPK28、CaCDPK02、CaCDPK04、CaCDPK30、CaCDPK03、CaCDPK23、CaCDPK15)一直處于不完全表達(dá)狀態(tài),多數(shù)為Ⅰ亞族。Ⅳ亞族同源基因?qū)Φ膬蓷l基因表達(dá)模式也發(fā)生了分化,CaCDPK12在各組織及發(fā)育時期均有表達(dá),而CaCDPK06表達(dá)較低,在部分發(fā)育時期或組織甚至不表達(dá)。
為進(jìn)一步探究辣椒CDPK基因家族在不同組織中表達(dá)分化的情況,以每千個堿基的轉(zhuǎn)錄每百萬映射讀取的碎片(fragments per hilobase million,FPKM)值大于50為篩選條件,對30個CDPK基因在根、莖、葉、花、花芽各組織中表達(dá)量進(jìn)行篩選統(tǒng)計,并構(gòu)建五個組織表達(dá)韋恩圖。由圖6-A可知,僅在花芽中高表達(dá)的基因有1個(CaCDPK11),在莖中的高表達(dá)基因也僅有1個(CaCDPK24),沒有基因單獨在根和葉中特異性表達(dá)。在花和花芽中同時高表達(dá)的基因有2個(CaCDPK23和CaCDPK15);在根、莖、葉中同時高表達(dá)的基因有5個(CaCDPK14、CaCDPK18、CaCDPK13、CaCDPK26和CaCDPK07),在莖、葉、花芽中高表達(dá)的基因有1個(CaCDPK16);在根、莖、葉、花組織中均同時表達(dá)的基因有2個(CaCDPK20和CaCDPK12),而在根、莖、葉、花芽組織中均同時表達(dá)的基因有1個(CaCDPK09);沒有基因同時在根、莖、葉、花、花芽中高表達(dá)。以上結(jié)果表明,CDPK基因的表達(dá)分化具有一定的組織特異性,在不同組織器官中發(fā)揮著各自特異的作用。
為了更好地研究辣椒CDPK基因之間的相互作用,對所有基因的表達(dá)數(shù)據(jù)進(jìn)行PCC統(tǒng)計,共有25個CDPK基因之間有著不同程度的相關(guān)性,根據(jù)基因?qū)χg的相關(guān)性強(qiáng)弱劃分為0.9<PCC<1.0、0.8<PCC<0.9及-0.8<PCC<-0.7,并構(gòu)建共表達(dá)網(wǎng)絡(luò)圖。由圖6-B可 知,CaCDPK15、CaCDPK01、CaCDPK23、CaCDPK21、CaCDPK28、CaCDPK02、CaCDPK03、CaCDPK30這8個基因之間相關(guān)性最強(qiáng),PCC均達(dá)到了0.9以上。此外,CaCDPK20、CaCDPK14、CaCDPK24、CaCDPK18之間也具有很強(qiáng)的相關(guān)性,且除了CaCDPK20基因外其他均屬于Ⅰ亞族。在25個點構(gòu)成的表達(dá)網(wǎng)絡(luò)圖中,構(gòu)成了3個共表達(dá)網(wǎng)絡(luò)圖,其中有15個基因?qū)χg呈負(fù)調(diào)控。以上結(jié)果表明,CaCDPK基因之間具有相互協(xié)作,共同影響組織器官發(fā)育的作用。
在植物生長發(fā)育過程中,CDPK在鈣信號轉(zhuǎn)導(dǎo)途徑中發(fā)揮著重要的作用[6]。但目前,對辣椒CDPK基因家族的系統(tǒng)分析還不全面。本研究在我國當(dāng)?shù)乩苯菲贩N遵辣1號和墨西哥地方品種CM334基因組中分別發(fā)現(xiàn)30和28個CDPK基因,與前人鑒定的CM334CDPK基因相比[24],刪除了4個缺失EF-hand結(jié)構(gòu)域的基因(CA10g13810、CA00g67180、CA10g17200、CA09g10260)和 1個拼接不完整的基因(CA00g24640),并增加2個基因(CA01g23320、CA07g10190)。在CM334中,CDPK分布在9條染色體上;而在遵辣1號基因組中,CDPK分布在11條染色體上。對比兩個辣椒栽培種的CDPK序列,24個同源基因?qū)χ杏?對基因相似度(identity)達(dá)到100%,剩余16對平均為97.6%,非直系同源基因?qū)﹂g相似度平均為76.1%。此外,同源基因的表達(dá)模式也發(fā)生了明顯的分歧,例如,在CM334中,有4條基因在花器官中高表達(dá)[24],而遵辣1號中只有2條。表明CDPK基因在兩個不同栽培品種的基因組中既有極大的保守性又發(fā)生了部分分化,可能是在不同的環(huán)境下,不同選擇壓力造成的。
在孑遺植物無油樟之后的被子植物基因組均經(jīng)歷了不同程度的多倍化事件,部分基因在復(fù)制后被保留[30]。辣椒中CDPK基因數(shù)目明顯多于無油樟(12個)[31]、黃瓜[20]和葡萄[21],與番茄(29個)數(shù)目相近[19],說明物種在進(jìn)化過程中,不同的加倍事件影響了相關(guān)重要基因的保留情況,茄科植物特有的全基因組三倍化事件使辣椒的CDPK基因發(fā)生了明顯的擴(kuò)增。
從無油樟開始,CDPK在被子植物中就穩(wěn)定分為4個亞族[16]。本研究中,辣椒的CDPK基因家族成員同樣被劃分為4個亞族(Ⅰ、Ⅱ、Ⅲ、Ⅳ)。同擬南芥和番茄相比,辣椒和番茄的基因成員在4個亞族中分布情況最為相似,說明它們具有較近的親緣關(guān)系,且具有明顯的直系同源關(guān)系。例如,SlCDPK6/CaCDPK25、SlCDPK19/CaCDPK27和CaCDPK19/SlCDPK25這3對直系同源基因,序列高度相似,推測成對直系同源基因在功能上也具有較好的保守性。此外,辣椒CDPK基因家族中還出現(xiàn)旁系同源基因?qū)?推測在長期進(jìn)化過程中,基因復(fù)制是CDPK基因家族擴(kuò)展的主要原因。擬南芥中除了片段復(fù)制,串聯(lián)復(fù)制(4號染色體上的CPK21/22/23/27/31)也是其擴(kuò)增的原因[5]。而根據(jù)共線性分析,在辣椒全基因組復(fù)制過程中,只有片段復(fù)制是CDPK基因家族擴(kuò)增的主要原因。
基因結(jié)構(gòu)是研究基因進(jìn)化和基因復(fù)制的重要分析依據(jù)。本研究對辣椒CDPK基因家族的結(jié)構(gòu)及內(nèi)含子的數(shù)量進(jìn)行了詳細(xì)分析。總體來看,辣椒的CDPK基因結(jié)構(gòu)比較復(fù)雜,同擬南芥和其他物種一致[5,29],內(nèi)含子數(shù)有5~13個不等,但基因長度明顯大于擬南芥相關(guān)基因,有的基因甚至達(dá)到23 kb,主要原因是內(nèi)含子長度明顯大于擬南芥。前人研究發(fā)現(xiàn)辣椒的基因組(~3.26 Gb)遠(yuǎn)大于擬南芥(125 Mb),主要原因是辣椒基因組上存在大量轉(zhuǎn)座子(transposable elements,TEs)原件[23],通過基因結(jié)構(gòu)來看,內(nèi)含子長度較長可能也影響了辣椒的基因組大小。
研究表明,在根、莖、葉、果實和種子等大部分器官中均發(fā)現(xiàn)CDPK基因的存在[16],在植物生長發(fā)育過程中,CDPK蛋白參與了碳氮代謝、調(diào)節(jié)細(xì)胞骨架、離子和水分的跨膜運輸、氣孔運動、花粉發(fā)育和種子形成等[7-8,32]。本研究結(jié)果表明,在辣椒的生長發(fā)育過程中,部分基因表達(dá)具有明顯組織特異性,如CaCDPK15和CaCDPK03在花芽和花中有一定表達(dá),但是在根、莖、葉中均不表達(dá)。此類情況在其他物種中也出現(xiàn),如玉米中的1個CDPK基因只在花粉中表達(dá)[33];水稻spk基因只在未成熟的種子中表達(dá)[34],而同為禾本科作物的小麥,其TaCPK3在未成熟的種子中未表達(dá)[35]。AtCPK12通過負(fù)調(diào)控脫落酸(abscisic acid,ABA)信號促進(jìn)了種子萌發(fā)[36],而過表達(dá)OsCDPK2會打斷種子發(fā)育[37],說明不同基因在組織中的特異性表達(dá),對植物不同組織器官的生長發(fā)育起著特殊的調(diào)控作用。此外,本研究中另一部分基因在辣椒不同組織中的表達(dá)無明顯差異,如CaCDPK09、CaCDPK18、CaCDPK20、CaCDPK12這4個基因在辣椒各組織中表達(dá)量差異不大;還有一部分基因在各組織中均有表達(dá),但表達(dá)量有明顯差異,如CaCDPK14和CaCDPK26在根、莖、葉中的表達(dá)量高于花芽和花,相反,CaCDPK01和CaCDPK21在花芽和花中的表達(dá)量高于根、莖、葉。在蠶豆中也有類似情況,VfCPK1在各組織中均表達(dá),但在葉片和下表皮中的表達(dá)量高于根、莖和葉肉[38]。根據(jù)不同組織表達(dá)量的差異,推測基因在植物不同組織中調(diào)控生長發(fā)育的作用程度可能不同。
本研究基于辣椒遵辣1號基因組及轉(zhuǎn)錄組,在全基因組水平上對辣椒CDPK基因家族進(jìn)行系統(tǒng)鑒定分析。結(jié)果表明,在辣椒中共鑒定獲得30個辣椒CDPK基因,分布在11條染色體上,可分為4個亞族。CDPK基因在遵辣1號和CM334兩個辣椒品種中發(fā)生了分化。CaCDPKs在辣椒不同組織中差異表達(dá),同源基因間功能發(fā)生了分化。本研究結(jié)果為進(jìn)一步探索CaCDPK的基因功能和進(jìn)化模式提供了一定的研究基礎(chǔ)。