韓繼紅,劉金鳳,劉慧敏*
1.濮陽市市容環境衛生管理處,河南 濮陽457000
2.中國林業科學研究院經濟林研究開發中心,國家林業和草原局泡桐研究開發中心,經濟林種質創新與利用國家林業和草原局重點實驗室,河南 鄭州450003
YABBY 是種子植物特有的一個小基因家族[1],該基因家族編碼的轉錄因子包括兩個保守的結構域:N 末端一個鋅指結構和C 末端一個YABBY 結構(螺旋-環-螺旋)[2,3]。目前在所有被子植物中鑒別到的YABBY家族可分為5 個亞家族,分別為CRABS CLAW(CRC)、FILAMENTOUS FLOWER(FIL)/YABBY3(YAB3),INNER NO OUTER(INO),YABBY2(YAB2)和YABBY5(YAB5)[4,5],每個亞家族都包括一個早期分化的ANA 被子植物序列,表明現存開花植物最后的共同祖先中至少有5 個YABBY基因。YABBY基因在植物中參與多種生物過程,在葉片和葉片衍生器官的發育中起關鍵作用,例如子葉、花器官、外胚珠外皮發育、維持細胞極性、葉邊緣建成和葉片生長[6-9]。擬南芥中,YABBY在營養器官中主要是在側向器官的背面表達,并且在葉片和抑制莖尖分生組織過程中有重復的功能[7,10-12]。越來越多的證據表明,不管是核心雙子葉植物還是單子葉植物,YABBY在營養器官中有相似的功能[13-15]。
桃是一種重要的落葉果樹,通常認為是5000 多年前在中國長江或珠江中下游馴化而來的,現已在世界各地得到廣泛種植[16]。由于桃果實色澤艷麗、風味佳美、營養豐富,深受各國消費者的喜愛。由于桃樹二倍體(2n=16),且基因組較?。s220 M),使得桃成為研究果樹比較基因組學和功能基因組學的模式物種。桃基因組測序的完成為從基因組層面全面鑒定及研究該物種中的基因家族提供了基礎[17]。本研究基于桃基因組最新組裝及注釋版本,系統鑒定了桃中YABBY基因家族成員,并做了初步分析,為深入研究該基因家族在桃中的功能提供了理論依據。
桃基因組數據(v2.1)來源于Phytozome 植物基因組比較數據庫(https://phytozome.jgi.doe.gov/pz/portal.html),桃、擬南芥、水稻和無油樟YABBY 轉錄因子蛋白序列來源于PlantTFDB 植物轉錄因子數據庫(http://planttfdb.cbi.pku.edu.cn/)。
在Pfam 數據庫(http://pfam.xfam.org/)下載YABBY家族的隱馬爾科夫模型(PF04690),并使用HMMER 在桃蛋白序列數據庫中進行檢索,參數設置cut--ga。將檢索到的基因與2.1 中下載的YABBY基因進行比較,發現數據一致,提交到在線軟件SMART(smart.embl-heidelberg.de/)預測蛋白結構域,發現鑒別到的基因均含有YABBY 保守結構域,說明鑒定數據可靠,可進行下一步分析。
桃YABBY基因推導蛋白序列特征分析使用在線軟件(https://web.expasy.org/compute_pi/),基因結構特征及在染色體上的分布使用TBtools 軟件可視化[18]。
進化樹構建的主要步驟為:(1)使用MAFFT 對蛋白序列進行對比分析(默認參數);(2)將序列比較結果導入FastTree 構建進化樹(默認參數);(3)使用MEGA 7 對構建好的進化樹進行可視化。
桃YABBY基因蛋白序列保守結構域的多重比較使用MAFFT(默認參數),比較結果使用在線軟件ESPript 3(http://espript.ibcp.fr/ESPript/ESPript/index.php)進行可視化。
桃YABBY基因啟動子(上游2000 bp)順式作用元件的預測使用在線軟件PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),使用TBtools 進行可視化[18]。
通過在植物轉錄因子數據庫中搜索和使用YABBY 的隱馬爾科夫模型(PF04690)在桃基因組中進行比對,發現兩種方法鑒別到的桃YABBY基因一致,均為6 個基因,表明本次數據鑒定結果準確。
對鑒別到的6 個桃YABBY基因的推導蛋白序列進行分析,發現桃中YABBY基因可轉錄成15 個轉錄本,編碼15 個蛋白序列。對這15 個推導蛋白序列進行在線分析,發現其序列長度從136 到232個氨基酸不等,分子量變化范圍為:15.6~25.9 kDa,等電點范圍:5.29~9.30,且均含有YABBY 保守結構域(表1)。

表1 桃YABBY 家族基因基本信息統計Table 1 Basic information statistics of YABBY gene family in Prunus persica

圖1 桃YABBY 家族基因結構Fig.1 Gene strusture of YABBY in Prunus persica
真核生物的基因通常為不連續基因,即編碼區的序列(外顯子)是不連續的,會被非編碼序列(內含子)隔開。基因起始和終止密碼子兩側的序列即側翼序列,為非編碼序列,通常包括能夠調控基因表達的元件。通過對桃YABBY基因的結構進行分析,發現YABBY基因的內含子數量較多(4-6個),結構較為復雜(圖1)。由于可變剪切,同一個基因存在多個轉錄本的情況較多,僅Prupe.1G250500和Prupe.5G075800 只有一個轉錄本;Prupe.1G290100 有3 個轉錄本,均含有6 個內含子;Prupe.2G140400 有4 個轉錄本,其中轉錄本1 和2 含有6 個內含子,轉錄本3 和4 含有5 個內含子;Prupe.6G147600 有4 個轉錄本,其中轉錄本1 和2 含有5 個內含子,轉錄本3 和4 含有4 個內含子;Prupe.7G245200 有2 個轉錄本,分別含有6 個和5 個內含子(圖1)。
系統進化樹主要基于序列的相似性進行構建,可反應基因之間的相似程度,進而推測基因的功能。本研究基于桃、擬南芥、水稻和無油樟基因組中YABBY的蛋白序列,采用最大似然法構建了YABBY家族的系統進化樹,發現YABBY基因家族可明顯分為5 類,且每一類別中均有桃YABBY基因,說明桃基因組中含有植物YABBY基因家族的全部類別(圖2)。

圖2 桃、擬南芥、水稻和無油樟YABBY 家族進化樹Fig.2 YABBY family evolutionary tree of Prunus persica,Arabidopsis,rice and Amborella trichopoda
將桃YABBY基因家族的保守序列進行多序列比較,發現桃中6 個YABBY 家族成員均含有C2C2鋅指結構和YABBY(螺旋-環-螺旋)保守結構(圖3),Prupe.6G147600 的第4 條轉錄本和Prupe.7G242500的第2條轉錄本的鋅指結構不完整,Prupe.2G140400的第3和第4條轉錄本的YABBY結構不完整。鋅指結構中的sheet3 較sheet1 和sheet2 更為保守,coil3 和coil4 的差異大于coil1 和coil2;YABBY 結構域中的coil1 和coil2 的保守性高于coil3,helix1、helix2 和sheet 部分序列保守性均較高。

圖3 桃YABBY 基因家族保守結構域Fig.3 Conserved domains of YABBY gene family in Prunus persica
基于桃基因組的組裝和注釋結構,將桃YABBY基因在染色體上的分布進行可視化。發現桃YABBY基因分布在5 條染色體上(圖4),分別為1、2、5、6、7 號染色體,其中Prupe.1G250500(INO 類)和Prupe.1G290100(CRC 類)均分布在1 號染色體上,FIL/YAB3 類Prupe.2G140400 和Prupe.5G075800分別分布在2 號和5 號染色體上;Prupe.6G147600(YAB2 類)和Prupe.7G245200(YAB5 類)分別分布在6 號和7 號染色體上。

圖4 桃YABBY 家族基因在染色體上的分布Fig.4 YABBY gene distribution on the chrosomes of Prunus persica
啟動子一般是位于轉錄起始位點上游的非編碼區列,除含有轉錄起始的核心元件,通常還含有多種誘導元件,例如激素響應元件、干旱誘導元件、光應答元件等。本研究對YABBY基因家族成員轉錄起始位點上游2000 bp 的啟動子區域進行順式作用元件預測,發現YABBY基因的啟動子區域含有大量誘導元件,包括光應答、茉莉酸甲酯響應、脫落酸響應等元件。其中,Prupe.1G250500 特異性含有干旱誘導元件,Prupe.7G245200.1 特異含有種子調控元件(圖5)。

圖5 桃YABBY 基因啟動子中鑒別到的順式作用元件Fig.5 Cis-element identified in gene promoters of YABBYs in Prunus persica
YABBY 是種子植物特有的一類轉錄因子,被子植物的中的YABBY家族成員在葉片以及葉片的衍生器官發育中發揮關鍵作用[4,7,10,19]。本研究基于桃最新基因組組裝及注釋結果,在桃中鑒定到6個YABBY基因,總共15 個轉錄本,可翻譯成15 個的蛋白質,蛋白質的長度范圍為136~232 個氨基酸,序列較短,與前人研究發現YABBY 蛋白較小的結果一致[19]。
內含子是真核生物特有的序列,一般在會轉錄在前體mRNA中,然后經過剪切產生成熟的mRNA,不同的剪切方式能產生不同的轉錄本,從而翻譯為不同的蛋白質,在基因的可變剪切中發揮重要作用[20]。對YABBY基因結構進行分析,發現該家族基因的內含子較多(4~6 個),結構較為復雜,與桃中該基因家族有較多的轉錄本(15 個)的結果一致。
系統進化樹不僅能揭示物種親緣關系的遠近,也能反映基因序列的相似程度,從而推測基因的功能。通過構建桃、擬南芥、水稻和無油樟YABBY基因的系統進化樹,發現桃中含有植物YABBY家族的所有類別。Prupe.1G290100 屬于CRC 類,該類基因在被子植物的心皮和核心雙子葉植物的蜜腺發育中起調節作用[21-24]。Prupe.6147600 屬于YAB2 類,擬南芥中該類基因參與外側器官遠軸端細胞分化的方向[7]。Prupe.7G245200 屬于YAB5 類,植物中該類基因主要在子葉、葉片和花器官中表達[13,25]。Prupe.1G250500 屬于INO 類,該基因在胚珠外膜的形成和不對稱生長中必不可少[26]。Prupe.2G140400 和Prupe.5G075800 屬于FIL/YAB3,擬南芥中該類基因參與花和果實的發育[7]。
YABBY基因編碼的蛋白通常在N 末端有一個鋅指結構,在C 末端有一個螺旋-環-螺旋結構,即YABBY 結構域[18]。多序列比對結果顯示6 個基因編碼的YABBY 蛋白均含有上述兩個保守結構域,其中4 條轉錄本的鋅指結構或YABBY 結構不完整,這些轉錄本編碼大蛋白是否能行使YABBY 轉錄因子的功能,需要進一步驗證。
啟動子區域的順式作用元件對于基因的表達有重要影響,本研究發現桃YABBY基因的啟動子區域包含光應答、茉莉酸甲酯響應和脫落酸響應等多種順式元件,表明該基因的表達可能會受到環境、激素等的影響。Prupe.7G245200.1(YAB5 類)特異含有種子調控元件,可能與該類基因參與子葉的發育有關[7]。