陳雅心 戶(hù)奧鋒 張力銘 劉權(quán)權(quán) 楊路明 朱華玉 劉東明



摘 ? ?要:KNOX基因家族是編碼同源異型盒蛋白的轉(zhuǎn)錄因子,在植物生長(zhǎng)發(fā)育和脅迫響應(yīng)中發(fā)揮著重要的調(diào)控作用。為進(jìn)一步挖掘西瓜KNOX轉(zhuǎn)錄因子家族成員信息,探究分析其表達(dá)模式及基因功能,通過(guò)生物信息學(xué)方法對(duì)西瓜KNOX基因家族成員進(jìn)行了鑒定,并對(duì)其理化性質(zhì)、基因結(jié)構(gòu)、系統(tǒng)進(jìn)化及表達(dá)模式進(jìn)行了分析。結(jié)果表明,西瓜基因組中共有12個(gè)KNOX基因,均定位于細(xì)胞核中,符合轉(zhuǎn)錄因子屬性特征;KNOX1、KNOX2、ELK和Homeobox_KN這4類(lèi)典型結(jié)構(gòu)域均存在于大多數(shù)西瓜KNOX基因中,表明這4類(lèi)結(jié)構(gòu)域在KNOX基因功能中具有重要作用;系統(tǒng)發(fā)育分析將ClKNOX基因家族成員分為Class Ⅰ A、Class Ⅰ B、Class Ⅱ A和Class Ⅱ B 4個(gè)亞組,啟動(dòng)子元件分析表明,ClKNOX基因家族含有較多與生長(zhǎng)發(fā)育和脅迫響應(yīng)相關(guān)的順式作用調(diào)控元件;組織表達(dá)分析結(jié)果表明,ClKNOX基因具有明顯的組織特異表達(dá)特性,ClKNOX6和ClKNOX11在根和莖中高表達(dá),而ClKNOX3和ClKNOX10在所有器官中表達(dá)量都相對(duì)較高,但所有ClKNOX基因在果肉中的相對(duì)表達(dá)量都較低。研究結(jié)果為進(jìn)一步深入探究ClKNOX基因在生長(zhǎng)發(fā)育中的功能和組織表達(dá)特性奠定了基礎(chǔ)。
關(guān)鍵詞:西瓜;KNOX基因家族;全基因組鑒定;生物信息學(xué)分析;組織表達(dá)
中圖分類(lèi)號(hào):S651 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-2871(2024)05-018-10
Genome-wide identification and expression analysis of ClKNOX gene family in watermelon
CHEN Yaxin, HU Aofeng, ZHANG Liming, LIU Quanquan, YANG Luming, ZHU Huayu, LIU Dongming
(Horticulture College of Henan Agricultural University, Zhengzhou 450046, Henan, China)
Abstract: KNOTTED-like homeodomain(KNOX)gene family is a class of transcription factors encoding homeobox protein, which plays an important role in plant growth and stress responses. To further investigate the watermelon KNOX transcription factor family members, the bioinformatics methods was utilized to identify and analyze their physical and chemical properties, gene structure, phylogeny, and expression patterns. The study revealed the presence of 12 KNOX genes in the watermelon genome, all of which were identified in the nucleus, the result was consistent with their characteristics as transcription factors. Most KNOX genes in watermelon exhibited the typical domains KNOX1, KNOX2, ELK, and Homeobox_KN, suggesting the significance of these domains in KNOX gene functionality. Phylogenetic analysis categorized ClKNOX gene family members into four subgroups: ClassⅠA, ClassⅠB, ClassⅡA, and ClassⅡB. Analysis of promoter elements indicated that the ClKNOX gene family harbored numerous cis-acting regulatory elements associated with growth, development, and stress response. The results of tissue expression analysis revealed distinct patterns for ClKNOX gene expression. Specifically, ClKNOX6 and ClKNOX11 exhibited high expression levels in roots and stems, whereas ClKNOX3 and ClKNOX10 showed relatively high expression across all organs. However, all ClKNOX genes had low relative expression levels in flesh. These findings provide a basis for future investigations into the functional roles and tissue-specific expression patterns of ClKNOX genes in growth and development.
Key words: Watermelon; KNOX gene family; Genome-wide identification; Bioinformatics analysis; Tissue expression
西瓜[Citrullus lanatus (Thunb.) Matsum. and Nakai]為葫蘆科西瓜屬一年生蔓生草本植物,富含多種維生素和對(duì)人體有益的瓜氨酸、番茄紅素等營(yíng)養(yǎng)成分,無(wú)論鮮食還是制成果汁、糖果或蘸醬等都深受世界各地消費(fèi)者的喜愛(ài)。同源異型盒基因家族(homeobox gene family)在動(dòng)物和植物發(fā)育調(diào)控中具有重要作用,該基因家族包含高度保守的180個(gè)堿基對(duì),編碼一個(gè)含有60個(gè)氨基酸的三螺旋結(jié)構(gòu)域,最早被克隆的homeobox基因來(lái)自果蠅[1],隨后植物中第一個(gè)homeobox基因——Knotted-1在玉米中被分離獲得[2]。近年來(lái)研究發(fā)現(xiàn),該基因家族廣泛存在于陸生植物類(lèi)群和特定的綠藻門(mén)植物中,但在紅藻植物中尚未被發(fā)現(xiàn)[3-4]。根據(jù)是否含有一個(gè)三氨基酸的環(huán)延伸基序,homeobox類(lèi)基因被分為T(mén)ALE和non-TALE兩類(lèi)[5],在動(dòng)物中已經(jīng)鑒定出4種類(lèi)型的TALE基因,分別為MEIS、IRO、TGIF和PBC,而在植物中僅有KNOX(KNOTTED-like homobox)和BELL(BELL-like)兩類(lèi)基因被鑒定[6]。KNOX類(lèi)基因通常含有4個(gè)典型結(jié)構(gòu)域,分別為負(fù)責(zé)識(shí)別下游靶基因啟動(dòng)子序列的C端同源結(jié)構(gòu)域 (Homeobox_KN)、N端的KNOX1和KNOX2以及參與轉(zhuǎn)錄抑制核定位信號(hào)、促進(jìn)蛋白質(zhì)-蛋白質(zhì)相互作用的ELK結(jié)構(gòu)域。由于MEIS和KNOX家族基因結(jié)構(gòu)相似,KNOX1和KNOX2結(jié)構(gòu)域也稱(chēng)為MEINOX結(jié)構(gòu)域,在他們的同源盒中,在第一和第二螺旋之間還有3個(gè)額外的氨基酸 (P-Y-P)[6-7],該類(lèi)結(jié)構(gòu)域參與抑制靶基因表達(dá)和同二聚化。
根據(jù)序列相似性、內(nèi)含子位置、系統(tǒng)發(fā)育關(guān)系和表達(dá)特點(diǎn),KNOX類(lèi)基因常分為I類(lèi)、II類(lèi)和M類(lèi)[4,8-9]。I類(lèi)亞家族包括SHOOT MERISTEMLESS (STM)、KNAT1、KNAT2和KNAT6 等4個(gè)成員。作為轉(zhuǎn)錄激活因子或抑制因子,I類(lèi)亞家族基因在分生組織發(fā)育、葉形狀的控制、激素穩(wěn)態(tài)方面發(fā)揮重要作用,常在莖頂分生組織中表達(dá)[3]。STM基因在莖頂端分生組織中負(fù)責(zé)維持并調(diào)節(jié)花序結(jié)構(gòu),KNAT1在擬南芥根中也顯示出細(xì)胞特異性表達(dá)模式[10],并與STM類(lèi)基因具有冗余性[11-13]。KNAT2在莖頂端分生組織和根組織中表達(dá)[14-15],而KNAT6在胚胎莖頂端分生組織、莖頂端分生組織邊界[14]和根韌皮部組織中表達(dá)[16]。II類(lèi)亞家族基因中,KNAT3、KNAT4和KNAT5在擬南芥根中顯示出細(xì)胞特異性表達(dá)模式[11]。KNAT3在幼果、花序和根中表達(dá)量最高,而KNAT4在葉片和幼果中表達(dá)量最高[17]。KNAT5在幼芽和根新發(fā)育的伸長(zhǎng)區(qū)表達(dá),在表皮中的表達(dá)可用來(lái)標(biāo)記細(xì)胞分裂和伸長(zhǎng)的邊界[11]。KNAT7在擬南芥根的中央部位高度表達(dá)[18],在擬南芥和楊樹(shù)中與次生壁形成有關(guān)[19]。M類(lèi)亞家族包含KNATM基因,在葉片近端-遠(yuǎn)端模式中起作用,并在成熟器官邊界的器官原基近側(cè)域中表達(dá)[9]。
我國(guó)西瓜種植面積和產(chǎn)量常年居世界第一位[20]。近年來(lái),隨著分子生物學(xué)技術(shù)的不斷發(fā)展和西瓜參考基因組數(shù)據(jù)的不斷優(yōu)化,以精準(zhǔn)定向聚合優(yōu)異基因的分子育種已成為西瓜育種技術(shù)的主要發(fā)展方向。明確重要性狀調(diào)控基因是實(shí)現(xiàn)從傳統(tǒng)常規(guī)育種向分子標(biāo)記輔助育種轉(zhuǎn)型的基礎(chǔ)。KNOX家族基因具有組織特異性表達(dá)的特點(diǎn),且在植物器官發(fā)育調(diào)控中具有重要作用。目前KNOX家族基因在葫蘆科作物中的報(bào)道僅局限于黃瓜和瓠瓜,在黃瓜中有研究表明,KNOX家族基因TKN2和TKN4與APRR2表達(dá)模式一致,推測(cè)其可能共同調(diào)控黃瓜葉綠體代謝機(jī)制[21]。在瓠瓜上已經(jīng)進(jìn)行了KNOX全基因組水平的鑒定和組織表達(dá)分析[22],而針對(duì)西瓜還未有系統(tǒng)的研究報(bào)道。筆者在全基因組水平上對(duì)西瓜KNOX基因家族成員進(jìn)行了鑒定分析,共篩選獲得了12個(gè)西瓜KNOX基因,對(duì)其理化性質(zhì)、亞細(xì)胞定位、系統(tǒng)進(jìn)化樹(shù)、染色體定位和啟動(dòng)子元件進(jìn)行了分析,并選用遺傳性狀穩(wěn)定的西瓜材料WT2來(lái)探究其組織表達(dá)模式,以期為進(jìn)一步了解KNOX的進(jìn)化特征和功能提供參考。
1 材料與方法
1.1 植物材料
試驗(yàn)材料西瓜高代自交系WT2,由河南農(nóng)業(yè)大學(xué)園藝學(xué)院瓜類(lèi)作物基因組與分子育種實(shí)驗(yàn)室收集保存,性狀穩(wěn)定遺傳。試驗(yàn)于2023年5-11月在河南農(nóng)業(yè)大學(xué)園藝學(xué)院瓜類(lèi)作物基因組與分子育種實(shí)驗(yàn)室進(jìn)行。
取籽粒飽滿(mǎn)的WT2西瓜種子,55 ℃溫湯浸種催芽后播種于穴盤(pán)中,放置在人工氣候箱(28 ℃,16 h光照/8 h黑暗,相對(duì)濕度70%)內(nèi)。于3葉1心時(shí)定植在溫室大棚中,并合理實(shí)施澆水施肥、病蟲(chóng)害防治等栽培管理措施,開(kāi)花期嚴(yán)格自交授粉。授粉后28 d分別取根、莖、葉、花、果皮和果肉等組織部位,采用隨機(jī)區(qū)組法進(jìn)行取樣,每個(gè)樣本設(shè)置3次重復(fù)。所有樣品用錫箔紙包裹后放于液氮中速凍,隨后存放于-80 ℃超低溫冰箱備用。
1.2 方法
1.2.1 ClKNOX基因家族成員的鑒定和理化性質(zhì)預(yù)測(cè) 西瓜參考基因組、蛋白序列及注釋文件均來(lái)自葫蘆科基因組數(shù)據(jù)庫(kù)(http://cucurbitgenomics.org/organism/21),采用97103-V2版本數(shù)據(jù)[23]。擬南芥(Arabidopsis thaliana L.)參考基因組、蛋白序列、注釋文件及KNOX基因家族成員數(shù)據(jù)均下載自TAIR網(wǎng)站(https://www.arabidopsis.org/index.jsp)。KNOX基因家族結(jié)構(gòu)域的隱馬爾科夫模型文件下載于pfam數(shù)據(jù)庫(kù) (http://pfam.Xfam.org/)[24]。為獲得準(zhǔn)確的ClKNOX基因鑒定信息,首先在pfam數(shù)據(jù)庫(kù)下載KNOX基因家族結(jié)構(gòu)域的隱馬爾科夫模型文件,使用hmmer軟件對(duì)西瓜蛋白數(shù)據(jù)庫(kù)進(jìn)行比對(duì)搜索[25];然后以擬南芥KNOX蛋白序列為探針,在西瓜基因組數(shù)據(jù)庫(kù)進(jìn)行搜索。將以上兩種方法獲得的KNOX蛋白序列在NCBI-CDD網(wǎng)站(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 進(jìn)行保守結(jié)構(gòu)域鑒定,得到含有KNOX結(jié)構(gòu)域的候選蛋白[26]。利用在線(xiàn)工具ProtParamtool (https://web.expasy.org/protparam/)分析西瓜KNOX家族成員的氨基酸數(shù)目、蛋白分子質(zhì)量、等電點(diǎn)等理化特性[27]。利用Cell-PLoc2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)預(yù)測(cè)各基因的亞細(xì)胞定位[28]。
1.2.2 ClKNOX基因的染色體定位和基因結(jié)構(gòu)分析 從葫蘆科基因組數(shù)據(jù)庫(kù)獲得每條染色體的長(zhǎng)度和ClKNOX基因的位置信息,結(jié)合TBtools軟件繪制ClKNOX的染色體定位圖。基于葫蘆科基因組數(shù)據(jù)庫(kù)(http://cucurbitgenomics.org/)中提取的西瓜所有ClKNOX基因的基因組序列和CDS序列信息,利用GSDS 2.0程序(http://gsds. gao-lab.org/)分析ClKNOX的外顯子和內(nèi)含子[29],利用MEME(http://meme-suite.org/tools/meme)分析ClKNOX蛋白的保守基序[30],并通過(guò)TBtools軟件對(duì)基因結(jié)構(gòu)和蛋白保守基序進(jìn)行可視化分析[31]。
1.2.3 ClKNOX家族的系統(tǒng)進(jìn)化和啟動(dòng)子順式作用元件分析 從葫蘆科基因組數(shù)據(jù)庫(kù)(http://cucurbitgenomics.org/)、擬南芥數(shù)據(jù)庫(kù)(https://www.arabidopsis.org/)和水稻基因組數(shù)據(jù)庫(kù)(http://rice.plantbiology.msu.edu/)獲得西瓜、甜瓜、黃瓜、葫蘆、瓠瓜、冬瓜、水稻和擬南芥KNOX家族成員編碼的氨基酸序列,利用MUSCLE (http://www.drive5.com/muscle/)軟件對(duì)所有KNOX蛋白序列進(jìn)行比對(duì),并利用Jalview (http://www.jalview.org/)軟件對(duì)比對(duì)結(jié)果進(jìn)行編輯[32]。利用IQ-TREE (http://www.iqtree.org/) 的最大似然方法構(gòu)建KNOX的系統(tǒng)發(fā)育樹(shù),并將Bootstrap參數(shù)設(shè)置為1000[33]。從葫蘆科基因組數(shù)據(jù)庫(kù)中獲得ClKNOX基因編碼序列上游2000 bp的基因組DNA序列,然后利用PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對(duì)ClKNOX基因啟動(dòng)子區(qū)域的順式作用元件進(jìn)行分析[34],使用TBtools軟件對(duì)元件的數(shù)量與分布進(jìn)行可視化分析。
1.2.4 ClKNOX基因的組織表達(dá)分析 取西瓜各組織樣品置于含有液氮的研缽中迅速研磨成粉末,在研磨過(guò)程中不斷向研缽中加入液氮,防止樣品在空氣中暴露時(shí)間過(guò)長(zhǎng)造成降解。后續(xù)步驟參照北京華越洋RNA提取試劑盒對(duì)各組織部位總RNA進(jìn)行提取,通過(guò)凝膠電泳和超微量分光光度計(jì)(P200+, Plextech, USA)檢測(cè)RNA質(zhì)量,用諾維贊反轉(zhuǎn)錄試劑盒通過(guò)兩步法反轉(zhuǎn)錄成cDNA。
根據(jù)葫蘆科基因組數(shù)據(jù)庫(kù)(http://cucurbitgenomics.org/)和NCBI (https://blast.ncbi.nlm.nih.gov/Blast.cgi)[35]網(wǎng)站設(shè)計(jì)特異性定量引物(表1)。以ClActin為內(nèi)參基因,按照熒光定量PCR試劑盒步驟,以西瓜cDNA為模板檢測(cè)基因的表達(dá)量,每個(gè)檢測(cè)樣本設(shè)置3個(gè)生物學(xué)重復(fù)和3個(gè)技術(shù)重復(fù),采用StepOneOlusTMReal-Time PCR儀 (Thermo Scientific, Massachusetts, USA)進(jìn)行熒光定量分析,并按照2-△△Ct的方法計(jì)算基因相對(duì)表達(dá)量[36]。
2 結(jié)果與分析
2.1 ClKNOX家族基因的鑒定
KNOX蛋白包含4個(gè)保守結(jié)構(gòu)域,從N端到C端依次為KNOX1、KNOX2、ELK和Homeobox_KN。西瓜中這4個(gè)結(jié)構(gòu)域的基因數(shù)分別為11、9、8和21個(gè),但僅有11個(gè)成員同時(shí)包含Homeobox_KN結(jié)構(gòu)域和其他類(lèi)型的結(jié)構(gòu)域。為了獲得準(zhǔn)確的數(shù)據(jù),以9個(gè)擬南芥AtKNOX蛋白序列在西瓜蛋白數(shù)據(jù)庫(kù)進(jìn)行blast檢索,通過(guò)序列同源比對(duì),最終從西瓜基因組數(shù)據(jù)庫(kù)中獲得了12個(gè)ClKNOX成員。綜合上述兩種分析方法,鑒定到12個(gè)西瓜ClKNOX蛋白,根據(jù)基因所在染色體位置分別命名為ClKNOX1 ~ ClKNOX12(表2)。理化特性分析結(jié)果(表2)表明,西瓜KNOX家族基因編碼蛋白分子質(zhì)量為13.59(ClKNOX9)~51.78 ku(ClKNOX5),編碼氨基酸為116(ClKNOX9)~467個(gè)(ClKNOX10和ClKNOX5),蛋白等電點(diǎn)為4.44(ClKNOX8)~8.89(ClKNOX9)。亞細(xì)胞定位預(yù)測(cè)結(jié)果表明,所有ClKNOX基因都定位在細(xì)胞核中(表2),這與KNOX基因的轉(zhuǎn)錄因子屬性特征相符。
2.2 ClKNOX家族基因的染色體位置和基因結(jié)構(gòu)
染色體定位結(jié)果表明,西瓜ClKNOX基因家族的12個(gè)家族成員集中分布于5條不同的染色體上(圖1-A)。其中,5號(hào)染色體和8號(hào)染色體上分布有3個(gè)家族成員,成員數(shù)量最多,1、2、6號(hào)染色體上則分別分布有2個(gè)家族成員,其他染色體上沒(méi)有ClKNOX基因。西瓜ClKNOX基因家族成員中,ClKNOX8和ClKNOX9分布于6號(hào)染色體上,且相鄰物理距離僅為4.62 kb,推斷其為串聯(lián)重復(fù)基因簇。由圖1-B可以看出,西瓜ClKNOX家族基因均含有內(nèi)含子,且內(nèi)含子數(shù)目和長(zhǎng)度差異較大。其中,ClKNOX8和ClKNOX9只含有1個(gè)內(nèi)含子,ClKNOX2和ClKNOX3含有3個(gè)內(nèi)含子,ClKNOX1、ClKNOX4、ClKNOX6、ClKNOX7、ClKNOX11和ClKNOX12均含有4個(gè)內(nèi)含子,ClKNOX5和ClKNOX10含有5個(gè)內(nèi)含子。
2.3 ClKNOX家族的系統(tǒng)進(jìn)化分析
通過(guò)對(duì)甜瓜、黃瓜、冬瓜、瓠瓜和水稻數(shù)據(jù)庫(kù)的檢索,并對(duì)其保守結(jié)構(gòu)域分析驗(yàn)證,最終分別在各作物上獲得的KNOX基因數(shù)量為12、11、11、12和13個(gè)。將這些基因與獲得的12個(gè)ClKNOX基因和8個(gè)ATKNOX基因編碼的氨基酸序列結(jié)合,利用MUSCLE、Jalview和IQ-TREE軟件構(gòu)建KNOX系統(tǒng)發(fā)育樹(shù)。由圖2可以看出,所有KNOX基因家族分為Class Ⅰ和Class Ⅱ兩個(gè)分支,其中KNOX Class Ⅰ又進(jìn)一步分為ⅠA和ⅠB 2個(gè)亞組;KNOX Class Ⅱ分為ⅡA和ⅡB 2個(gè)亞組。12個(gè)ClKNOX基因中屬于ClassⅠA的有5個(gè),其中ClKNOX2和ClKNOX3與AT1G62360.1屬于同一分支,親緣關(guān)系最近;ClKNOX6和AT4G08150.1屬于同一分支,ClKNOX9和ClKNOX11同屬于Class Ⅰ A亞組。Ⅰ B亞組有4個(gè)ClKNOX成員,分別是ClKNOX4、ClKNOX7、ClKNOX8和ClKNOX12,與AT1G70510.1和AT1G23380.1同屬于Ⅰ B亞組,親緣關(guān)系較近。Class II A亞組的成員最少,僅含有ClKNOX1,該基因與AT1G62990.1親緣關(guān)系最近,Class II B亞組含有2個(gè)ClKNOX成員,分別是ClKNOX5和ClKNOX10。
2.4 ClKNOX基因家族保守結(jié)構(gòu)域分析
ClKNOX基因家族的保守結(jié)構(gòu)域分析結(jié)果如圖3所示,西瓜KNOX基因保守性較強(qiáng)的8類(lèi)基序分別為Motif 1(RQVLLDWWNSHYKWPYPTEEEKVALAESTGLDQKQINNWFINQRKRHWKP)、Motif 2(IKAKILAHPLYPRLLSAYVDCQKVGAPPEVAPRLEEIRAES)、Motif 3(DPRAEDRELKDELLRKYSGYJSSLKZEFLKKKKKGKLPKDA)、Motif 4 (DPELDQ FMEAYCEMLVKYKEELSRPFREA)、Motif 5(AMEAVMACWEIEQSLQSLTGVSPGEGTGAT MSDDDDDQ)、Motif 6 (SEDMQFVVMDGAHPPYYA)、Motif 7 (TLFLNRIESQLSTLCNGSF)和Motif 8(DANLFDGSLEGHomeobox_KNAMGFGPLIPTESERS)。其中,Motif 1對(duì)應(yīng)Homeobox_KN結(jié)構(gòu)域,Motif 2對(duì)應(yīng)KNOX1結(jié)構(gòu)域,Motif 3對(duì)應(yīng)ELK結(jié)構(gòu)域,Motif 4對(duì)應(yīng)KNOX2結(jié)構(gòu)域。ClKNOX基因家族成員中,除了ClKNOX8和ClKNOX9基因,都含有4個(gè)典型的結(jié)構(gòu)域,即KNOX1、KNOX2、ELK和Homeobox_KN;ClKNOX9具有Homeobox_KN和ELK結(jié)構(gòu)域;ClKNOX8只含有KNOX1結(jié)構(gòu)域。4個(gè)Motif基序中,Motif 1、Motif 2、Motif 3出現(xiàn)頻次為11次,Motif 4的出現(xiàn)頻次為10次,由此可見(jiàn)ClKNOX家族基因結(jié)構(gòu)域高度保守。同時(shí),從進(jìn)化關(guān)系上看,親緣關(guān)系較近的同一亞家族的ClKNOX基因在基因結(jié)構(gòu)組成和蛋白結(jié)構(gòu)域分布上也具有較高保守性。
2.5 ClKNOX基因的啟動(dòng)子順式作用元件分析
順式作用元件在基因表達(dá)調(diào)控中具有重要作用,相似功能的基因可能在啟動(dòng)子中具有類(lèi)似的調(diào)控元件。為了更好地探究ClKNOX家族基因的表達(dá)調(diào)控機(jī)制,提取了ClKNOX家族成員的上游2000 bp的基因組序列,并結(jié)合PlantCARE數(shù)據(jù)庫(kù)對(duì)其順式作用元件進(jìn)行預(yù)測(cè)。結(jié)果如圖4所示,幾乎所有ClKNOX基因的啟動(dòng)子區(qū)域都存在4種類(lèi)型的順式作用元件,除了基本啟動(dòng)子元件外,還包括植物生長(zhǎng)發(fā)育、非生物脅迫反應(yīng)、激素反應(yīng)相關(guān)的啟動(dòng)子元件。作為與葉綠體發(fā)育緊密相關(guān)的基因家族,對(duì)其motif統(tǒng)計(jì)發(fā)現(xiàn),啟動(dòng)子中多種元件與光反應(yīng)相關(guān),數(shù)量占到了總元件數(shù)量的56.45%,如Box 4、GA-motif、MRE、GT1-motif、chs-CMA1a、G-box、GATA-motif、TCT-motif、I-box、TCCC-motif、ATCT-motif、G-box、ATC-motif、3-AF1 binding site、LAMP-element、chs-CMA2a、AE-box、Sp1、TCCC-motif、AAAC-motif和ACE等啟動(dòng)子元件均與光反應(yīng)有關(guān),表明其基因表達(dá)調(diào)控受光的影響較大。與逆境脅迫反應(yīng)相關(guān)元件約占20.97%,主要包含TC-rich repeats、ARE、LTR、MBS、WUN-motif等與植物厭氧、低溫、干旱、創(chuàng)傷等反應(yīng)相關(guān)的元件;與激素響應(yīng)相關(guān)的元件約占14.92%,主要包含ABRE、TATC-box、P-box、TGA-box、TCA-element等與脫落酸、赤霉素、生長(zhǎng)素、水楊酸等植物激素相關(guān)的元件;植物生長(zhǎng)發(fā)育相關(guān)元件約占7.26%,其中多為MSA-like、GCN4_motif、CAT-box、O2-site、AACA_motif、AT-rich element等響應(yīng)細(xì)胞周期調(diào)控、胚乳發(fā)育、分生組織表達(dá)等生長(zhǎng)發(fā)育過(guò)程的元件。綜上所述,ClKNOX基因可能在調(diào)節(jié)植物生長(zhǎng)發(fā)育和非生物脅迫響應(yīng)過(guò)程中發(fā)揮重要作用。
2.6 ClKNOX基因家族的組織表達(dá)分析
為探索ClKNOX家族基因在西瓜中的表達(dá)模式,采用熒光定量qRT-PCR的方法分析了其在西瓜WT2不同組織(根、莖、葉、花、果)中的表達(dá)量。由圖5可以看出,KNOX家族基因在西瓜不同組織中的表達(dá)差異較大。在根中,ClKNOX6和ClKNOX11的表達(dá)量較高,其次為ClKNOX3和ClKNOX10,其余基因的相對(duì)表達(dá)量都較低;在莖中,ClKNOX6的相對(duì)表達(dá)量最高,ClKNOX11、ClKNOX3、ClKNOX2的相對(duì)表達(dá)量次之;在葉片中,ClKNOX3和ClKNOX10的相對(duì)表達(dá)量較高,其余基因都只有微弱表達(dá);在花中,ClKNOX10和ClKNOX3的相對(duì)表達(dá)量較高,其次為ClKNOX6和ClKNOX2;在果皮中,ClKNOX10的相對(duì)表達(dá)量最高,其余基因的相對(duì)表達(dá)量都較低;在果肉中,大多ClKNOX基因的相對(duì)表達(dá)量都較低,ClKNOX8和ClKNOX12不表達(dá)。總體而言,ClKNOX6和ClKNOX11具有相似的表達(dá)模式,均在根和莖中具有相對(duì)較高的表達(dá)量,在其他器官中的表達(dá)量均較低。ClKNOX3和ClKNOX10在所有檢測(cè)組織中表達(dá)量均相對(duì)較高,而ClKNOX5和ClKNOX7在所有組織中幾乎都不表達(dá)。
3 討論與結(jié)論
作為一類(lèi)在植物中廣泛存在的轉(zhuǎn)錄因子家族,KNOX基因家族在植物的發(fā)育和形態(tài)建成中起著重要的調(diào)控作用,其家族成員在不同的組織和發(fā)育階段中表達(dá)具有差異性。隨著高通量測(cè)序技術(shù)的發(fā)展,KNOX家族基因已在多個(gè)物種中廣泛研究,但目前關(guān)于西瓜ClKNOX基因家族尚未有研究報(bào)道。筆者結(jié)合KNOX基因家族的典型結(jié)構(gòu)域特征和西瓜基因組數(shù)據(jù)庫(kù)信息,首次對(duì)ClKNOX基因家族進(jìn)行了鑒定,并對(duì)其基因結(jié)構(gòu)、蛋白質(zhì)保守結(jié)構(gòu)域、系統(tǒng)進(jìn)化和基因表達(dá)模式進(jìn)行分析,為進(jìn)一步研究ClKNOX基因的功能奠定了基礎(chǔ)。
KNOX基因廣泛存在于植物基因組中,且在不同物種中的數(shù)量差異較大,擬南芥中有8個(gè)[37],瓠瓜中有12個(gè)[22],水稻中有13個(gè)[38],楊樹(shù)中有15個(gè)[39],玉米[40]和蘋(píng)果[41]中各有22個(gè),筆者共鑒定出12個(gè)ClKNOX基因,數(shù)量與同為葫蘆科植物的瓠瓜相同,與擬南芥、蘋(píng)果、玉米的數(shù)量差異較大,這種現(xiàn)象通常是由基因進(jìn)化過(guò)程中的部分重復(fù)和串聯(lián)重復(fù)等造成的[42]。進(jìn)化分析結(jié)果表明,ClKNOX中存在多個(gè)序列相似度較高的基因,推斷其為同源基因。但染色體位置分析結(jié)果顯示僅有2個(gè)ClKNOX基因?yàn)榇?lián)重復(fù),推斷ClKNOX基因家族數(shù)目的擴(kuò)增主要由部分重復(fù)導(dǎo)致。亞細(xì)胞定位預(yù)測(cè)結(jié)果表明,12個(gè)ClKNOX基因全部定位于細(xì)胞核,這與瓠瓜等作物相似[22],并符合其轉(zhuǎn)錄因子的屬性,表明其在生長(zhǎng)發(fā)育中可能發(fā)揮著調(diào)控功能。
擬南芥KNOX基因Class Ⅰ亞家族有4個(gè)成員 (KNAT1、 KNAT2、 KNAT6 和STM),西瓜Class Ⅰ亞家族有9個(gè)成員基因;擬南芥KNOX基因Class Ⅱ亞家族也有4個(gè)成員 (KNAT3、KNAT4、 KNAT5 和KNAT7),西瓜Class Ⅱ亞家族基因成員為3個(gè),說(shuō)明在進(jìn)化過(guò)程中西瓜KNOX的Class Ⅰ亞家族成員發(fā)生數(shù)量的擴(kuò)增,而Class Ⅱ亞家族成員沒(méi)有發(fā)生大量擴(kuò)增,由此推斷Class Ⅰ亞家族基因可能更容易發(fā)生基因重復(fù)。前人研究表明,基因結(jié)構(gòu)與基因表達(dá)方式有密切的對(duì)應(yīng)關(guān)系[8]。Class Ⅰ類(lèi)成員(ClKNOX3、ClKNOX6、ClKNOX11)主要在根和莖中表達(dá)水平較高,在其他組織的表達(dá)水平均較低,這與其他植物KNOXⅠ類(lèi)基因的表達(dá)模式相符合,推測(cè)這些基因在西瓜分生組織的發(fā)育和調(diào)控中起著重要作用。西瓜12個(gè)KNOX基因家族成員中,9個(gè)都含有KNOX1、KNOX2、ELK和Homeobox_KN這4個(gè)典型的結(jié)構(gòu)域,但ClKNOX9只含有Homeobox_KN和ELK結(jié)構(gòu)域,而ClKNOX8只含有KNOX1結(jié)構(gòu)域。缺失部分保守結(jié)構(gòu)域的ClKNOX9和ClKNOX8可能是假基因,假基因的存在可能是基因復(fù)制不完全的結(jié)果,通常不具有完整的基因功能,但這些假基因的存在又為將來(lái)新基因的進(jìn)化提供了可能[43-44]。
WT2作為野生型親本,通過(guò)基因定位技術(shù)配置遺傳群體,已經(jīng)獲得了調(diào)控西瓜黃化[45]、綠花[46]、短下胚軸和果皮腹紋[47]等基因,是研究基因組織表達(dá)特性的理想材料。前期研究表明,KNOX基因在植物不同組織器官中的表達(dá)具有差異性[22,40,48]。筆者在本研究中發(fā)現(xiàn),ClKNOX基因家族成員在西瓜不同組織中的相對(duì)表達(dá)量同樣具有多樣性和較大的差異性。ClKNOX3和ClKNOX10在西瓜所有器官中表達(dá)量均相對(duì)較高,推測(cè)這兩個(gè)基因可能參與西瓜各主要器官的生長(zhǎng)發(fā)育進(jìn)程。而其他少數(shù)ClKNOX基因(如ClKNOX6和ClKNOX11)在根和莖中的表達(dá)水平相對(duì)較高,在葉、花和果實(shí)中的表達(dá)量普遍較低,這一表達(dá)水平與小麥[38]、瓠瓜[22]、大豆[49]等相似。ClKNOX6在根和莖中表達(dá)量最高,系統(tǒng)發(fā)育分析表明,ClKNOX6與瓠瓜Lsi04G014450位于同一進(jìn)化支,而在瓠瓜中的研究表明,Lsi04G014450在根和莖中的表達(dá)量同樣最高[22],兩基因具有相似的表達(dá)模式,推測(cè)該基因可能參與了西瓜根系的生長(zhǎng)發(fā)育和莖頂端分生組織的分化。ClKNOX10是ClKNOX家族成員中唯一在果皮中表達(dá)量較高的基因,推測(cè)其可能參與西瓜果皮的顏色調(diào)控。ClKNOX5和ClKNOX7在所有組織中幾乎都不表達(dá),推測(cè)其可能存在功能缺失。ClKNOX基因在不同組織中表達(dá)模式的差異性暗示了其功能表達(dá)的差異性,這為進(jìn)一步解析ClKNOX基因在西瓜生長(zhǎng)發(fā)育和形態(tài)建成中的作用奠定了重要基礎(chǔ)。
綜上所述,ClKNOX基因家族的組織表達(dá)模式和啟動(dòng)子元件分析結(jié)果表明,該基因家族成員在進(jìn)化過(guò)程中可能發(fā)生了功能分化,雖然大多數(shù)ClKNOX基因都含有KNOX1、KNOX2、ELK和Homeobox_KN這4類(lèi)典型結(jié)構(gòu)域,但不同ClKNOX基因在不同組織中表達(dá)模式的多樣性暗示了其功能的差異性,ClKNOX3、ClKNOX6和ClKNOX11可能與根和莖的發(fā)育相關(guān),而ClKNOX3和ClKNOX10則可能與葉片和花的發(fā)育更加密切,不同ClKNOX基因在不同組織的特異性表達(dá)和模式為進(jìn)一步深入探究ClKNOX基因在生長(zhǎng)發(fā)育中的功能奠定了基礎(chǔ)。
參考文獻(xiàn)
[1] GEHRING W J,AFFOLTER M, BURGLIN T.Homeodomain proteins[J].Annual Review of Biochemistry,1994,63:487-526.
[2] VOLLBRECHT E,VEIT B,SINHA N,et al.The developmental gene Knotted-1 is a member of a maize homeobox gene family[J].Nature,1991,350(6315):241-243.
[3] HAKE S,SMITH H M S,HOLTAN H,et al.The role of KNOX genes in plant development[J].Annual Review of Cell and Developmental Biology,2004,20:125-151.
[4] GAO J,YANG X,ZHAO W,et al.Evolution,diversification,and expression of KNOX proteins in plants[J].Frontiers in Plant Science,2015,6:882.
[5] LEE J H,LIN H W,JOO S,et al.Early sexual origins of homeoprotein heterodimerization and evolution of the plant KNOX/BELL family[J].Cell,2008,133(5):829-840.
[6] BURGLIN T R.Analysis of TALE superclass homeobox genes(MEIS,PBC,KNOX,Iroquois,TGIF) reveals a novel domain conserved between plants and animals[J].Nucleic Acids Research,1997,25(21):4173-4180.
[7] CHEN H,ROSIN F M,PRAT S,et al.Interacting transcription factors from the three-amino acid loop extension superclass regulate tuber formation[J].Plant Physiology,2003,132(3):1391-1404.
[8] KERSTETTER R,VOLLBRECHT E,LOWE B,et al.Sequence analysis and expression patterns divide the maize knotted1-like homeobox genes into two classes[J].The Plant Cell,1994,6(12):1877-1887.
[9] MAGNANI E,HAKE S.KNOX lost the OX:The Arabidopsis KNATM gene defines a novel class of KNOX transcriptional regulators missing the homeodomain[J].Plant Cell,2008,20(4):875-887.
[10] LONG J A,MOAN E I,MEDFORD J I,et al.A member of the KNOTTED class of homeodomain proteins encoded by the STM gene of Arabidopsis[J].Nature,1996,379(6560):66-69.
[11] TRUERNIT E,SIEMERING K R,HODGE S,et al.A map of KNAT gene expression in the Arabidopsis root[J].Plant Molecular Biology,2006,60(1):1-20.
[12] DOUGLAS S J,CHUCK G,DENGLER R E,et al.KNAT1 and ERECTA regulate inflorescence architecture in Arabidopsis[J].Plant Cell,2002,14(3):547-558.
[13] VENGLAT S P,DUMONCEAUX T,ROZWADOWSKI K,et al.The homeobox gene BREVIPEDICELLUS is a key regulator of inflorescence architecture in Arabidopsis[J].Proceedings of the National Academy of Sciences,2002,99(7):4730-4735.
[14] BELLES-BOIX E,HAMANT O,WITIAK S M,et al.KNAT6:An Arabidopsis homeobox gene involved in meristem activity and organ separation[J].Plant Cell,2006,18(8):1900-1907.
[15] HAMANT O,NOGUE F,BELLES-BOIX E,et al.The KNAT2 homeodomain protein interacts with ethylene and cytokinin signaling[J].Plant Physiology,2002,130(2):657-665.
[16] DEAN G,CASSON S,LINDSEY K.KNAT6 gene of Arabidopsis is expressed in roots and is required for correct lateral root formation[J].Plant Molecular Biology,2004,54(1):71-84.
[17] SERIKAWA K A,MARTINEZ-LABORDA A,ZAMBRYSKI P.Three knotted1-like homeobox genes in Arabidopsis[J].Plant Molecular Biology,1996,32:673-683.
[18] BIRNBAUM K,SHASHA D E,WANG J Y,et al.A gene expression map of the Arabidopsis root[J].Science,2003,302(5652):1956-1960.
[19] LI E Y,BHARGAVA A,QIANG W Y,et al.The Class II KNOX gene KNAT7 negatively regulates secondary wall formation in Arabidopsis and is functionally conserved in Populus[J].New Phytologist,2012,194(1):102-115.
[20] 張磊,武競(jìng)春,張海英,等.西瓜重要性狀功能基因研究進(jìn)展[J].園藝學(xué)報(bào),2023,50(12):2748-2764.
[21] LIU H,JIAO J Q,LIANG X J,et al.Map-based cloning,identification and characterization of the w gene controlling white immature fruit color in cucumber(Cucumis sativus L.)[J].Theoretical and Applied Genetics.2016,129(7):1247-1256.
[22] 徐曉燕,黃小忠,劉萬(wàn)仙,等.瓠瓜KNOX基因家族全基因組鑒定及組織表達(dá)分析[J].西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,52(3):113-122.
[23] GUO S G,ZHANG J G,SUN H H,et al.The draft genome of watermelon(Citrullus lanatus)and resequencing of 20 diverse accessions[J].Nature Genetics,2013,45(1):51-58.
[24] MISTRY J,CHUGURANSKY S,WILLIAMS L,et al.Pfam:The protein families database in 2021[J].Nucleic Acids Research,2021,49(D1):412-419.
[25] FINN R D,CLEMENTS J,EDDY S R.HMMER web server:Interactive sequence similarity searching[J].Nucleic Acids Research,2011,39(2):29-37.
[26] MARCHLER-BAUER A,LU S,ANDERSON J B,et al.CDD:A conserved domain database for the functional annotation of proteins[J].Nucleic Acids Research,2010,39(1):225-229.
[27] GASTEIGER E,GATTIKER A,HOOGLAND C,et al.ExPASy:The proteomics server for in-depth protein knowledge and analysis[J].Nucleic Acids Research,2003,31(13):3784-3788.
[28] CHOU K C,SHEN H B.Cell-PLoc:A package of web-servers for predicting subcellular localization of proteins in various organisms[J].Nature Protocols,2008,3(2):153-162.
[29] HU B,JIN J,GUO A Y,et al.GSDS 2.0:An upgraded gene feature visualization server[J].Bioinformatics,2015,31(8):1296-1297.
[30] BAILEY T L,JOHNSON J,GRANT C E,et al.The MEME suite[J].Nucleic Acids Research,2015,43(W1):39-49.
[31] CHEN C J,WU Y,LI J W,et al.TBtools-II:A “one for all,all for one” bioinformatics platform for biological big-data mining[J].Molecular Plant,2023,16(11):1733-1742.
[32] EDGAR R C.MUSCLE:Multiple sequence alignment with high accuracy and high throughput[J].Nucleic Acids Research,2004,32(5):1792-1797.
[33] MINH B Q,SCHMIDT H A,CHERNOMOR O,et al.IQ-TREE 2:New models and efficient methods for phylogenetic inference in the genomic era[J].Molecular Biology and Evolution,2020,37(8):2461.
[34] LESCOT M,DEHAIS P,THIJS G,et al.PlantCARE,a database of plant cis-acting regulatory elements and a portal to tools for in silico analysis of promoter sequences[J].Nucleic Acids Research,2002,30(1):325-327.
[35] WOFFELMEN C.DNAMAN for Windows,Version 5.2.10:Lynon Biosoft[D].Leiden,The Netherlands:Institute of Molecular Plant Sciences,Leiden University,2004.
[36] LIVAK K J,SCHMITTGEN T D.Analysis of relative gene expression data using real-time quantitative PCR and the 2?ΔΔCT method[J].Methods,2001,25(4):402-408.
[37] 宋曉峰,魯成凱,董曉娜,等.花生KNOX基因家族的全基因組鑒定及組織表達(dá)分析[J].山東農(nóng)業(yè)科學(xué),2023,55(8):1-10.
[38] 宋寧寧,梁慧慧,安義偉,等.小麥KNOX基因家族鑒定與生物信息學(xué)分析[J].分子植物育種,2022,20(7):2105-2117.
[39] XIONG H,SHI A,WU D,et al.Genome-Wide identification,classification and evolutionary expansion of KNOX gene family in rice (Oryza sativa) and populus (Populus trichocarpa)[J].American Journal of Plant Sciences,2018,9(6):1071-1092.
[40] 趙長(zhǎng)江,宋巨奇,都?jí)粝瑁龋衩譑NOX基因家族鑒定及組織和逆境表達(dá)分析[J].西北植物學(xué)報(bào),2021,41(7):1109-1119.
[41] JIA P,XING L B,ZHANG C G,et al.MdKNOX15,a class I knotted-like transcription factor of apple,controls flowering and plant height by regulating GA levels through promoting the MdGA2ox7 transcription[J].Environmental and Experimental Botany,2021,185:104411.
[42] FLAGEL L E,WENDEL J F.Gene duplication and evolutionary novelty in plants[J].New Phytologist,2009,183(3):557-564.
[43] LIU J J,EKRAMODDOULLAH A K M.Isolation,genetic variation and expression of TIR-NBS-LRR resistance gene analogs from western white pine (Pinus monticola Dougl.ex.D.Don.)[J].Molecular Genetics and Genomics,2004,270(5):432-441.
[44] NAIR R A,THOMAS G.Isolation,characterization and expression studies of resistance gene candidates (RGCs) from Zingiber spp.[J].Theoretical and Applied Genetics,2007,116(1):123-134.
[45] 段世享.西瓜植株黃化基因Clyp的圖位克隆與功能驗(yàn)證[D].鄭州:河南農(nóng)業(yè)大學(xué),2023.
[46] 孫東玲.西瓜綠花基因ClGF和“星月西瓜”基因MS的定位研究[D].鄭州:河南農(nóng)業(yè)大學(xué),2022.
[47] 王登科.西瓜果皮覆紋基因(ClGS)和短下胚軸基因(Clsh)的精細(xì)定位[D].鄭州:河南農(nóng)業(yè)大學(xué),2022.
[48] 葉明輝,趙朋,牛洋,等.馬鈴薯同源異形框基因家族的鑒定和表達(dá)分析[J].農(nóng)業(yè)生物技術(shù)學(xué)報(bào),2021,29(2):224-239.
[49] 李方正,楊素欣,吳春霞,等.大豆KNOX基因家族的結(jié)構(gòu)和表達(dá)分析[J].植物學(xué)報(bào),2012,47(3):236-247.