趙長江,宋巨奇,都夢翔,徐尚緣,徐晶宇,李佐同
(1 黑龍江八一農墾大學 農學院,黑龍江大慶 163319;2 黑龍江省現代農業栽培技術與作物種質改良重點實驗室,黑龍江大慶 163319;3 黑龍江省秸稈資源化利用工程技術研究中心,黑龍江大慶 163319;4 黑龍江省普通高校寒地作物種質改良與栽培重點實驗室,黑龍江大慶 163319)
同源異型盒基因KNOX(KNOTTED1-like homeobox)轉錄因子屬于TALE(Three amino acid loop extension superfamily)超家族成員,在植物生長發育過程中起著重要的調控作用[1-2]。KNOX蛋白一般含有4個保守結構域:KNOX1、KNOX2、ELK和Homeobox KN[3-4],位于上游的KNOX1和KNOX2統稱為MEINOX[5],MEINOX結構域通過與ELK結構域和下游的Homeobox KN結構域相連接。自第一個KNOX基因在玉米中被報道以來[6],越來越多的KNOX家族基因在不同物種中被相繼鑒定,例如擬南芥(Arabidopsisthaliana)、水稻(Oryzasativa)、小麥(Triticumaestivum)、棉花(Gossypiumspp.)、蘋果(Malusdomestica)和梨(Pyrusspp.)等[4,7-10]。擬南芥KNOX家族根據其序列和表達模式被分為3類[4],部分基因功能有較為深入的研究。其中,第一亞組基因主要在莖尖分生組織中表達,包含STM(SHOOTMERI-STEMLESS)、KNAT1/BP、KNAT2和KNAT6。STM的突變引起擬南芥缺少分生組織,KNAT1/BP的突變會導致花梗長度減少[1];水稻同亞組OSH15參與控制細胞壁的和木質素的合成[11],OSH1和OSH15 基因的雙缺失突變體愈傷組織只能形成葉狀結構,無法成芽[12];楊樹(PopulusL.)Pttkn1基因調控葉片形態及維管束的形成[13]。而且,該亞組可與同一家族的其他成員或其他家族成員相互作用調控植物生長發育,例如擬南芥KNAT1/BP與STM互作,通過阻止分生組織分化來維持分生活性[14],STM或BP與BLH(BEL1-like homeodomain)家族成員互作[15-16]。第二亞組KNOX蛋白更為保守,擬南芥KNAT3可調節種子萌發和早期發育過程中的脫落酸反應[17],KNAT4可通過控制種子種皮角質層的透性厚度控制種子的物理休眠[18],KNAT7和OFP4相互作用共同調控次生細胞壁的形成[19]。此外,僅存在雙子葉植物中的M亞組發現較晚,擬南芥中KNATM參與調控葉近端-遠端形態[4]。上述研究表明,植物KNOX家族在生長發育調控中發揮重要作用。盡管第一個植物KNOX基因在玉米中被報道,但是在全基因組水平對KNOX家族的系統分析卻鮮有報道。所以,本研究在基因組水平對玉米KNOX家族成員進行鑒定,并對該家族理化性質、系統進化、基因結構、順式作用元件等信息進行分析,揭示ZmKNOX家族基因在全生育期和鹽脅迫條件下的表達模式,為該類基因功能解析提供理論依據。
以東北地區玉米重要自交系‘合344’為供試材料。用10%次氯酸鈉對精選的種子消毒30 min,用蒸餾水沖洗至無味后浸泡6~8 h,置于培養箱中22 ℃暗培養24 h催芽;選擇萌發1.5 cm左右根的種子擺放于泡沫漂浮板的孔洞中,人工氣候室(22 ℃,16 h光/8 h暗)中1/2 Hoagland營養液培養至兩葉一心期進行處理。在營養液中添加150 mmol·L-1NaCl,分別于處理0 d、1 d、3 d和7 d取樣,用蒸餾水沖洗3遍再將地上和地下部分離,用濾紙吸干組織表面水分后,迅速用液氮冷凍存放于-80 ℃冰箱中。每組樣品3個生物學重復。
1.2.1 基因家族成員的鑒定玉米基因組數據、蛋白序列及注釋文件下載于phyzotome(https://phytozome.jgi.doe.gov/pz/ portal.html)。擬南芥和水稻KNOX蛋白序列分別下載于TAIR(https://www.arabidopsis.org/)、RGAP(http://rice. plantbiology.msu.edu/)。以擬南芥和水稻蛋白序列為種子序列,利用TBtools[20]軟件獲取玉米蛋白數據庫中候選KNOX蛋白,利用NCBI CD-Search、Pfam[21]、SMART[22]在線工具進一步驗證,含有KNOX結構域的蛋白序列視為KNOX基因家族成員。
1.2.2 蛋白相關的生信分析利用網站Expasy(https://web.expasy.org/protparam/)分析蛋白理化特性,利用PSORT(http://psort1.hgc.jp/form.html)網站進行亞細胞定位預測分析。利用MEGA X[23]軟件,選擇最大似然法構建不同物種基因家族成員系統發育進化樹,設置如下參數:采用自展法(Bootstrap method),參數為1 000,模型選擇最適模型(JTT+G),設置數據缺失處理為比對刪除(Pairwise deletion)。
利用MEME網站(https://meme-suite.org/meme/tools/meme)分析蛋白保守基序,參數設置為:輸出基序數量為10,基序最小長度為3,最大長度為50;并利用TBtools繪制保守基序圖。使用STRING[24](https://string-db.org/)數據庫對蛋白互作關系進行預測。
1.2.3 基因相關的生信分析利用MCScanX[25]軟件進行共線性關系分析,利用TBtools軟件繪制基因在染色體上的分布圖和分析基因中的外顯子-內含子結構并繪制基因結構圖,同時取翻譯起始點ATG上游2 000 bp 和1 000 bp序列記為基因啟動子,并提交PlantCARE (http://bioinformatics.psb.ugent.be/webtools/ plantcare/html/) 數據庫進行順式作用元件的類型和數量分析。
1.2.4 全生育期組織表達譜及共表達分析玉米全生育期的表達數據來源于Maize eFP Browser(http://bar.utoronto.ca/efp_maize/)數據庫。從NCBI-GEO下載GSE117030轉錄組表達譜數據,使用TBtools中OneStepWGCNA工具進行加權共表達網絡構建,篩選樣本中6成且FPKM值>1的數據,計算加權系數β值,構建無尺度網絡并劃分相關模塊,并對性狀與模塊進行關聯分析,繪制模塊-性狀熱圖。利用TBtools軟件的GO Enrichment進行GO富集分析,以玉米基因組為參考數據庫,利用Enrichment Bar Plot設置數量參數為30進行可視化。
1.2.5 非生物逆境表達譜及深入驗證分析一方面,通過 SRA 數據庫(https://submit.ncbi.nlm.nih.gov/about/sra/)下載冷(SRR1238717,SRR1819204,SRR1819205)、熱(SRR1238715,SRR1819196和SRR1819198)、鹽(SRR1238719)和UV(SRR1238720)轉錄表達數據,構建玉米KNOX基因非生物脅迫表達數據;另一方面,用本實驗室轉錄數據進一步分析驗證玉米KNOX基因表達,即采用TRIZOL試劑(Invitgen)提取玉米葉片和根組織總RNA,純化后構建cDNA文庫,通過聚合酶鏈反應(PCR)富集cDNA文庫,然后使用Illumina HiSeq 2000平臺對構建的文庫進行RNA-seq測序(SRP176441和SRP307694)。同時抽取KNOX基因構建鹽處理下根和葉表達譜,相對表達量計算方法為:首先將3次生物學重復處理的FPKM平均值與對照(0 d)平均值相比,然后二者比值進行log2FC轉換,轉換值即為相對表達量。
在玉米基因組水平鑒定22個ZmKNOX家族成員(表1),根據其在染色體上的位置依次命名為ZmKNOX1~ZmKNOX22。ZmKNOX家族基因編碼蛋白的分子質量跨度為40.28 kD~14.70 kD,理論等電點范圍4.70~9.78。其中,ZmKNOX6氨基酸數量最多為364個,ZmKNOX15氨基酸數量最少為129個;有4個ZmKNOX家族成員的蛋白質等電點大于7,其余成員均小于7。除ZmKNOX7預測定位于細胞質,ZmKNOX5、ZmKNOX11、ZmKNOX12和ZmKNOX15定位于線粒體外,其余家族蛋白質預測定位于細胞核。

表1 ZmKNOX基因編碼蛋白序列理化性質
使用ClustalX V.2.0將已知的擬南芥(9個)、水稻(13個)、小麥(36個)、高粱(23個)KNOX家族的蛋白序列和玉米的蛋白序列進行多序列比對,后使用MGEA X軟件構建系統進化樹(圖1)。進化樹中顯示KNOX家族基因被分為三大類ClassⅠ、ClassⅡ和ClassKNATM,其中ClassⅠ被分為ClassⅠA、ClassⅠB和ClassⅠC三個亞類,ClassⅡ被分為兩個亞類ClassⅡA和ClassⅡB。ClassⅠA中含有31個KNOX成員,數量最多,其中玉米9個(ZmKNOX2、4、5、6、8、10、15、18、22);ClassⅠB含有21個KNOX成員,其中玉米3個(ZmKNOX9、17、19);ClassⅠC含有18個KNOX成員,其中玉米5個(ZmKNOX3、7、11、12、14)。ClassⅡA有8個KNOX成員,其中玉米2個(ZmKNOX1、 21);ClassⅡB含有19個KNOX成員,其中玉米3個(ZmKNOX13、16、20)。Class KNATM中含有擬南芥的1個成員和5個高粱成員。此外,通過進化樹可以發現,大多數ZmKNOX和高粱聚在一個分支,表明兩物種系統發育關系較近。

ClassⅠA、B和C代表第一亞類的3個亞族;ClassⅡA和B代表第二亞類的2個亞族;Class M代表M亞族。水稻(Os)和小麥(Ta)分別用青色和紅色三角表示;高粱(Sb)、玉米(Zm)和擬南芥(At)分別用綠色方塊、藍色圓圈和紫色菱形表示圖1 ZmKNOX家族成員蛋白系統進化樹Class Ⅰ A, B and C represent three subgroups of the first subclass; Class Ⅱ A and B represent two subgroups of the second subclass; Class M represents the M subgroup. Among them, Oryza sativa (Os) and Triticum aestivum (Ta) are characterized by a cyan and red triangle, and Sorghum bicolor(Sb) Zea mays(Zm) and Arabidopsis thaliana (At) represented by a green square, a blue circle and a purple diamond, respectivelyFig.1 Protein phylogenetic tree of ZmKNOX family
ZmKNOX家族基因在10條染色體上均有分布(圖2),其中6、7、8、10號染色體上只有1個家族成員。ZmKNOX1-6分布在1號染色體,ZmKNOX7-8分布于2號染色體,ZmKNOX9、10分布在3號染色體,ZmKNOX11-13分布于4號染色體,ZmKNOX14-16分布在5號染色體,ZmKNOX17、18、19分別分布于6、7、8號染色體上,ZmKNOX20、21分布在9號染色體,ZmKNOX22定位于10號染色體上。利用MSCAN軟件分析玉米、水稻、高粱3個物種KNOX家族基因共線性關系。結果表明11個ZmKNOX家族基因與6個高粱KNOX家族基因存在線性關系,4個ZmKNOX家族基因與3個水稻KNOX家族基因存在線性關系。玉米和高梁兩物種間的共線性基因數明顯多于玉米和水稻間的,這與我們構建的多物種進化樹的結果相佐證。

Os1-12代表水稻12條染色體,Zm1-10代表玉米10條染色體,Sb1-10代表高粱10條染色體圖2 ZmKNOX基因家族染色體定位及種間共線性分析Os1-12 represents twelve rice chromosomes, Zm1-10 represents ten maize chromosomes, and Sb1-10 represents ten sorghum chromosomesFig.2 Chromosome localization of ZmKNOX gene and their interspecific collinearity analysis
利用MEME網站對ZmKNOX家族蛋白序列保守性進行分析(圖3,A)。其中,motif3為KNOX1結構域的保守基序,motif2、motif5和motif8構成KNOX2的保守基序,motif4為ELK的保守基序,motif1為Homeobox KN的保守基序。所有ZmKNOX家族成員均含有KNOX2結構域。通過ZmKNOX家族基因結構(圖3,B)分析發現,ClassⅠ組基因內含子0~4個,ClassⅠB組基因內含子均為4個,ClassⅡ組基因內含子數4~6個。

A下方比例尺表示蛋白長度;B中數字代表內含子的數量,下方比例尺表示堿基數圖3 ZmKNOX家族保守基序(A,C)和基因結構圖(B)The scale below figure A shows protein length; the number in figure B represents intron number, and the scale represents the bases numberFig.3 The conserved motif (A,C) and gene structure (B) of the Zmknox family
在ZmKNOX家族中我們分析了基因啟動子區生長、光響應、脅迫、激素四大類作用元件的數量和分布(圖4)。首先,基于2 000 bp啟動子序列進行相關元件的預測分析,生長發育相關的作用元件包括O2-site、motifI、CAT-box等7個元件;光響應相關的包括Sp1、TCT-motif、GATA-motif等25個元件;逆境脅迫相關的包括LTR、MBS、ARE等7個元件;與植物激素相關的包括P-box、TGA-element、ABRE等7個元件。其中,光響應元件分布于ZmKNOX家族所有成員中,除ZmKNOX14、19、21外,其余ZmKNOX基因啟動子均含有生長相關的元件,ZmKNOX6、22啟動子上數量最多;除ZmKNOX20啟動子只含有生物鐘相關元件外,其余該家族基因啟動子均含有逆境相關元件;ABA相關元件在ZmKNOX6、8、17啟動子上數量較多。

右圖中+或-代表DNA雙鏈中兩條方向相反的單鏈圖4 ZmKNOX基因家族啟動子區順式作用元件分布及統計數In the figure on the right, + and - represent the two chain in a different directionFig.4 Distribution and number of the cis-acting elements in the promoter region of the ZmKNOX gene family
進而,選取啟動子上游1 000 bp范圍內各類順式作用元件中數量最多的2個元件進行分析(圖4),結果顯示,光(G-box、Sp1)、逆境(ARE、MBS)、激素(ABRE、CGTCA-motif)響應元件分布較為廣泛,生長相關的元件(O2-site、Circadian)僅在部分ZmKNOX家族成員啟動子出現。揭示ZmKNOX家族可能在玉米生長發育和響應逆境脅迫方面起著重要的作用。
排除ZmKNOX2、7、10、11、12、15、22等7個基因沒有相應表達數據外,其余15個ZmKNOX家族基因在全生育期中的表達模式(圖5)可以分為:全生育期組成型高表達(5個基因)、低表達(4個基因)和特異性表達(6個基因)3種。而且,基因的生育期表達模式與蛋白進化分類具有一定關聯性。ClassⅠ中的ZmKNOX4、8、9、17、18、19在胚胎、種子萌發時期、胚芽鞘、莖尖、莖節間、頂端分生組織、花序表達量較高,說明其表達具有階段性和組織特異性。全生育期組成型低表達的基因也分布在該亞族中,包括ZmKNOX3、5、6、14。ClassⅡ中ZmKNOX1、13、20、21呈現出全生育期組成型高表達。

圖例表示標準化的FPKM值,紅色表示高表達水平,藍色表示低表達水平圖5 ZmKNOX基因家族生育期及非生物脅迫表達分析The legend indicates the standardized FPKM value, the red indicates the high expression level, and the blue indicates the low expression levelFig.5 Expression analysis of ZmKNOX gene family during whole growth period and various abiotic stresses
在鹽、冷、熱和UV條件下ZmKNOX家族基因表現出不同的響應模式,只有ZmKNOX1、3、6、13、14、16、20、21等8個基因參與對供試非生物逆境的應答,總體來看基因表達量變化不大(圖5)?;诠┰?種逆境的表達聚類,將8個基因分為兩類,一類為總體下調表達包括ZmKNOX3、14;其余6個劃為一類,為上調表達或基本無變化。其中,ZmKNOX6冷處理下明顯上調,ZmKNOX14熱處理明顯上調表達,鹽脅迫下ZmKNOX13明顯上調、ZmKNOX3、14明顯下調。同時,逆境應答基因中ZmKNOX3、6、14具有生育期低表達的特點,說明家族成員在生長發育和逆境應答方面存在分工和協作。
根據GEO數據庫的GSE50191為基礎,構建共表達網絡(圖6,A、B)。其中turquoise模塊含有的基因數目最多,greenyellow模塊含有的基因最少。將不同處理看作質量性狀與模塊進行關聯分析并繪制相關性熱圖。ZmKNOX家族基因與生長發育相關,同時在turquoise模塊中發現2條ZmKNOX基因(ZmKNOX16、20),black模塊中發現1條ZmKNOX家族基因(ZmKNOX13)。同時在turquoise模塊中Ear Primordium 6~8 mm這一性狀的相關性最高為0.42,black模塊中Root Meristem Zone 5 Days這一性狀相關性最高為0.65,因此選擇turquoise模塊和black模塊進行后續分析。GO功能富集分析,turquoise模塊中基因的分子功能主要富集于嘌呤核苷酸結合(GO:0017076)和嘌呤核糖核苷三磷酸結合(GO:0035639)等分子結合功能;生物過程富集于細胞器構建(GO:0033043)和細胞周期(GO:0007049)等生長發育相關過程。black模塊中基因的分子功能主要富集于泛素結合酶活性(GO:0061631)和泛素蛋白轉移酶活性(GO:0004842),生物過程富集于蛋白質泛素化(GO:0016567)和小蛋白偶聯修飾蛋白質等蛋白泛素化分子過程。

E1.穗原基2~4 mm;E2.穗原基6~8 mm;I1.節間6-7;I2.節間7-8;L1.葉區1(對稱);L2.葉區2(氣孔);L3.葉區3(生長);R1.根-分生組織區5 d;R2.根-伸長區5 d;P1.主根5 d圖6 生長發育期玉米基因共表達及GO富集分析E1. Ear primordium 2-4 mm; E2. Ear primordium 6-8 mm; I1. 6-7 internode; I2. Internode 7-8; L1. Leaf zone 1 (Symmetrical); L2. Leaf zone 2 (Stomatal); L3. Leaf zone 3 (Growth); R1. Root-meristem zone 5 days; R2. Root-elongation zone 5 day; P1. Primary root 5 dayFig.6 Coexpression analysis and GO enrichment based on transcriptional data of maize growth and development periods
通過實驗室不同鹽處理時間(1 d、3 d和5 d)玉米幼苗和不同取樣部位(葉片和根系)的轉錄數據對ZmKNOX基因進行深入分析(圖7)發現,鹽處理葉片中ZmKNOX3、4、13、14等4個基因基本都上調表達,其中ZmKNOX3、13不同時間點表達模式基本一致;鹽處理根系中ZmKNOX3、4、6、8、17等5個基因差異表達,其中ZmKNOX3、6、17不同時間點表達模式基本一致且多為下調表達,值得一提的是只有ZmKNOX6為上調表達。此外,鹽處理下ZmKNOX3在葉片和根中均穩定表達,且表達方向不同,我們也通過實時熒光定量PCR對該基因在葉片中表達進行了驗證(結果未顯示)。本實驗室和網絡數據都表明ZmKNOX基因確實參與對鹽的響應。

圖7 鹽脅迫玉米幼苗葉和根中ZmKNOX基因表達分析Fig.7 The expression analysis of ZmKNOX in the leaves and roots of seedlings challenged by NaCl
通過String網站預測蛋白互作(圖8,A),包括ZmKNOX1、3、4、5、6、8、13、14、16、18、20、21和22等13個ZmKNOX家族成員存在蛋白間互作關系?;プ麝P系網中存在19個節點55組互作關系,ZmKNOX1、21位于整個蛋白互作網絡的中心,且可與ZmBELL8、13、14、ZmOFP19、ZmMYB92和Zmsbp10.a等蛋白發生互作。結合生育期組織基因共表達分析,ZmBELL8與ZmKNOX4、18具有相同的組織表達模式(圖8,B),在轉錄水平上支持蛋白互作。

圖8 ZmKNOX家族蛋白互作網絡預測(A)及相關基因表達分析(B)Fig.8 Prediction of ZmKNOX protein interaction network (A) and their gene expression analysis (B)
本研究在基因組水平鑒定了22個ZmKNOX家族成員?;谙到y進化分析,多數(17個)ZmKNOX基因劃分為第一組,該組擬南芥成員主要調控莖尖分生組織的形成,推測該組ZmKNOX基因參與分生組織調控;少部分第二組中ZmKNOX成員可能參與調控植物種子萌發和細胞壁的形成[18,26]。通過對水稻、高粱和玉米KNOX家族基因的共線性分析,發現玉米與高粱間的共線基因數多于玉米與水稻;而且蛋白系統進化分析中玉米和高粱KNOX共聚于更小的分支,上述結果都表明同為C4作物的玉米和高粱間KNOX家族成員間親緣關系較近。
在ZmKNOX基因啟動子區域預測到大量與逆境、生長發育和激素相關的作用元件,表明ZmKNOX家族基因可參與逆境、生長發育和激素調控,甚或參與激素介導的生長發育或逆境調控。本研究中對玉米ZmKNOX基因生育期表達分析發現,第一組ZmKNOX基因主要在頂端分生組織、莖節間和花序中表達,同時在植物器官建成初期的表達量較高;第二組ZmKNOX基因在所有組織中均有表達,特別是ZmKNOX13和ZmKNOX20表達量最高,ZmKNOX1和ZmKNOX21在根部、葉片、苞葉中表達量較高。表明該家族基因可能參與不同生長發育階段特異組織的調控。同時,通過鹽脅迫表達分析發現,盡管ZmKNOX3、ZmKNOX6和ZmKNOX14在全生育期表達量不高甚或可能下調表達,但在鹽脅迫下表達量變化明顯,參與植物對鹽脅迫的應答調控。此外,不同植物中該家族基因功能的研究,也旁證了啟動子順式元件中存在大量激素相關元件的結果,例如苔蘚(Physcomitrellapaten)中KNOX基因可以通過異戊烯基轉移酶基因PpIPT3促進細胞分裂素的生物合成[27],荔枝(Litchichinensis)中LcKNAT1通過調節乙烯的生物合成來調節脫落[28],以及參與赤霉素功能調控[29-30]。
基于全生育期轉錄組數據的共表達分析,鑒定出含有ZmKNOX基因的2個模塊,分別與turquoise模塊中葉耳原基(6~8 mm Ear Primordium)期和black模塊中根分生區(5 Days Root Meristem)期明顯正相關。其中,葉耳原基期主要涉及嘌呤核苷酸結合、嘌呤核糖核苷三磷酸結合和腺苷酸核糖核酸結合等分子功能,推測包含于turquoise模塊的ZmKNOX16和ZmKNOX20可能在RNA合成水平調控葉耳生長發育,負調控根的伸長(Root-Elongation Zone 5 Day);同理,根分生區期主要涉及泛素結合酶活性、泛素蛋白轉移酶活性、泛素樣蛋白結合酶活性等分子功能,推測black模塊中ZmKNOX13可能通過泛素化蛋白降解調控根區分生活性,負調控根的伸長(Root-Elongation Zone 5 Day),表明泛素化與植物生長發育密切相關[31]。同屬于全生育期組成型高表達的ZmKNOX16和ZmKNOX20基因在鹽逆境處理下無明顯變化,而生育期表達量總體不高的基因卻發生明顯變化,當然組成型高表達的ZmKNOX13也參與逆境應答,表明該家族基因在生長發育調控和逆境應答方面既有分工又有對話協作。值得一提的是,基于共表達分析發現全生育期組成型高表達基因在不同模塊中凸顯,參與生育期的特異調控。通過蛋白互作預測分析發現ZmKNOX13、ZmKNOX16和ZmKNOX20都可以與生育期相對低表達的ZmKNOX5互作,推測通過同源二聚化調控生長發育,當然上述蛋白還可能通過與ZmOFP19等異源蛋白互作實現對植物生長發育的調控,或是對生長發育與逆境應答的平衡。綜上,本研究基于生物信息學分析在玉米基因組水平鑒定了22個ZmKNOX家族成員,通過在線生育期和逆境表達數據和實驗室鹽處理測序數據分析,揭示了ZmKNOX家族基因參與玉米生長發育和非生物逆境應答,為該類基因功能解析奠定了理論基礎。