董新玉,鄧 浪,張亞春,陳國發,李樹鋒
(1.大理州農業科學推廣研究院經濟作物研究所,云南 大理 671000;2.云南農業職業技術學院,昆明 650031)
【研究意義】大蒜(AlliumsativumL.)是百合科蔥屬植物,是一種重要的的蔬菜、香料和藥用作物,2018年全世界大蒜種植面積高達154.7萬hm2,產量達2849.4萬t[1]。近年來,隨著分子生物學技術的快速發展,越來越多的學者從傳統的栽培育種轉向從細胞分子層面研究大蒜的生長發育和遺傳進化,并在大蒜遺傳多樣性分析、基因組學、轉錄組學和基因表達與功能驗證等方面獲得較多研究成果[2]。目前,大蒜全基因組數據已經公布[3],為加快研究大蒜基因功能和進化提供了更為有效的途徑。【前人研究進展】WOX(WUSCHEL-related homeobox)轉錄因子屬于HB(Homeobox)轉錄因子超家族,是植物中廣泛存在的一類轉錄因子,也是植物所特有的一類轉錄因子[4]。WOX家族成員在擬南芥、棉花、水稻和番茄等植物中已得到鑒定[4]。其中,擬南芥WOX基因家族包含15個成員[5],棉花中有37個成員,水稻和番茄中分別有12和10個成員[6-8]。Graaff等對不同物種的WOX家族蛋白進行進化分析發現,WOX家族蛋白被分為遠古支(Ancient clade)、中間支(Intermediate clade)和WUS支(WUS clade)[5]。功能研究發現,WOX家族蛋白在植物干細胞維持、器官發育、激素信號轉導、初生和次生物質代謝及抗逆響應等過程中發揮著重要的調節作用[5,9-11]。有研究指出,密碼子具有簡并性,在遺傳信息的傳遞過程中發揮著重要的作用[12]。在長期進化過程中,不同物種會形成獨特的適應自身基因組環境的密碼子使用偏性(Codon usage bias,CUB)[13]。密碼子使用偏性會隨著基因組中大部分基因或者特定基因的變化而改變[14]。研究表明,密碼子偏好性分析能為預測基因功能、基因的表達水平、選擇基因異源表達受體系統和優化密碼子以提高異源表達效率等提供參考[13]。【本研究切入點】本研究利用生物信息學分析方法,對大蒜WOX家族蛋白進化關系、密碼子使用偏性及表達進行分析。【擬解決關鍵問題】以期進一步為研究大蒜WOX基因在大蒜生長發育過程中的作用提供科學依據。
大蒜全基因組數據從https://doi.org/10.6084/m9.figshare.12570947.v1下載[3],擬南芥全基因組WOX基因家族信息從TAIR(http://www.arabidopsis.org/)中下載[15],水稻、番茄、辣椒和獼猴桃全基因組WOX基因家族信息從iTAK(http://itak.feilab.net/cgi-bin/itak/db_home.cgi)中下載。大腸桿菌、酵母菌和擬南芥的基因組密碼子使用偏性數據從Kazusa DNA研究所Codon Usage Database在線數據庫(http://www.kazusa.or.jp/codon/)下載[16]。
1.2.1 大蒜WOX基因家族的鑒定與分析 利用Sun等[3]2020年公布的大蒜全基因組數據,以大蒜全基因組蛋白序列和核酸序列以及擬南芥WOX基因家族序列構建FASTA文本,并利用BioEdit軟件構建大蒜全基因組本地數據庫,同時以構建的擬南芥WOX基因家族為探針,進行本地BLAST,重復上述操作去冗余后,結合NCBI(National Center for Biotechnology Information)、SMART(http://smart.embl-heidelberg.de/)和MEGA 6.0軟件進行結構域和同源性分析,對大蒜WOX基因家族進行鑒定篩選。同時利用MEGA 6.0和DNAMAN 6.0軟件對大蒜WOX基因家族進行系譜進化分析及保守結構域分析[17]。
1.2.2 密碼子偏好性分析 利用CodonW軟件和EMBOSS(http://emboss.bioinformatics.nl/cgi-bin/emboss/cusp)在線軟件計算大蒜WOX基因家族編碼蛋白的密碼子偏性參數,并用SPSS 19.0、Excel 2010和MEGA 6.0進行大蒜WOX基因家族的密碼子堿基組成與GC偏好性(GC3s)的相關性、整體RSCU值、系統聚類及最佳外源受體表達系統選擇分析,并參照牛元[18]和Sueoka[19]等使用方法進行最優密碼子、ENC-Plot和PR2-plot分析,分析大蒜WOX基因家族的密碼子使用偏性強弱及受突變壓力或選擇壓力的影響,同時用Origin 2017、RStudio、MEGA 6.0和TBtools軟件作圖。
1.2.3 大蒜WOX家族表達譜分析 利用Sun等[3]上傳于GEO數據庫(登錄號:GSE145455)中的表達數據,提取大蒜WOX基因家族在大蒜鱗莖膨大8個時期(鱗莖未膨大開始,每隔5 d取樣1次)、假莖、根、葉的表達數據,并用TBtools軟件作圖。
通過本地BLAST去冗余后,最終從大蒜基因組數據庫中獲得16個WOX家族成員,根據NCBI同源比對及構建進化樹中與擬南芥WOX基因家族的同源關系(圖1-A),分別將這些成員命名為AsaWUS、AsaWOX3a、AsaWOX3b、AsaWOX3c、AsaWOX3d、AsaWOX3e、AsaWOX3f、AsaWOX3g、AsaWOX3h、AsaWOX3l、AsaWOX3j、AsaWOX3k、AsaWOX4、AsaWOX9、AsaWOX13a和AsaWOX13b。進一步將大蒜、擬南芥、番茄、辣椒、水稻和獼猴桃WOX基因家族做進化分析發現(圖1-B),5種不同植物的WOX家族成員被劃分為WUS支(WUS clade)、中間支(Intermediate clade)和遠古支(Ancient clade)。5種植物均含有WUS支、中間支和遠古支成員。大蒜WOX家族16個成員中,WUS支包含:AsaWUS、AsaWOX3a、AsaWOX3b、AsaWOX3c、AsaWOX3d、AsaWOX3e、AsaWOX3f、AsaWOX3g、AsaWOX3h、AsaWOX3l、AsaWOX3j、AsaWOX3k和AsaWOX4;中間支包含:AsaWOX9;遠古支包含:AsaWOX13a和AsaWOX13b。5個物種的WOX家族成員在3個分支中均有分布,說明WOX家族的分化在大蒜、擬南芥、水稻、番茄、辣椒和獼猴桃物種分化之前。

A為大蒜與擬南芥WOX基因家族的進化關系分析;B為大蒜、擬南芥、番茄、辣椒、水稻和獼猴桃WOX基因家族的進化關系分析A is evolution analysis of WOX genes family between garlic and Arabidopsis;B is evolution analysis of WOX genes family among garlic, Arabidopsis, tomato, pepper, rice and kiwi fruit圖1 大蒜WOX基因家族鑒定及進化分析Fig.1 Identification and evolution analysis of garlic WOX genes family
利用DNAMAN 6.0對大蒜WOX家族成員蛋白序列進行多序列比對,結果表明,大蒜WOX家族成員大多含有68個氨基酸組成的“螺旋—環—螺旋—轉角—螺旋”HOX保守結構域(圖2)。其中,AsaWOX3k保守結構域不完整,AsaWOX13a、AsaWOX13b、AsaWOX9、AsaWOX3g、AsaWOX3h、AsaWOX3l和AsaWOX3j保守結構域序列較其他成員有較大差異,預示它們可能在功能上存在較大差異。

圖2 大蒜WOX家族成員保守結構域分析Fig.2 Analysis of conserved domains of garlic WOX family members
2.3.1 密碼子偏性相關參數分析 分析了大蒜WOX家族成員堿基組成及相關密碼子偏性參數(表1),其中平均AU含量和GC含量分別為58.02%和41.98%,密碼子第3位堿基平均含量A3s>T3s>G3s>C3s,GC1s、GC2s和GC3s平均含量分別為0.450、0.414、0.395,均小于0.5,揭示大蒜WOX家族成員編碼序列密碼子中AU使用頻率高于GC。CBI均值為-0.038,Fop均值為0.407,ENC平均值為50.53,偏向61,CAI均值為0.186,遠低于1.0,說明大蒜WOX家族成員密碼子使用偏性較弱。

表1 大蒜WOX家族成員堿基組成及相關密碼子偏性參數
2.3.2 大蒜WOX成員密碼子與GC(GC3s)偏好性的關系 分析大蒜WOX家族成員密碼子與GC(GC3s)偏好性的關系,結果(圖3)表明,以G/C結尾的密碼子與GC3s偏好性表現正相關,多數以A/U結尾的密碼子與GC3s偏好性表現負相關,但CUU、UUU、ACU、AGU、AAU、CCA、GCA、GGA、AUA與GC3s偏好性表現正相關,表明它們受GC3s偏好性影響。

紅色代表正相關,藍色代表負相關,黑色表示終止密碼子(UAA、UAG、UGA)和起始密碼子(AUG、UGG)Red represents positive correlation, blue represents negative correlation, and black represents stop codons (UAA, UAG, UGA) and start codons (AUG, UGG)圖3 蒜WOX家族密碼子與GC3s相關性Fig.3 The correlation analysis between codons and GC3s of garlic WOX family
2.3.3 大蒜WOX基因家族整體RSCU值、最優密碼子及聚類分析 大蒜WOX家族整體RSCU值分析發現,大蒜WOX家族59個密碼子〔除終止密碼子(UAA、UAG、UGA)和起始密碼子(AUG、UGG)〕中,存在27個高頻密碼子(RSCU>1表示使用頻率較高的密碼子,表中以*表示)。其中,只有7個密碼子以G/C結尾(AGG、UGC、CAC、UUG、UUC、AGC和GUG),20個密碼子以A/U結尾,表明大蒜WOX家族成員偏好A/U結尾密碼子。
大蒜WOX家族成員RSCU值聚類分析顯示(圖4),大蒜WOX家族成員被劃分為2大分支,聚為同一支成員間對密碼子的使用偏性具有相似性,聚為同一支上的密碼子,在不同成員間,其RSCU值大小也基本相似,也說明成員之間對密碼子使用偏性基本一致。

表2 大蒜WOX基因家族整體RSCU值

圖4 大蒜WOX家族成員RSCU聚類分析Fig.4 RSCU cluster analysis of garlic WOX family members
RSCU>1的密碼子確定為高頻密碼子,△RSCU值大于0.08即為高表達密碼子,同時滿足高頻密碼子與高表達密碼子即為最優密碼子[18]。最優密碼子分析發現(圖5),大蒜WOX家族存在14個最優密碼子,只有UUC和GUG以G/C結尾,其余12個最優密碼子均以A/U結尾,進一步表明大蒜WOX家族成員偏好A/U結尾密碼子。

△RSCU<0在圖中未顯示;*代表最優密碼子△RSCU<0 is not shown in the figure; * represents the best codon圖5 大蒜WOX家族最優密碼子分析Fig.5 Optimal codon analysis of garlic WOX family
2.3.4 ENC-Plot和PR2-plot分析 GC3s分布范圍反映了植物所受的選擇壓力,GC3s分布范圍越小,表明密碼子使用偏性受自然選擇壓力越大,同時當4種堿基使用頻率一致時,密碼子偏性僅受突變壓力的影響[20]。此外,繪制理論ENC值標準曲線可反映密碼子受堿基突變或選擇壓力的影響,實際值在曲線上,表示密碼子僅受堿基突變的影響,在標準曲線下方,表示密碼子受選擇壓力的影響[18]。ENC和GC3s關聯分析顯示(圖6-A),大蒜WOX家族成員GC3s分布范圍在0.326~0.487,分布較為集中,說明該家族成員密碼子使用偏性受選擇壓力影響較大。此外,該家族成員基本分布在標準曲線下方,有2個成員分布在標準曲線上,說明該家族成員在進化過程中大多受選擇壓力的影響,少數成員受堿基突變壓力的影響。PR2-plot分析顯示(圖6-B),大蒜WOX家族成員的A3/(A3+G3)或G3/(G3+C3)值基本都偏離0.5,進一步表明該家族成員密碼子使用偏性主要受選擇壓力的影響。

標準曲線繪制公式為ENC=2+GC3s+29/(GC3s2+(1-GC3s)2)[18]The standard curve drawing formula is ENC=2+GC3s+29/ (GC3s2+ (1-GC3s) 2)[18]圖6 大蒜WOX家族成員ENC-Plot和PR2-plot分析Fig.6 ENC-Plot and PR2-plot analysis of garlic WOX family members
2.3.5 大蒜WOX家族成員RSCU值和CDS序列聚類分析 一般功能相似性高的基因,往往表現出類似的密碼子使用模式[21]。RSCU值和CDS序列聚類分析結果表明,基于RSCU值和CDS序列聚類均將大蒜WOX家族16個成員劃分為2大類,但是2種聚類存在較大差異。基于RSCU值聚類(圖7-A),表明同一分支上的成員間,具有類似的密碼子使用模式;而基于CDS序列聚類(圖7-B),表明同一分支上的成員間,同源性高、親緣關系更近。也說明基于CDS序列的聚類分析相比較基于RSCU值的聚類分析要更加準確,更能說明WOX家族成員之間的進化關系,而基于RSCU值的聚類分析可作為前者的補充。

A為RSCU值聚類;B為CDS序列聚類A is RSCU values cluster analysis; B is CDS sequences cluster analysis圖7 大蒜WOX家族成員RSCU值和CDS序列聚類分析Fig.7 RSCU values and CDS sequences cluster analysis of garlic WOX family members
2.3.6 大蒜WOX基因家族外源轉化受體系統選擇 選擇最佳受體表達系統可通過物種間密碼子使用偏性差異來表示。而物種間密碼子使用偏性差異則通過密碼子使用頻率比值來進行衡量。2個物種密碼子使用偏性較一致,說明它們之間密碼子使用頻率比值介于0.5~2,相反,表示2個物種密碼子使用偏性差異較大[16,22]。大蒜WOX基因家族最佳外源轉化受體系統選擇分析顯示(表3),不同物種間密碼子使用偏好性差異不同(表中下劃線標出)。大蒜與大腸桿菌存在密碼子使用偏好性差異較大的密碼子有17個,與酵母菌有11個,與擬南芥有6個。表明擬南芥較適用于大蒜WOX基因家族的外源表達系統。

表3 大蒜WOX基因家族最佳外源轉化受體系統選擇
從GEO數據庫中下載獲取大蒜全基因組的表達數據,并抽取大蒜WOX基因家族在鱗莖發育8個時期(LJ-1~LJ-8,鱗莖發育8個時期分別為:從鱗莖未膨大至鱗莖未膨大完成,每個時期間隔5 d)、葉片(YP)、假莖(JJ)和根(G)中的表達數據做表達熱圖(AsaWUS、AsaWOX3a、AsaWOX3b、AsaWOX9、AsaWOX13a表達數據為0,未在圖中展示),結果(圖8)表明,AsaWOX13b在LJ-1、LJ-5、LJ-8和LJ-7中表達,以LJ-5中表達量最高;AsaWOX4在LJ-1和葉片中表達,以葉片中表達量最高;AsaWOX3c在LJ-7、葉片、假莖和根中表達,以假莖中的表達量最高;AsaWOX3d在LJ-3和LJ-8中表達,以LJ-8中表達量最高;AsaWOX3e和AsaWOX3f在葉片和假莖中表達,以葉片中表達量最高;AsaWOX3g在LJ-2和根中表達,以LJ-2中表達量最高;AsaWOX3h在LJ-6和假莖中表達,以假莖中表達量最高;AsaWOX3l只在葉片中表達;AsaWOX3j只在根中表達;AsaWOX3k只在LJ-8表達。

LJ-1~LJ-8表示鱗莖發育8個時期;YP代表葉片;JJ代表假莖;G代表根LJ-1 to LJ-8 represent 8 stages of bulb development; YP represents leaf; JJ represents pseudostem; G represents root圖8 大蒜WOX家族成員在不同組織中的表達Fig.8 The expression of garlic WOX family members in different tissues
植物WOX家族在植物生長發育、干細胞維持、激素信號轉導、初生和次生物質代謝及抗逆響應等過程中發揮重要調節作用[5]。大蒜基因組數據的公布,為研究大蒜WOX家族提供了重要參考。通過研究從大蒜基因組數據中鑒定得到16個大蒜WOX家族成員,前人研究也表明不同物種間WOX家族成員個數存在差異[擬南芥(15個)、辣椒(11個)、番茄(10個)、獼猴桃(16個)、水稻(17個)和棉花(37個)[4-5,10]],這可能是不同物種在長期進化過程中,為適應生存環境的變化,形成適應自身發展基因組而導致的。進化分析進一步發現,大蒜和水稻親緣關系更近,擬南芥、番茄、辣椒和獼猴桃親緣關系更近,且不同植物WOX家族成員在3個分支中均有分布,說明WOX家族成員分化時間要早于這些物種的分化時間,這與在其他植物上的研究結果類似[11,23]。保守結構域分析發現,親緣關系近的序列,它們之間具有相似的保守結構域,說明鑒定和進化分析結果是可靠的。此外,大蒜WOX家族成員保守結構域由68個氨基酸組成,而星油藤、獼猴桃由60個氨基酸組成[10-11],擬南芥、桂花和烏梅等則由61個氨基酸組成[24],存在這種差異,說明WOX家族在不同物種之間可能經歷了不同的分化過程。
大蒜WOX家族成員密碼子偏性參數、整體RSCU值、最優密碼子分析發現,大蒜WOX家族成員偏好使用A/U結尾的密碼子,與GC含量偏性相關性分析發現,該家族成員密碼子使用偏性與GC含量呈正相關,而該家族成員GC含量低于AU含量,說明大蒜WOX家族成員密碼子使用偏性較弱,這與單子葉植物偏愛使用G/C結尾的密碼子,雙子葉植物偏愛使用A/U結尾的密碼子報道不符[25],但是與在菠蘿和馬尾松等單子葉植物上的研究結果類似[26-27],說明大蒜在進化上可能較其他單子葉植物更接近雙子葉植物,進化程度可能較其他單子葉植物高。此外,RSCU值聚類分析發現,具有類似RSCU值的成員聚為一支,暗示它們在功能上可能存在一定的相似性。ENC-Plot和PR2-plot分析表明大蒜WOX家族成員多數受選擇壓力的影響,少數受突變壓力的影響,這與在谷子、月季上的研究結果類似[13,18];RSCU值和CDS序列聚類分析發現,2種聚類存在差異,這與在其他物種上的研究結果類似[12,16,28];說明基于CDS序列聚類更能反應基因間進化,而基于RSCU值一定程度上可作為前者的補充。最佳外源表達系統分析發現,擬南芥更適合作為大蒜WOX家族成員的外源表達系統,這與在莧菜上的研究結果類似,和忍冬、大麥上的研究結果不同[12,28-29],說明不同物種密碼子使用偏性不同,在選擇外源表達系統時也存在差異,同時說明大蒜WOX家族成員在外源表達時,要高效率異源表達,需對其部分密碼子進行優化改造。表達譜分析發現,大蒜WOX家族成員在大蒜鱗莖發育過程、葉片、假莖和根中均有表達,說明WOX家族成員可能參與鱗莖、葉片、假莖和根的生長發育調控, 建議后期進行差異基因的克隆與遺傳轉化分析,以確定其在特定發育時期的功能作用。
利用生物信息學方法從大蒜基因組中鑒定獲得16個WOX基因家族,大部分WOX基因家族含68個氨基酸組成的保守結構域,密碼子使用偏性均較弱,且擬南芥更適合用于該基因家族的外源表達受體。此外,大蒜WOX基因家族在大蒜鱗莖不同發育時期及其他組織中差異性表達,這為進一步研究大蒜WOX基因家族在大蒜生長發育過程中的功能奠定了基礎。