齊燕妮 李聞娟 王利民 趙瑋 黨照 謝亞萍 張建平




摘要:COBRA基因編碼糖基磷脂酰肌醇錨定蛋白,是次生壁加厚和纖維素含量的調節(jié)因子。亞麻纖維為韌皮纖維,纖維產量與次生壁中纖維素含量及次生壁加厚密切相關。通過BLASTP和Pfam分析,鑒定到24個亞麻COBRA家族成員,并對其進行基因結構、蛋白理化性質及系統進化等生物信息學分析。結果表明,有22個成員具有跨膜結構域,21個成員具有N-端信號肽,16個成員具有GPI錨定位點,所有蛋白均具有CCVS保守結構域而且都定位在細胞膜。基因結構和系統進化分析表明,亞麻COBRA基因家族分為2個亞家族:COBRA-I和COBRA-II,2個亞家族的基因結構具有明顯的差異。
關鍵詞:亞麻;纖維;COBRA基因家族;序列分析;系統進化分析
中圖分類號:S565.9 ? ? ?文獻標志碼:A ? ? ?文章編號:1001-1463(2019)09-0033-06
doi:10.3969/j.issn.1001-1463.2019.09.009
Abstract:The COBRA gene encodes the glycosylphosphatidylinositol anchoring protein, which is a regulator of secondary wall thickening and cellulose content. Flax fiber is bast fiber, and fiber yield is closely related to the content of cellulose in secondary wall and the thickening of secondary wall. Through BLASTP and Pfam analysis, 24 members of the COBRA family were identified in this study, and the gene structure, physicochemical properties of proteins, systematic evolution were conducted. The results showed that 22 members had transmembrane domain, 21 members had N-terminal signal peptide, 16 members had GPI anchor site, and all proteins had CCVS conserved domain and were located in cell membrane. The results of gene structure analysis and systematic evolution showed that the COBRA gene family was divided into two subfamilies, COBRA-I and COBRA-II, the gene structure of the two subfamilies were significantly different. This study laid a foundation for the in-depth study on the function of COBRA gene and the use of COBRA gene to increase the fiber yield.
Key words:Flax;Fiber;COBRA gene family;Sequence analysis;Phylogeny analysis
亞麻(Linum usitatissimum L.)是一年生自花授粉的植物,是亞麻科中唯一重要的農作物 [1 ]。亞麻根據其用途,分為油用、纖維用兩種,也有油纖兩用亞麻[2 ]。纖維亞麻株高可達到80~120 cm、分枝少、籽粒小,主要分布西歐、俄羅斯、中國[3 ]。亞麻纖維是紡織產品制造的原材料,中國亞麻纖維需求較大,而且是世界上最大的亞麻纖維出口國,黑龍江占亞麻纖維總產量的85%[4 ]。提高纖維產量是亞麻育種的主要目標之一,明確纖維合成及調控基因可以為纖維產量的提高提供理論基礎。
COBRA基因編碼糖基磷脂酰肌醇錨定蛋白(glycosyl-phosphatidyl inositol-anchored protein),一般具有N-端信號肽、碳水化合物結合模塊(CBM)、高度保守的中心半胱氨酸富集區(qū)(CCVS)以及將蛋白靶向內質網的C-端GPI錨定位點和疏水尾巴[5 ]。COBRA蛋白是細胞定向生長和纖維素結晶度的關鍵調節(jié)因子,其突變會導致細胞次生壁厚度和纖維素含降量低[6 - 7 ]。已經在擬南芥、番茄、水稻及玉米中分別鑒定到12、17、11、9個COBRA基因家族成員,擬南芥中COBRA家族分為2個亞家族[8 - 11 ]。我們利用生物信息學方法,在亞麻全基因組中對COBRA基因家族進行鑒定,并對其序列及系統進化進行分析,以期為深入研究COBRA家族各成員功能,進而提高亞麻纖維產量提供依據。
1 ? 材料與方法
1.1 ? 亞麻COBRA基因家族的鑒定
從NCBI數據庫中下載擬南芥COBRA基因家族各成員的蛋白序列。使用BlastP在亞麻全基因組蛋白數據庫中進行搜索,閾值小于等于1E-5,得到候選序列后用Pfam對結構域進行確認。
1.2 ? COBRA基因家族的序列分析
利用Expasy在線分析蛋白質的分子量、等電點,采用SignalP-5.0對亞麻COBRA蛋白進行N-端信號肽預測。使用big-PI分析蛋白的C端疏水末端錨定位點,用SOSUI在線預測跨膜結構域,用MEME分析 ? COBRA蛋白的保守基序,使用Plant-mPloc進行亞細胞定位預測。利用IBS繪制基因結構圖。
1.3 ? COBRA基因家族的進化分析
利用MEGA6.0軟件中的ClustalW,采用默認參數,對擬南芥和亞麻COBRA蛋白的氨基酸序列進行多重比對,比對結果采用NJ(Neighbor-Joining)法構建系統進化樹,Bootstrap校驗值為1 000次。
2 ? 結果與分析
2.1 ? 亞麻COBRA基因家族的鑒定
利用12條擬南芥COBRA基因氨基酸序列在亞麻全基因組進行BLASTP搜索,獲得亞麻COBRA蛋白的候選序列。用Pfam對候選序列進行注釋,最終確定亞麻基因組COBRA家族含有24個成員,均含有COBRA家族的特有結構域COBRA,命名為LuCOBL1~LuCOBL24(表1)。
2.2 ? 亞麻COBRA基因家族的序列和結構域特征
對亞麻COBRA基因家族進行系統進化分析,并對其外顯子-內含子結構進行分析(圖1,表1)。從進化樹可以看出,亞麻COBRA蛋白與擬南芥類似,也被分為2個亞家族(COBRA-I和COBRA-II)。COBRA-I有18個成員,包括LuCOBL-3、LuCOBL- 4、LuCOBL-6~LuCOBL-16、LuCOBL-20~Lu COBL-24,蛋白質長度為375~616 aa,大部分成員的氨基酸數量在400多個,外顯子數量為4~8個,內含子數量為3~7個;其中有14個基因均含有6個外顯子,5個內含子,說明同一亞家族的基因具有相似的基因結構;COBRA-II包含LuCOBL-1、LuCOBL- 2、LuCOBL-5、LuCOBL-17~LuCOBL-19共6個基因,蛋白質長度范圍在662~709 aa,外顯子數量2~3個;其中有4個基因均含有2個外顯子。從以上結果看出,亞麻COBRA-II亞家族的蛋白長度明顯大于 ? COBRA-I,但外顯子數量卻比較少,2個亞家族具有明顯的差異。
對亞麻24個COBRA蛋白的理化性質進行分析表明,不同亞家族之間,同一亞家族不同成員之間均有差異(表1)。分子量為41 648.89~77 575.57 Da,等電點為5.61~9.12,跨膜結構域為0~3,大部分蛋白含有2個跨膜結構域。信號肽預測結果表明,除COBRA-I亞家族的LuCOBL-8、LuCOBL-16和LuCOBL-3無N-端信號肽外,其余蛋白質均含有信號肽序列。COBRA-I亞家族除LuCOBL-9、LuCOBL-21、LuCOBL-22和LuCOBL-24外,其余成員都有GPI錨定位點,而COBRA-II只有2個成員具有GPI錨定位點(LuCOBRA-1和LuCOBRA-17)。對COBRA蛋白進行亞細胞定位預測,所有基因都定位在細胞膜。
亞麻COBRA蛋白多重序列比對結果表明,所有亞麻COBRA蛋白均具有保守結構域CCVS(圖2)。利用MEME對亞麻COBRA蛋白進行Motif預測,所有蛋白都具有Motif1、Motif3和Motif5,說明這3個Motif為COBRA家族的特征性Motif。此外,有23個基因含有Motif2,有17~20個基因含有Motif4、Motif6、Motif15、 Motif20,說明這些Motif在COBRA蛋白中也相當保守(圖3)。
2.3 ? 亞麻COBRA基因家族的系統進化分析
選擇模式植物擬南芥COBRA基因和亞麻COBRA基因,利用MEGA6.0以NJ法構建系統進化樹(圖4)。從進化樹上可以看出,亞麻和擬南芥的COBRA基因都被聚類在兩大支上,與單獨用亞麻蛋白序列構建進化樹的聚類結果一致。在COBRA-I亞家族中,AtCOBL4與LuCOBL7和LuCOBL20,AtCOB與LuCOBL10、LuCOBL13和LuCOBL15,AtCOBL3與LuCOBL6、LuCOBL11和LuCOBL24進化距離較近;在COBRA-I亞家族中,AtCOBL10、AtCOBL11與LuCOBL2和LuCOBL18,AtCOBL7、AtCOBL8、AtCOBL9與LuCOBL17和LuCOBL19遺傳距離比較相近。
3 ? 結論與討論
共鑒定到24個亞麻COBRA基因家族成員。對其基因及蛋白序列進行分析發(fā)現,所有蛋白都具有CCVS結構域,有21個蛋白含有N-端信號肽,22個蛋白含有跨膜結構域,16個蛋白具有GPI錨定位點,這符合COBRA蛋白的主要特征[5 ]。LuCOBL2、LuCOBL8、 LuCOBL16等基因編碼蛋白雖缺少信號肽或GPI錨定位點,但由于其含有COBRA家族特有結構域COBRA(PF0 4833.1012),親緣關系與其他成員又比較接近,所以將其作為亞麻COBRA基因。從亞麻COBRA基因家族整體分析結果看,亞麻COBRA基因分為2個亞家族,與擬南芥分類結果相同,同一亞家族的基因具有相似的基因結構,蛋白長度,不同亞家族之間差異明顯。
目前對COBRA基因家族的研究在擬南芥、水稻、番茄、玉米、楊樹等植物中有過報道,也研究過其中一些成員的功能[8 - 12 ],亞麻COBRA基因家族的研究尚未有報道,因此本研究對亞麻COBRA基因家族的鑒定及一系列生物信息學分析,為進一步挖掘各成員的功能奠定了基礎。然而,本研究只是初步鑒定了亞麻COBRA基因,對于無COBRA家族主要特征的個別成員需進行更深入的分析驗證,同時需要利用CRISPR/Cas9、過表達、反義RNA、遺傳轉化等技術對各成員的具體功能進行研究,以便更好的利用COBRA基因進行亞麻育種。
參考文獻:
[1] ZOHARY D. MONOPHYLETIC V S. Polyphyletic origin of the crops on which agriculture was founded in the near east[J]. ?Gen. Resour. Crop Evol.,1999(46):133-142.
[2] 張運暉,趙 ? 瑛,羅俊杰. ?甘肅胡麻產業(yè)發(fā)展淺議[J]. ?甘肅農業(yè)科技,2013(7):54-55.
[3] GREEN A G,CHEN Y,SINGH S P,et al. ?Flax. In Compendium of transgenic crop plants[D]. ?Oxford:BlackwellPublishing Ltd,2008:199-226.
[4] WU J,ZHAO Q,ZHANG L,et al. QTL mapping of fiber-related traits based on a high-density genetic map in flax (Linum usitatissimum L.)[J]. ?Front. Plant. Sci.,2018(9):885.
[5] BORNER G H,LILLEY K S,STEVENS T J,et al. Identification of glycosyl phosphatidylinositol-anchored proteins in Arabidopsis,a proteomic and genomic analysis[J]. Plant Physiol,2003(132):568-577.
[6] BROWN, D M, ZEEF L A H, ELLIS ?J, et al. Identification of novel genes in Arabidopsis involved in secondary cell wall formation using expression profiling and reverse genetics[J]. ?Plant Cell, 2005(17):2281-2295.
[7] SATO K,SUZUKI R,NISHIKUBO N,et al. Isolation of a novel cell wall architecture mutant of rice with defective Arabidopsis COBL4 ortholog BC1 required for regulated deposition of secondary cell wall components[J]. ?Planta,2010(232):257-270.
[8] ROUDIER F,SCHINDELMAN G,DESALLE R,et al. The COBRA family of putative GPI-anchored proteins in Arabidopsis a new fellowship in expansion[J]. Plant Physiol.,2002(130):538-548.
[9] CAO Y,TANG X F, GIOVANNONI J,et al. Functional characterization of a tomato COBRA-like gene functioning in fruit development and ripening[J]. BMC Plant Biol.,2012(12):211.
[10] DAI X X,YOU C J,WANG L,et al. Molecular characterization,expression pattern,and function analysis of the OsBC1L family in rice[J]. ?Plant Mol. Biol.,2009(71):469-48119.
[11] BRADY S M,SONG S,DHUGGA K S,et al. Combining expression and comparative evolutionary analysis. The COBRA gene family[J]. ?Plant Physiol.,2007(143):172-187.
[12] YE X,KANG B G,OSBURN L D,et al. The COBRA gene family in populus and gene expression invegetative organs and in response to hormones and environmental stresses[J]. ? Plant Growth Regul.,2009(58):211-223.
(本文責編:陳 ? ?珩)