彭宣翔,陳夏曄
(湖南省煙草公司 郴州市公司,湖南 郴州 423000)
木質素(lignin)是煙草細胞壁物質的主要成分之一,有益于維持煙草植株直立生長、抗病蟲等。木質素是復雜的苯丙烷單體聚合物,其3種主要組成單體為香豆醇、松柏醇和芥子醇。因單體不同,木質素可分為3種類型:S-木質素、G-木質素和H-木質素。咖啡酸-O-甲基轉移酶(COMT)催化咖啡酸與5-羥基阿魏酸甲基化分別生成阿魏酸與芥子酸,在木質素合成中參與S-木質素單體的合成[1-2]。在許多植物中,多個COMT基因已經被分離和鑒定,并且有多個基因在煙草中進行了功能研究[2-5]。如,綠竹COMT基因反向轉化煙草后,轉基因植株木質素含量下降28.7%[2];尾葉桉COMT基因轉化煙草成功改變了煙草植株的木質素單體組成[4]。但對煙草內源COMT基因的研究較為滯后,對煙草工業的發展不利。
木質素的存在增強了植物體的支撐能力,是植物適應陸生的重要標志之一。但其給植物細胞壁的利用帶來了諸多不便,如造紙工業需用化學試劑去除木質素,增加成本且污染環境[6-7]。在煙草中,木質素含量高,煙葉燃吸時產生較重的木質氣,降低了卷煙感官質量[8-12]。同時,木質素高溫熱解會產生較多的有害氣體,危害健康[8,12]。因此,通過基因工程手段調控煙草木質素生物合成的研究具有較大的潛在應用前景[13-14]。但目前國內對煙草內源COMT基因的研究尚未見報道。通過序列同源比對,在普通煙草基因組中鑒定了普通煙草的20個NtCOMT基因,并對其進行了序列分析、進化樹構建、蛋白性質分析和表達譜分析等,旨在為煙草木質素生物合成的分子調控提供參考,進而為給煙草工業提供低害煙葉奠定基礎。
從茄科作物基因組網站(https://solgenomics.net/)下載普通煙草基因組序列,從擬南芥基因組網站(http://www.arabidopsis.org/)下載擬南芥AtCOMT1(AT5G54160)基因序列。以AtCOMT1作為查詢序列,利用BLAST在煙草基因組數據庫中進行比對,參數E值設為0.001。以得到完整編碼區的基因序列作為候選NtCOMT基因,并以NtCOMT1、NtCOMT2、NtCOMT3……NtCOMT20依次對煙草NtCOMT基因進行命名。
依據序列編號在數據庫中下載其相應的基因組序列、編碼區序列和蛋白質序列,進一步進行序列結構分析和蛋白結構域預測等。利用序列分析在線工具GSDS 2.0(http://gsds.cbi.pku.edu.cn/)繪制基因結構圖;采用軟件Protparam(http://web.expasy.org/protparam/)預測煙草NtCOMT編碼蛋白的理化特性,如分子量和理論等電點等;利用MEME(http://meme-suite.org/tools/meme)和ProtComp 9.0(http://linux1.softberry.com)預測煙草NtCOMT蛋白的保守結構域和亞細胞定位;利用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)預測煙草NtCOMT蛋白是否含有跨膜結構域。所用軟件均為免費在線工具,在進行分析時,參數多采用默認值。
將煙草20個NtCOMT蛋白序列導入MEGA 6.0軟件,利用ClustalW程序對其進行多序列比對;輸出的多序列比對結果采用Neighbor-Joining方法構建系統進化樹,Bootstrap設為500。
從http://www.ncbi.nlm.nih.gov/sra/網址下載編號為SRP029184的普通煙草品種K326的轉錄組數據。利用TopHat2軟件提取與煙草NtCOMT基因相匹配的表達數據;相應的組織選擇根、幼苗期葉片、團棵期葉片、旺長期葉片、打頂后3天葉片和打頂后6 d葉片共6個。最后,利用Cluster 3.0和TreeView對表達數據進行可視化分析,繪圖。
由表1可見,多數NtCOMT蛋白約含360個氨基酸殘基,分子量在37~41 kDa,大小相當,其中NtCOMT14最小,僅含有201個氨基酸殘基,分子量22.59 kDa。NtCOMT蛋白等電點為5.41~7.77,其中,除NtCOMT8、NtCOMT10、NtCOMT11和NtCOMT14為弱堿性外,其余成員為弱酸性,蛋白表面凈電荷為負電荷。

表1 煙草NtCOMT的蛋白序列Table 1 Sequence of NtCOMT proteins in tobacco
由圖1可見,NtCOMT基因含有的外顯子數目為2~5個外顯子,其中50%的基因含有4個外顯子;各個基因內含子的數目和大小均差異較大,如NtCOMT8和NtCOMT17僅1個內含子,而NtCOMT10則含4個內含子;NtCOMT14基因的第1個內含子大小超過3 kbp,而NtCOMT19的第1個內含子僅37 bp。此外,基因結構的相似性與其同源性呈正相關。

圖1 煙草NtCOMT家族成員的基因結構Fig.1 Gene structure of the NtCOMT family in tobacco

圖2 煙草與擬南芥NtCOMT基因家族的系統進化樹Fig.2 Phylogenetic tree for NtCOMT family of tobacco and AtCOMT family of Arabidopsis thaliana
由圖2可見,NtCOMT1和NtCOMT2與AtCOMT1同源性最高,說明其可能具有相似的功能。相比于擬南芥,煙草含有數目較大的COMT基因家族,說明其木質素合成較擬南芥復雜。
亞細胞定位預測結果表明(表1),煙草NtCOMT蛋白約有1/2定位于細胞質,1/2定位于胞外。蛋白結構域預測分析發現,煙草NtCOMT蛋白結構高度保守,其中Motif1、Motif3、Motif4和Motif5最為保守(圖3)。從圖3還可看出,各成員保守結構域的位置排列相似,其中NtCOMT14在進化中丟失了部分結構域,發生了較大變異,可能已經進化成為假基因。

圖3 煙草NtCOMT蛋白結構域Fig.3 Protein domains of the NtCOMT proteins in tobacco
由圖4可知,NtCOMT1、NtCOMT2、NtCOMT4、NtCOMT5和NtCOMT19 5個基因在不同生長發育時期的煙葉中均有較高的表達量。部分基因只在某個發育時期高表達,如,NtCOMT3、NtCOMT11和NtCOMT12僅在團棵期葉片中高表達;NtCOMT13在打頂后葉片中高表達。其余11個基因在煙葉中表達量低,說明其在煙草葉片木質素的生物合成中不發揮作用。此外,有10個NtCOMT基因在根中有較高的表達水平。

圖4 煙草NtCOMT基因在不同時期K326葉片的表達Fig.4 Expression pattern of NtCOMTs in K326 leaves of different stages in tobacco
煙草木質素是煙氣有害成分的主要來源之一。相對于其他植物,對煙草內源COMT基因的功能研究較為滯后。本研究在普通煙草K326基因組中鑒定了20個NtCOMT家族基因,并對其基因結構、進化關系、蛋白保守結構域和基因表達情況等進行分析。蛋白質的結構決定其功能。對蛋白家族保守結構進行預測,有利于分析保守結構域甚至保守氨基酸殘基在進化過程中的重要作用。保守結構分析和進化分析表明煙草NtCOMT家族結構較為保守,說明這些保守的序列和高級結構的生物學功能非常重要。一些結構域丟失的基因可能進化成假基因而失去了功能。這有待于進一步對基因功能開展研究。研究認為,植物細胞在胞質中合成木質素單體,然后經過囊泡運輸到達細胞壁并進一步聚合堆積成木質素[15-16]。擬南芥AtCOMT1蛋白定位于細胞質。推測定位于細胞質的NtCOMT蛋白可能參與木質素單體的合成,而定位于胞外的NtCOMT蛋白可能參與胞外木質素聚合或其他修飾過程。
煙草是收獲和使用煙葉的經濟作物。因此,對NtCOMT家族基因在不同發育階段的煙葉中進行了表達分析發現,有9個基因在幼苗期、團棵期、旺長期煙葉或打頂后煙葉中具有較高的表達量。這些葉片高表達的基因可能參與了煙葉細胞壁中木質素的合成。因此,開展這些基因的功能研究,可為分子水平改良煙葉提供參考。值得注意的是,大部分在煙葉中高表達的NtCOMT基因在根中也具有較高的表達量。因此,通過調控這些基因降低煙葉木質素含量存在一定的風險,因為在降低葉片木質素含量的同時,可能影響煙草植株的正常生長發育。解決方案之一是優先針對只在葉片中高表達的基因如NtCOMT11、NtCOMT12和NtCOMT13進行功能缺失研究。
木質素為煙草生長發育所必須,但對煙葉品質有較大影響。木質素含量高,煙葉燃吸時會產生較重的木質氣,降低卷煙感官質量[8-12]。同時,木質素高溫熱解還會產生較多的有害氣體,危害消費者的身體健康[8,12]。因此,通過基因工程手段降低煙草木質素含量具有較大的潛在應用前景[13-14,17]。本研究鑒定了普通煙草的20個NtCOMT家族基因,并對其表達模式進行了初步分析,找到了煙草葉片特異高表達的基因,對煙草木質素含量的分子調控研究具有重要參考價值。