趙若男,玉萬國,陳振林,宋慕波,劉英健*
1. 賀州學院食品科學與工程技術研究院,廣西賀州 542899;2. 廣西科技大學生物與化學工程學院,廣西柳州 545616
荸薺(Eleocharis dulcis)也稱馬蹄,是禾本目莎草科荸薺屬的一種淺水植物[1]。作為中國特色水生蔬菜,荸薺在廣西、福建、海南等地均有大面積種植[2]。荸薺的球莖與蓮藕的根莖、馬鈴薯的塊莖、洋蔥的鱗莖等都屬于地下變態莖[3]。膨大的荸薺球莖可供食用,口感清脆、汁多味甜,富含碳水化合物、蛋白質、維生素等多種營養物質,具有很高的營養價值[1,4]。荸薺球莖的膨大過程是一個復雜的發育過程,需要經歷4個階段[5]。球莖膨大的第一個階段是匍匐莖階段,此階段球莖頂端開始膨大,淀粉積累較少;之后是膨大初期,此時球莖開始生長,淀粉逐漸積累;接下來是膨大中期,球莖生長速度減緩;最后是膨大后期,此階段球莖生長速度又加快,淀粉快速積累[6-8]。球莖的發育直接關系到荸薺的產量。因此,開展荸薺球莖膨大的分子機理研究對優化荸薺育種有重要意義。
近期研究中發現CONSTANS-Like(COL)基因家族成員可能在變態莖發育過程中起主要的調控作用。COL屬于鋅指蛋白轉錄因子家族,已知其家族成員在植物生長發育過程中扮演重要角色[9-10]。COL基因包含2~3個保守結構域,靠近N端有1個或者2個B-box Zinc finger結構域,另外一個是靠近C端的由約43個氨基酸組成的CCT保守結構域[5,11]。目前,COL基因家族已經在許多物種中相繼報道。在擬南芥中發現了17個COL基因家族成員[12],在水稻(Oryza sativa)中至少有16個[13],大麥(Hordeum vulgare)中有9個[13],煙草(Nicotiana tabacum)中有15個[14],杜仲(Eucommia ulmoides)有8個COL基因[9]。以往研究發現,COL基因家族不同成員的功能各不相同。在擬南芥中的一系列研究發現,AtCOL4通過脫落酸依賴性信號參與植物非生物脅迫反應,增強植物的耐受性[15]。過表達AtCOL9可以延遲擬南芥開花[16]。AtCOL3是側根發育和形成的正調控因子,另外在短日光條件下,抑制芽的伸長,促進分支芽的形成[17]。AtCOL7在擬南芥分支形成和下胚軸的伸長中發揮重要作用[18]。煙草中有3個COL基因在低溫環境中表現出較大的差異,NtCOL13b在葉片中有較高的表達量,而NtCOL16c和NtCOL16d剛好相反[14]。最近研究發現,COL基因在植物貯藏器官發育中扮演著重要角色。蓮藕NnCOL5基因參與根莖的膨大,尤其在根莖膨大中期(S3時期)表達量最高,并且在馬鈴薯中過表達NnCOL5可明顯促進塊莖單薯重和淀粉顯著升高[19]。通過反義基因技術證實馬鈴薯(Solanum tuberosum)中的1個COL家族成員在塊莖膨大發育過程中起負調控作用[20]。雖然在部分植物變態莖的發育過程中證實了COL基因的重要作用,但荸薺球莖中僅對淀粉合成過程中關鍵酶編碼基因進行了克隆[21-24],膨大過程中COL基因的作用尚未有相關研究。
鑒于此,本研究從前期轉錄組數據中篩選并克隆荸薺球莖膨大相關COL基因,并對該基因序列進行生物信息學分析,同時利用熒光定量PCR分析該基因在球莖膨大過程中以及在不同組織中的表達模式。為進一步研究COL家族基因在荸薺膨大這一過程的分子機制和基因功能研究提供理論參考。
供試材料選取廣西地方品種桂林荸薺,采自廣西賀州市八步區荸薺種植田,根據荸薺球莖不同發育時期(S1~S4時期,球莖最寬處直徑分別約為10、20、35、50 mm)進行取樣。同時采集球莖膨大后期的根、葉片、荸薺皮和荸薺肉樣品。液氮速凍于-80 ℃超低溫冰箱備用。植物RNA提取試劑盒購自華越洋生物科技(北京)有限公司;植物基因組DNA提取試劑盒、DNA凝膠回收試劑盒購自天根生化科技(北京)有限公司;反轉錄試劑盒、載體PMD18-T、DH5α大腸桿菌感受態均購自TaKaRa公司。
1.2.1 荸薺基因組DNA、總RNA和cDNA的合成 從-80 ℃超低溫冰箱中取出步驟1.1所儲存的樣品,按照植物基因組DNA提取試劑盒的使用說明書分別進行荸薺樣品DNA、總RNA的提取。用超微量紫外分光光度計檢測總RNA的純度和含量。對合格的RNA進行反轉錄從而獲得cDNA第一鏈,-20 ℃儲存。
1.2.2 荸薺COL5基因的克隆 前期取荸薺葉、莖、根和球莖不同膨大時期的組織采用Pacbio平臺進行全長轉錄組測序(Pacbio full-length cDNA sequencing),測序共獲得154 398個轉錄本序列信息。在此荸薺轉錄組中篩選得到的CwCOL5基因序列信息設計引物(CwCOL5-F:5′-ATGGGAATAGAAAAAGGAGCCAAGT-3′,CwCOL5- R:5′-TCAAAATGTCGGCACCACACTGTAC-3′)。
分別以荸薺球莖組織的DNA、cDNA為模板進行PCR擴增,具體反應體系及反應程序見表1和表2。通過1%瓊脂糖凝膠電泳對擴增產物進行檢測,切膠,使用DNA凝膠回收試劑盒進行純化回收,將回收產物連接至PMD18-T載體后轉入DN5α大腸桿菌感受態細胞中,經過菌液PCR后,挑選陽性克隆進行送測。
表2 PCR擴增反應程序Tab. 2 PCR amplification reaction procedure
1.2.3 荸薺COL5基因生物信息學分析 生物信息學分析參考董偉清等[24]和宋慕波等[25]的方法進行。利用ORF finder、BLASTN、BLASTP、DNAMAN、ProtParam Tool、ExPaSy-SOPMA、SWISS-MODEL、SignalP 4.1 Server、Conserved Domains、TMHMM Server v.2.0以及NetPhos 2.0 Server軟件進行生物信息學分析;利用ClustaW 1.83和Mega 5軟件構建系統進化樹。
1.2.4 荸薺COL5基因實時熒光定量PCR(RT-qPCR)分析 依據獲得的CwCOL5基因序列設計熒光定量引物(CwCOL5-F: 5′-ACGCTAAGTCTGGCTATAGCTCTCT-3′,CwCOL5-R: (5′-AT GCATAGCGGATTGTCTTCTC-3′),該引物位于COL家族序列保守度低的區域,以避免該家族其它成員的干擾。以荸薺不同膨大時期(S1~S4時期)和不同組織(荸薺皮、荸薺根、荸薺肉和荸薺葉片)的cDNA為模板,以18s rRNA(登錄號:MG742686)為內參,進行RT-qPCR擴增。測定方法參考何芳練等[22]的方法進行,采用2-ΔΔCT法計算相對表達量。
采用Microsoft Office 2019軟件進行數據處理和分析,使用Origin 2018和Adobe Photoshop 2021軟件進行圖片處理及美化。
在荸薺轉錄組數據庫中篩選被注釋為COL家族成員的轉錄本片段,其中編號為isoform_7928的轉錄本預測蛋白與同為莎草科的蒿草(Carex littledalei)COL家族成員同源性高達87%。在NCBI中的序列比對結果顯示,該基因片段與其他物種的COL基因核苷酸序列同源性較高,其中與油棕(Elaeis guineensis)和生姜(Zingiber officinale)的核苷酸同源性分別為78.82%、77.97%。以該片段設計特異性引物,分別以荸薺球莖組織的DNA、cDNA為模板,通過PCR擴增克隆分別得到長度約為1000 bp和1200 bp的片段(圖1)。經回收測序結果表明,以cDNA為模板擴增得到的cDNA片段長為1017 bp,編碼338個氨基酸(圖2),將其命名為CwCOL5,登錄號為ON934922。以荸薺基因組DNA為模板擴增得到的DNA片段長為1275 bp,其含有1個長度為257 bp的內含子(圖3)。
圖1 CwCOL5基因PCR擴增產物電泳圖Fig. 1 Electrophoresis of PCR amplification products of CwCOL5 gene
圖2 CwCOL5基因ORF序列及其編碼的氨基酸序列Fig. 2 CwCOL5 gene ORF sequence and its encoded amino acid sequence
圖3 CwCOL5基因結構圖Fig. 3 Structure diagram of the CwCOL5 gene
2.2.1 CwCOL5蛋白理化性質分析 利用ExPaSy-SOPMA軟件對CwCOL5氨基酸序列的理化性質進行預測。結果表明,CwCOL5蛋白質由338個氨基酸組成,其中丙氨酸(Ala)和絲氨酸(Ser)占比最高,分別為9.8%和9.5%,其次是精氨酸(Arg),為8.3%,不含吡咯賴氨酸(Pyl)、曬半胱氨酸(Sec)。分子式為C1592H2515N477O508S17,總原子數5109,理論等電點為5.89,相對分子質量為37 010.39,有43個帶正電荷(Asp+Lys)的氨基酸殘基,有48個帶負電荷(Asp+Glu)的氨基酸殘基。親疏水性分析發現(圖4),CwCOL5蛋白質第218位氨基酸殘基疏水性最強(Score=1.467),第279位氨基酸殘基親水性最強(Score=-3.789),總平均親水值(GRAVY)為-0.462,不穩定系數為45.63,推測為親水性不穩定蛋白質。
2.2.2 CwCOL5蛋白質結構預測分析 利用Plant-mPLoc server在線軟件對CwCOL5蛋白質序列進行亞細胞定位分析,發現該蛋白定位于細胞核。對CwCOL5蛋白質進行磷酸化位點預測,結果發現,該蛋白有31個磷酸化位點,絲氨酸(Ser)23個,蘇氨酸(Thr)5個,酪氨酸(Tyr)3個,其中第292位絲氨酸預測得分最高,為0.996。利用SignalP 4.1 Server軟件預測蛋白質信號肽,并利用TMHMM Server v.2.0軟件預測蛋白質跨膜結構。結果顯示,CwCOL5編碼的蛋白質無信號肽,且不含跨膜結構域。
CwCOL5蛋白質的二級結構顯示,該蛋白具有113個(33.43%)α-螺旋、13個(3.85%)β-折疊、178個(52.66%)無規則卷曲和34個(10.06%)延伸鏈。使用Swiss-Model軟件對CwCOL5蛋白的三級結構進行同源建模,以系統自動匹配度最高的7wsj.2.A為參考建模時發現,其三級結構模型中無規則卷曲所占比例最高,與二級結構預測結果一致。
2.2.3 CwCOL5保守結構域分析 將CwCOL5基因編碼的蛋白氨基酸序列提交至Pfam網站在NCBI進行蛋白結構域預測,結果發現(圖5),CwCOL5編碼的蛋白序列有2個高度保守的B-box Zinc finger和1個CCT結構域。從結構域位置來分析,CCT結構域位于CwCOL5蛋白的C端,基序長為43個氨基酸,2個B-box Zinc finger位于N端且緊密相鄰。
圖5 CwCOL5蛋白結構域預測Fig. 5 CwCOL5 protein domain prediction
2.2.4 多序列比對分析和系統進化樹構建 使用GENEDOC對CwCOL5蛋白質序列同在NCBI數據庫中下載的19個其他植物COL蛋白質序列進行多序列比對分析(圖6)。結果中黑色部分表示蛋白序列同源性最高,其次是深灰色、淺灰色。荸薺COL5與其他植物同源蛋白氨基酸有較高的一致性,在C端和N端的序列都相對保守。采用MEGA 5.0軟件中的Neighbor-Joining法構建CwCOL5氨基酸序列與擬南芥、煙草、番茄(Solanum lycopersicum)、高粱(Sorghum bicolor)、小米(Setaria italica)、大麥等19個物種COL氨基酸序列的系統進化樹(圖7),結果發現,依據擬南芥COL蛋白可以分為2個不同的分支,其中荸薺CwCOL5蛋白與ATCOL5等物種COL蛋白親緣關系較近。
圖6 CwCOL5氨基酸序列比對Fig. 6 CwCOL5 amino acid sequence alignment
圖7 CwCOL5蛋白系統發育進化樹Fig. 7 CwCOL5 protein phylogenetic evolutionary tree
為了解CwCOL5基因在荸薺球莖膨大4個時期的表達情況,根據序列結果設計引物進行RT-qPCR檢測,結果顯示,CwCOL5基因S4時期的表達量顯著低于S1、S2、S3時期(P<0.05),S3時期的表達量最高(圖8)。
圖8 CwCOL5基因在荸薺球莖膨大過程中的表達分析Fig. 8 Expression analysis of CwCOL5 gene during corm enlargement in Chinese water-chestnut
由圖9可知,CwCOL5基因在荸薺肉、根、葉片和荸薺皮中均有并表達,其中,在葉片和荸薺皮中的表達非常顯著且表達水平相當(P<0.05),在荸薺肉和根部位表達水平相當。
圖9 CwCOL5基因在荸薺不同組織中的表達Fig. 9 Expression of CwCOL5 gene in different tissues of Chinese water-chestnut
荸薺在我國長江流域以及廣西、廣東等南方各?。▍^)都有大面積種植,被廣泛用于食品、醫藥等領域,具有較高的營養價值、生態價值和經濟價值[1,4]。研究發現COL(CONSTANS-Like)基因是植物儲存器官發育的重要調控基因[26-27]。然而,荸薺球莖作為一種典型的貯藏器官和變態莖,其球莖膨大調控機制的相關研究較少。本研究克隆得到可能參與荸薺球莖膨大調控的CwCOL5基因,該序列ORF長度為1017 bp,可編碼338個氨基酸,其DNA序列長1275 bp,包含1個內含子。CwCOL5基因結構特征以及長度均與蓮藕COL5和馬鈴薯COL相似[20,28]。
目前研究認為CO-FT通路在植物變態莖發育的調控中起重要作用,而在該通路中COL基因家族扮演重要角色[29-30]。在擬南芥中,COL基因家族蛋白根據其結構可分為3組,第I組包含2個B-box結構域和1個CCT結構域;第II組只包含1個B-box域和1個CCT域;而第III組包含1個B-box結構域、1個次級鋅指蛋白結構域和1個CCT結構域[13,19,25]。CwCOL5與擬南芥COL基因家族第I組的結構相同。馬鈴薯COL蛋白包含2個B-box結構域和1個CCT結構域,也屬于第I組[20]。COL蛋白在許多植物中參與光信號的感受與轉導進而影響植物開花,例如過表達AtCOL5時,FT、SOC1相關開花基因表達上調,從而導致擬南芥可以在短時間內開花[31]。然而,有研究表明COL在馬鈴薯和蓮藕中參與了馬鈴薯塊莖膨大以及淀粉含量積累的調控[19]。因此,本課題組推測與AtCOL5和NnCOL5近緣的CwCOL5可能參與荸薺球莖的發育調控。
CwCOL5在荸薺不同組織和球莖不同發育階段均有明顯表達,CwCOL5在荸薺葉片和荸薺皮中表達量較高,在荸薺果肉中的表達量相對較低。馬鈴薯COL基因在葉片中的表達高于其他組織[32],水稻、大豆、楊樹中的COL基因作用的主要部位也是在葉片[30,33-34],本研究發現CwCOL5的表達模式與上述結果大體一致。在球莖發育過程中CwCOL5在球莖膨大前期表達量快速上升,而在膨大后期顯著下調,這一表達模式與馬鈴薯StCOL、蓮藕NnCOL5相似[19,31]?;谏鲜鼋Y果,推測CwCOL5可能參與了荸薺球莖膨大過程,但球莖膨大過程存在復雜的調控機制,CwCOL5與CO-FT途徑其它關鍵基因如FKF1、CDF1和SP6A等的相互影響有待進一步研究。